• 新闻
  • 体育
  • 汽车
  • 房产
  • 旅游
  • 教育
  • 时尚
  • 科技
  • 财经
  • 娱乐
  • 更多
    母婴 健康 历史 军事 美食 文化 星座 专题 游戏 搞笑 动漫 宠物
  • 无障碍

首个Titan RTX深度学习评测结果出炉:2019年你该选择哪款GPU?

选自 Lambda

作者:Michael Balaban

机器之心编译

参与:李亚洲、李泽南

英伟达的新一代 GPU 旗舰 Titan RTX 用来跑深度学习速度如何?近日,AI 硬件供应商 Lambda Labs 对 Titan RTX,以及 RTX 2080 Ti 等常见 GPU 在各种深度学习训练任务上的训练速度进行了测试。

结果喜人,由于新一代的英伟达 GPU 使用了 12 纳米制程的图灵架构和 Tensor Core,在深度学习图像识别的训练上至少能比同级上代产品提升 30% 的性能,如果是半精度训练的话最多能到两倍。看起来,如果用来做深度学习训练的话,目前性价比最高的是 RTX 2080Ti 显卡(除非你必须要 11G 以上的显存)。

Lambda 借助 TensorFlow 对以下 GPU 进行了测试:

  • Titan RTX
  • RTX 2080 Ti
  • Tesla V100 (32 GB)
  • GTX 1080 Ti
  • Titan Xp
  • Titan V

注意,作者只对单 GPU 对常见神经网络的训练速度进行了测试。

结果总结

我们测试了在训练神经网络 ResNet50、ResNet152、Inception3、Inception4、VGG16、AlexNet 和 SSD 时,以下每个 GPU 每秒处理的图像数量。

在 FP 32 单精度训练上,Titan RTX 平均:

  • 比 RTX 2080Ti 快 8%;
  • 比 GTX 1080Ti 快 46.8%;
  • 比 Titan Xp 快 31.4%;
  • 比 Titan V 快 4%;
  • 比 Tesla V100(32 GB)慢 13.7%。

在 FP 16 半精度训练上,Titan RTX 平均:

  • 比 RTX 2080 Ti 快 21.4%;
  • 比 GTX 1080 Ti 快 209.7%;
  • 比 Titan Xp 快 192.1%;
  • 比 Titan V 慢 1.6%;t
  • 和 v100(32 GB)的对比还有待调整。

结论:2019 年最合适深度学习/机器学习的 GPU 是?

如果 11 GB 的 GPU 内存足够满足你的训练需求(能满足大部分人),RTX 2080 Ti 是最适合做机器学习/深度学习的 GPU。因为相比于 Titan RTX、Tesla V100、Titan V、GTX 1080 Ti 和 Titan Xp,2080Ti 有最高的性价比。

如果 11GB 的 GPU 内存满足不了你的训练需求,Titan RTX 是最适合做机器学习/深度学习的 GPU。但是,在下结论之前,试试在半精度(16 bit) 上的训练速度。损失一定的训练准确率,能有效地把 GPU 内存翻倍。如果在 FP16 半精度和 11GB 上的训练还是不够,那就选择 Titan RTX,否则就选择 RTX 2080 Ti。在半精度上,Titan RTX 能提供 48GB 的 GPU 内存。

如果不在乎价钱且需要用到 GPU 的所有内存,或者如果产品开发时间对你很重要,Tesla V100 是最适合做机器学习/深度学习的 GPU。

方法

  • 所有模型都是在一个综合数据集上训练的,从而把 GPU 的表现与 CPU 预处理的表现隔离开,且降低伪 I/O 瓶颈的影响。
  • 作者对每个 GPU/模型对进行了 10 组训练实验,然后取平均值。
  • 每个 GPU 的「归一化训练表现」均为在特定模型上每秒处理图像数量的表现与 1080Ti 在同样模型上每秒处理图像数量表现的比值。
  • Titan RTX、2080Ti、Titan V 和 V100 基准测试用到了 Tensor Cores。

硬件平台

测试中采用的硬件平台为 Lambda Dual 双 Titan RTX 桌面平台,包含英特尔 Core i9-7920X 处理器,64G 内存,看起来已经是最强台式电脑配置了。在测试时,Lambda 仅更换 GPU 配置。

Batch-sizes

系统软件环境

  • Ubuntu 18.04
  • TensorFlow: v1.11.0
  • CUDA: 10.0.130
  • cuDNN: 7.4.1
  • NVIDIA Driver: 415.25

初始结果

下表显示了在 FP32 模式(单精度)和 FP16 模式(半精度)下训练时每个 GPU 的初始性能。注意,数字表示的是每秒处理的图片数量,对数量进行了四舍五入。

FP32 - 每秒钟处理的图像数量

FP16 - 每秒钟处理的图像数量

自己运行基准测试

目前,Lambda Lab 的 GitHub 库中已经提供了所有基准测试的代码,你可以测试自己的机器了。

第一步:克隆基准测试的 Repo

git clone https://github.com/lambdal/ lambda-tensorflow-benchmark.git --recursive

第二步:运行基准测试

输入正确的 gpu_index (default 0) 和 num_iterations (default 10)

cd lambda-tensorflow-benchmark

./benchmark.sh gpu_index num_iterations

第三步:报告结果

  • 选择<cpu>-<gpu>.logs(generated by benchmark.sh) 目录;
  • 使用同样的 num_iterations 进行跑分和记录。

./report.sh <cpu>-<gpu>.logs num_iterations

原文链接:https://lambdalabs.com/blog/titan-rtx-tensorflow-benchmarks/

本文为机器之心编译,转载请联系本公众号获得授权。

声明: 本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。

阅读

购车信息

  • 日产Titan
    图片 | 参数 | 报价 | 口碑 | 文章 | 二手车
  • 北京4S店报价
    39.60-57.90万元 询底价

推荐阅读

加载更多...
已经到底了
机器之心Pro 搜狐号自媒体

相关车型

日产Titan

本市报价: 暂无

参数配置 看底价

视频

      24小时热文

      新能源车友群招募

      ×
      对比库 0 用户反馈 回到顶部
      ×
      选择品牌
      选择车型
        选择车款
          加入对比库
          • 车型对比
          • 车款对比
          选择两个车型/车款进行对比
          清空 开始对比

          哆哆女性网seo爱占工具胡宝宝起名大全名字大全兰州企业网站制作手工水饺品牌起名马可是商丘哪个县的人周易风水学习班周易 64卦连云港做网站优化王起什么名ui网站设计是什么跑男第五季成员名单我要当国王网站设计专业知识周易名人故事实事求是的例子周易免费测出起名字餐饮桌椅批发宁波宜家网站怎么样优化seo实战密码第四版天才名医营销线上推广方法黑客seo战地2狂狮怒吼麦迪打架算生辰八字起名虞城华康医院简洁的邮件签名站长必备seo工具算命和八字淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

          哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化