AMD 跑深度学习

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 1840 天前的主题，其中的信息可能已经有所发展或是发生改变。

现在 AMD 跑深度学习咋样？支持 cuda 吗？

11 条回复 • 2020-06-02 10:35:21 +08:00

forrestshuang

2020-06-01 17:58:15 +08:00

cuda 是英伟达的，amd 只能 cpu 跑深度学习，和 NV 的 GPU 差距可能到百倍。
建议买一张二手的 1080Ti

mayx

2020-06-01 17:59:55 +08:00 via Android

可以用 OpenCL

raycool

2020-06-01 18:03:24 +08:00

是 AMD CPU 还是 GPU

coderluan

2020-06-01 18:07:42 +08:00

不支持 CUDA, 虽然 AMD 也有 OpenCL, 但是只有少部分框架支持, 还是有限的支持, 除非特殊情况, 是不建议买的.

misdake

2020-06-01 18:22:29 +08:00

TensorFlow 有 ROCm 的 port，好像两年前左右开始支持，现在到 tensorflow-rocm 2.1.1 。
tf 我没在 A 卡上用过哦不知道到底支持得怎么样。另外别的框架 lz 可以搜搜，tf 应该是跟得比较勤快的。

Hayek

2020-06-01 18:22:44 +08:00

@forrestshuang
@raycool
@coderluan
@mayx
请问下楼上的高手，amd 的 cpu 和 intel 的 cpu 跑机器学习差距大吗？

lvyuedong

2020-06-01 18:54:32 +08:00 via Android

amd 有 rocm，虽然支持很烂

lvyuedong

2020-06-01 18:55:24 +08:00 via Android

@Hayek 不大，都很慢跟 gpu 有数量级的差距

lithiumii

2020-06-01 19:37:23 +08:00 via Android

@Hayek 有个小坑：pandas 和 bumpy 默认的依赖 mkl 是英特尔的，amd 直接装的话调用 mkl 会有负优化，要指定用 OpenBLAS 或者用某些环境变量

lithiumii

2020-06-01 19:37:35 +08:00 via Android

@lithiumii *numpy

luyanaa

2020-06-02 10:35:21 +08:00

印象里面 Github 上面 ROCm 跑 ResNet50 的 benchmark 相对价格不算很难看，主要是受 AMD 每代产品定位的拖累（ Radeon VII 毕竟买的人实在太少，大多数人买的 Vega56/Vega64(GFX9 架构)或者 RX580(GFX8)说到底就是甜品卡，就算是平常的使用环境 RX580 也只能和 GTX1050Ti 或者 GTX1060 对比，Vega64 只能和 1070Ti 对比）。实际上我个人的统计（仅供参考，不保证完全控制变量，不保证实际使用体验，来源基本都是 Github 的 issue 和 lambdalabs 的测试数据） Resnet50 benchmark Vega64 比 1080Ti 慢 1/7，Radeon VII 甚至 ROCm2.7 能够接近 RTX2080Ti 的表现。但显然 ROCm 各方面的支持做的不好，新架构的支持偏慢（ RDNA 我印象里面似乎还只有 unofficial 的 port，只是填了基础的坑，离开箱可用还差一些），性能还得一点点鸡血上去（ Radeon VII 从 2.1.96 到 2.6 似乎 Image/sec 涨了快四分之一），等到满血了很可能下一代甚至下两代都已经出来了，而且动不动还有各种神奇的锅。（当然我以上的数据都只算了 ResNet50 的 Benchmark，因为这个 Benchmark 那个 issue 里测的最多，最方便进行有意义的统计，并不全面，但应该能反映一些问题）
知乎里面可能比较值得参考的几个帖子： https://www.zhihu.com/question/53091802/answer/890213654
https://zhuanlan.zhihu.com/p/80531243