各地车市: 广州 | 北京 | 镇江 | 苏州 | 南京 | 新疆 | 厦门 | 广西 | 天津 | 深圳 | 佛山 | 杭州 | 上海 | 合肥 | 河南 | 河北 | 太原 | 昆山 | 昆明 | 武汉 | 兰州 | 沈阳 | 西安 | 大连 | 福建 | 全国车市入口>>
位置: 汽车资讯报->国内新车->英伟达CUDA10终于开放下载了

英伟达CUDA10终于开放下载了

栗子 发自 凹非寺量子位 出品 | 公众号 QbitAI英伟达的CUDA 10工具包,终于可以下载了。与9字头的前辈相比,10.0是第一次为图灵GPU定制的版本。英伟达新近发...

栗子 发自 凹非寺

量子位 出品 | 公众号 QbitAI

英伟达的CUDA 10工具包,终于可以下载了。

与9字头的前辈相比,10.0是第一次为图灵GPU定制的版本。

英伟达新近发布的GeForce RTX 20系列和Quadro RTX系列显卡,以及新一代GPU Tesla T4,都是基于图灵架构。

官网的评价是,要编写GPU加速的应用程序,CUDA 10是最强大的开发平台

10.0是重大更新

CUDA工具包,都是为开发GPU加速的应用程序而存在。

而针对图灵GPU定制的10.0,主要发生了以下变化:


图灵架构

10.0支持图灵架构,包括最新的Tesla T4 GPU(适用于超大规模的数据中心等等) 。


CUDA平台

CUDA Graphs,是新的异步任务图像 (Task-Graph) 编程模型,让内核启动和执行更高效。

另外,CUDA和图形API之间的互操作性 (Interoperability) 增强了。

CUDA库

许多库的性能得到了优化。比如,做快速傅里叶变换(FFT)、线性代数以及矩阵乘法用的那些库。


开发者工具

增加了Nsight系列产品,用来追踪、分析、Debug。


操作系统

除此之外,CUDA 10支持的操作系统编译器,也比以前更多了。

操作系统:

编译器:

CUDA库性能大幅提升


cuFFT 10.0

做快速傅里叶变换 (FFT) 的库,16 GPU时最高可以达到17 teraFlops(3D FFT, size 1024) 。


cuBLAS 10.0

做矩阵运算的库,包含了图灵优化的混合精度 (Mixed-Precision) 。做矩阵乘法 (GEMM) 时,最高可以达到90 teraFlops


cuSOLVER 10.0

线性代数用的库,在对称的特征值求解 (eigensolver) 中,速度最多提升4倍

下载,下载

9月27日,在SIGGRAPH大会上正式发布的一个多月之后,CUDA 10的下载入口姗姗来迟。

英伟达发了一篇超长博客,事无巨细地描述了这次进化。

GPU应用开发者的各位,请速前去下载。

下载传送门:

https://developer.nvidia.com/cuda-downloads

博客传送门:

https://devblogs.nvidia.com/cuda-10-features-revealed/

加入社群

量子位AI社群28群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。





今天刊登了《英伟达CUDA10终于开放下载了》一文


此事更多最新报道请微信扫描二维码

热门推荐

搭载骁龙845处理器,跑分29万排名第一,如今无人问津

华为及荣耀4款机型获AndroidPie内测推送

最畅销的锤子手机,如今降至冰点价,比vivo更划算!

喝我,就现在大咖荐品

今年的iPhoneXS会“凉凉”吗?果粉评价:5分钟就烫了!

可以运载小型火箭全球最大飞机将于2019年升空

人民币贬值创一年来新低,用数据看电子产业界的情况

3分钟了解显卡选购简要法则!如何选择购买显卡?这几点坑不要入
凯迪拉克XTS 普拉多 卡罗拉 普锐斯 丰田RAV4 宝马3系 宝马5系 宝马X1 标致408 标致307 凯越 昂科拉
返回汽车中国首页