小道消息:
AMD发布世界首款7nm数据中心GPU
发布日期:2018-11-08

 AMD发布世界首款7nm数据中心GPU——开创人工智能、云计算和高性能计算(HPC)新纪元

 

AMD Radeon Instinct™ MI60 MI50加速器具有超强计算性能、高速连接性、快速存储带宽,在全新的ROCm开放式软件平台上,满足深度学习、HPC、云端和渲染应用程序的苛刻要求


旧金山,加利福尼亚州。— 2018116— AMDNASDAQ: AMD)今天发布AMD Radeon Instinct™ MI60MI50加速器,作为世界首款7nm数据中心GPU,它旨在提供下一代深度学习、HPC、云计算和渲染应用程序所需的计算性能。研究人员、科学家和开发者利用 AMD Radeon Instinct™加速器解决困难问题和趣味性的挑战,比如大规模模拟、气候变化、计算生物学、疾病预防等。

 

AMD Radeon 技术事业部研发高级副总裁王启尚表示:传统的GPU架构限制了IT管理者处理不断变化需求和分析现代云数据中心工作负载数据集的效率,将顶级的性能和灵活的架构与强大的软件平台和业界领先的ROCm开放式软件生态系统相结合,全新的 AMD Radeon Instinct™加速器不管在今天还是未来,都成为解决云端计算挑战的重要组件。

 

 AMD Radeon Instinct™ MI60  MI50加速器具有灵活的混合精度能力,搭载高性能计算单元,能够处理多种类型的工作负载,包括一系列的HPC和深度学习应用程序。全新的 AMD Radeon Instinct™ MI60  MI50加速器,旨在高效地处理工作流,比如快速训练复杂的神经网络,为数据中心和部门部署提供更高级别的浮点性能,功能和高效性。

 

 AMD Radeon Instinct™ MI60  MI50加速器提供高速的浮点性能,并拥有HBM2(第二代高带宽显存),显存带宽速度高达1TB/s。同时,它们也是第一个能够支持下一代PCIe® 4.0互联的GPU,它们还支持 AMD Infinity Fabric™ Link GPU互联技术,允许 GPUGPU 之间通信,比传统的PCIe® Gen 3互联速度快6倍。

 

AMD另外还发布了用于加速计算的全新ROCm开放式软件平台,该平台支持新加速器的架构特性,包括具有优化性的深度学习操作(DLOPS)和 AMD Infinity Fabric™ Link GPU互联技术。ROCm 为规模化而设计,允许客户在开放式的环境中部署高性能、高能效的异构计算系统。

 

谷歌TensorFlow项目的工程总监, Rajat Monga表示:谷歌相信开源对每个人都有利,我们已经看到开源机器学习技术是多么有帮助,我们很高兴看到AMD接受它。通过ROCm开放式软件平台, TensorFlow用户将在GPU加速和强大的开源机器学习生态系统中受益。

 

 AMD Radeon Instinct™ MI60 MI50加速器,包括以下主要功能:

· 优化深度学习操作:支持灵活的混合精度FP16FP32性能和INT4/INT8,来满足动态和不断变化的工作负载需求,包括训练复杂的神经网络到对训练过的网络进行推理。

· 超高速的双精度 PCIe®2 加速器:AMD Radeon Instinct™ MI60 加速器是世界上大幅领先的双精度PCIe® 加速器,拥有高达7.4 TFLOPS 峰值 FP64性能,使科学家和研究人员高效地处理各种工业化的HPC应用程序,包括生命科学、能源、金融、汽车、航空航天、学术、政府、国防等。AMD Radeon Instinct™ MI50,拥有6.7 TFLOPS FP64 的峰值性能,能够在各种深度学习工作负载下,提供高效的解决方案,同时在虚拟桌面基础架构(VDI)、桌面即服务(DaaS)和云环境下高度重用。

· 高达6倍速数据传输:通过两个Infinity Fabric™ Link之间互联,每个GPU的对等带宽速度到达200GB/s,比单独的 PCIe 3.0 6倍,同时在hive配置里支持4GPU连接(8GPU的服务器装载2hive

· 高速的HBM2显存 AMD Radeon Instinct™ MI60HBM2纠错码(ECC)显存容量达到32 GB,而 Radeon Instinct™ MI50HBM2 ECC显存容量达到16 GB。两款显卡都支持全芯片ECC可靠性、可用性、可维修性(RAS)技术,这对于大规模的HPC部署和计算结果的准确性非常重要。

· 安全虚拟化工作负载支持  AMD MxGPU技术,业界独有基于硬件的GPU虚拟化解决方案,基于行业标准的SR-IOV(单根I/O虚拟化)技术,使黑客难以入侵到硬件级别,更有助于为虚拟化云端部署提供更好的安全性。

 

全新的ROCm开放式软件平台

AMD今天还发布了全新版本的ROCm开放式软件平台,旨在加速高性能和高效的异构计算系统的发展。另外还支持全新的Radeon Instinct™加速器,ROCm软件版本2.0为新的DLOPS更新了数学库;支持64Linux操作系统,包括 CentOSRHELUbuntu;优化了现有的组件;支持最新版本的深度学习框架,包括 TensorFlow 1.11PyTorch (Caffe2)和其他。了解更多ROCm 2.0软件,请点击

 

实用性

AMD Radeon Instinct™ MI60 加速器预计在2018年年底发货至数据中心客户。AMD Radeon Instinct™ MI50 加速器预计在2019年的第一季度末开始向数据中心客户发货。ROCm 2.0 开放式软件平台预计在2018年底正式发布。

支持资源

· 访问AMD Next Horizon event webpage获取活动资料

· 了解更多关于AMD Radeon Instinct™ MI60MI50加速器

· 了解更多AMD 7nm技术,请点击

· 了解更多ROCm 2.0开放式系统,请点击

· 了解更多ROCm & MIOpen Docker Hub请点击

· 关注AMD官方微信: AMDChina

· 关注AMD官方微博@AMD中国

 

 

关于AMD

在超过四十五年的历史中,AMD引领了高性能运算、图形,以及可视化技术方面的创新,这些都是游戏、临境感平台以及数据中心的基础。每时每刻,全球数百万的消费者、500强公司,以及尖端科学研究所都依靠AMD技术来改善他们的生活、工作以及娱乐。AMD全球员工致力于打造伟大的产品,努力拓宽技术的极限。成就今日,启迪未来。更多信息,敬请访问AMD公司(NASDAQAMD)官网www.amd.com.cn 关注AMD官方微信: AMDChina,关注AMD官方微博@AMD中国。

 


热点文章
1
显示核心升级更给力 AMD A10-6800K到货
AMD A10-6800K又进一步提升了处理器内置独显核心的图形处理性能。与此同时,处理器也全新升级成为Richland架构,提升性能的同时也进一步降低了整机的功耗和发热。
2
七夕在家看大片 装机就选AMD A8-5600K
AMD A8-5600K作为打桩机四核APU处理器,该处理器原生内置四颗物理核心,默认核心频率为3.6GHz,在Turbo Core支持下最高可达3.9GHz。
3
七夕送男友倍有面子 i7 4770仅2288元
Intel 酷睿i7 4770采用全新的Haswell架构,拥有更强劲的处理性能。酷睿i7-4770处理器采用22纳米工艺制程设计,其内置核芯显卡HD Graphics 4600。
4
人人都能玩四核 AMD 740合肥热卖433元
AMD速龙II X4 740处理器该处理器默认核心频率为3.2GHz,在AMD Turbo Core技术的支持下最高可达3.7GHz,较高的主频能够保证CPU在游戏过程中的流畅性与稳定性。
5
i5价钱i7性能! 攒机到底用不用至强E3?
如今喜欢攒机的网友越来越多,大部分人都通过DIY的方式来组装自己的电脑。互联网上关于DIY方面的技巧很多,我们可以根据网上的教程就可以轻松攒一台自己满意的机器。
推荐文章
1
七夕在家看大片 装机就选AMD A8-5600K
AMD A8-5600K作为打桩机四核APU处理器,该处理器原生内置四颗物理核心,默认核心频率为3.6GHz,在Turbo Core支持下最高可达3.9GHz。
2
显示核心升级更给力 AMD A10-6800K到货
AMD A10-6800K又进一步提升了处理器内置独显核心的图形处理性能。与此同时,处理器也全新升级成为Richland架构,提升性能的同时也进一步降低了整机的功耗和发热。
3
七夕送男友倍有面子 i7 4770仅2288元
Intel 酷睿i7 4770采用全新的Haswell架构,拥有更强劲的处理性能。酷睿i7-4770处理器采用22纳米工艺制程设计,其内置核芯显卡HD Graphics 4600。
4
人人都能玩四核 AMD 740合肥热卖433元
AMD速龙II X4 740处理器该处理器默认核心频率为3.2GHz,在AMD Turbo Core技术的支持下最高可达3.7GHz,较高的主频能够保证CPU在游戏过程中的流畅性与稳定性。
5
i5价钱i7性能! 攒机到底用不用至强E3?
如今喜欢攒机的网友越来越多,大部分人都通过DIY的方式来组装自己的电脑。互联网上关于DIY方面的技巧很多,我们可以根据网上的教程就可以轻松攒一台自己满意的机器。