主页 > T宅生活 >华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA >

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA

继发布鸿蒙系统之后,华为再一次展示了其前沿 AI 领域的技术能力。

8 月 23 日,採用华为自研达文西架构的 AI 处理器昇腾 910(Ascend 910)宣布商用,与其一同面世的还有配套的全栈全场景 AI 运算框架 MindSpore。

实测结果显示,昇腾 910 的半精度(FP16)运算力达到 256 Tera-FLOPS,整数精度(NT8)运算力达到 512 Tera-OPS,且晶片最大功耗仅为 310W,比此前设计规格的 350W 更低。

用华为轮值董事长徐直军的话来说,昇腾 910 作为运算力最强的 AI 处理器当之无愧。

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA 机器运算力每 3.5 个月翻一倍,比摩尔定律还快

昇腾 910 属于 Ascend-max 系列,是华为首款採用达文西架构的 AI 晶片,基于 7nm 增强版 EUV 工艺,其 AI 核集成了 3D 立方体运算引擎,可以在短时间完成 4096 的乘加运算。

其实它的相关技术规格在去年 10 月的华为全联接大会上就已公布,当时的半精度(FP16)256 TFLOPS 运算力,相比辉达(NVIDIA)的 V100 GPU 的 125 Tera FLOPS 还要高一倍。因此格外受外界关注。

目前华为已将昇腾 910 应用于实际的 AI 训练任务里。其中,在典型的 ResNet-50 网路训练中,昇腾 910 与 MindSpore 相配合,与现有主流训练单卡配合 TensorFlow 相比,性能提升近 2 倍。且每秒训练的图片数量从 965 张提升至 1802 张。

可以看到的是,随着数据和应用场景的不断增多,人工智慧领域对于晶片的运算力要求随之增加。来自第三方数据分析机构 OpenAI 近期数据表明,2012 年以来, 人们对运算力的需求增长六年超过 30 万倍,平均每 3.5 个月翻一倍,已经远超摩尔定律的发展速度 ——摩尔定律是每 18 个月翻一倍。

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA

人工智慧领域有三要素:数据、演算法和运算力。数据为晶片处理的对象,演算法即运算的边界,而运算力则直接决定了运算效率。对于华为来说,晶片是它们的硬实力,运算力即它在 AI 领域的竞争力。

除了超高的运算力之外,昇腾 910 还拥有高集成度和高速互连的特性。它集成了 CPU、DVPP 和任务管理器,因此它能独立完成 AI 训练流程。同时昇腾 910 集成了 HCCS、PCIe 和 RoCE 三种高速接口。其中最新的 PCle 吞吐量相比上一代翻了一倍。这些特性共同组成了运算力最强的昇腾 910 处理器。

至于昇腾 910 的价格问题,徐直军并未直接透露,而是笑道:「具体定价还未定,但肯定比辉达和 Google 低。」

直击 TensorFlow、PyTorch 达不到的「支援全栈全场景」

目前行业中已有 TensorFlow、Caffe 和 PyTorch 等主流 AI 框架,但它们都不支持全场景。这也是华为推出全栈全场景 AI 运算框架 MindSpore 的重要原因。

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA

在去年华为全联接大会上,华为提出:AI 框架不仅应该开发态友好、运行态高效,还要能适应每一个场景。

而此次徐直军表示:能否大大降低 AI 应用开发的门槛,能否实现 AI 将无处不在,能否在任何场景下确保用户隐私得到尊重和保护,这些都与 AI 运算框架息息相关。

因此 MindSpore 框架有着针对性的提升:

不同运行环境下,MindSpore 框架架构可大可小 ,适应全场景不同资源预算独立部署;框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而非数据本身,在保证用户隐私数据保护的前提下跨场景协同;将模型保护 Built-in 到 AI 框架中,模型安全可信。

光有全场景的框架还不够,徐直军宣布要把 MindSpore 在 2020 年 Q1 开源,像英伟达一样建立自己的生态。

核心程式码数量降低 20%,效率提升 50%

「生态很重要,MindSpore 框架的重点就是要建造和其他框架一样有生命力的生态。」徐直军在发布会现场表示。

AI 生态离不开开发者,为了让吸引并帮助开发者一同促进 AI 产业生态的发展。MindSpore 还实现了一个创新:AI 演算法即程式码,降低开发者的门槛,可以显着减少模型开发时间。

以一个 NLP(自然语言处理)典型网络为例,相比其他框架, 用 MindSpore 可降低核心程式码整体量 20%,效率整体提升 50% 以上 。

此外,徐直军表示华为拥有其它优势,如华为在智慧行终端上的 HiAI 引擎,可帮助开发者来开发基于终端产品的 AI 应用和服务;并且华为所拥有的运算力优势,与运算框架所实现的能力是其它框架无法比拟的。

接受採访时,徐直军还提到,MindSpore 不仅支持昇腾处理器,它也支持 GPU、CPU 等其它处理器。

在 MindSpore 的背后,是华为 AI 全栈战略的野心。即从端到边缘再到云,先有了底层的硬体,再有一套深度学习的框架,最后到上层应用使能。

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA

去年华为发布了 AI 全栈战略,而今天徐直军宣布全栈全场景 AI 解决方案已经完成了构建。这标誌着华为 AI 战略进入了新阶段。

「5G 只是小儿科,人工智慧才是大产业,才是华为发展的战略要地」

儘管华为 AI 战略刚发布一年,但当时发布的另一款高效运算低功耗 AI 处理器昇腾 310 早已商用,并在多场景下得到了广泛的应用。

华为云为昇腾 310 提供了图像分析类服务、OCR 服务、影片智慧分析服务等云端服务。对外提供 API 达 50 多个,日均调用量超一亿次,预计年底日均调用量超 3 亿次。超过 100 多个客户使用昇腾 310 开发定制 AI 演算法。

此外,华为还陆续发布了 Atlas 系列产品,被应用于安全防卫、金融、医疗、汽车等行业,有摄影机、无人机、机器人、MDC(Mobile Data Center)等产品形态。目前已在智慧交通、智慧电力等数十个行业里有落地解决方案。

昇腾 310 产品的应用,对于接下来昇腾晶片家族产品有着重要参考意义,而昇腾 910 仅仅是一个开始。

徐直军表示,面向未来,华为将持续投资,继续推进全栈全场景的 AI 解决方案,针对不同的场景,如边缘运算、自动驾驶车载运算、训练等场景,推出更多 AI 晶片。包括昇腾 320、昇腾 920 等晶片。

华为新 AI 晶片「昇腾 910」,效能超越 NVIDIA

值得一提的是,面向终端的昇腾 Tiny 系列会在即将发布的麒麟 990 上应用。

眼下 5G 虽然广受关注,但 AI 产业对于人类社会的发展意义更加重大。最近任正非签发的一封 Email 里,他表示 5G 只是小儿科,人工智慧才是大产业,才是华为发展的战略要地。

你一定还想读

性能完胜高通骁龙系列!华为 7 奈米晶片「麒麟 810」首次亮相

史上最大半导体晶片诞生!拥有 1.2 兆电晶体和 40 万核心,比最大的 GPU 还大 56.7 倍

华为最新晶片麒麟 810 完胜高通骁龙,背后是台积电 7 奈米製程惨电三星