深度阁 人工智能 阿里巴巴为什么要做芯片?官方答复来了

阿里巴巴为什么要做芯片?官方答复来了

这为后期开发其他芯片产品打下了基础。 值得注意的是,平头哥用最短的时间完成了含光800芯片的设计、流片整个过程,7个月完成前端设计,之后仅用3个月就成功流片。这说明平头哥构建的芯片…

摘要:含光800能助推人工智能视觉场景的落地和升级。

“阿里巴巴的第一颗自研芯片”“全球性能最强的AI芯片”……含光800刚问世,就顶着各种光鲜的头衔。

但芯片不同于终端消费产品,不能“拿来就用”“一看就懂”。而且一段时间以来,不同企业均发布了自己的芯片且其中不少都有“业界第一”“性能最佳”等称号。这是因为在人工智能领域,算力是基础保障。要提升计算效率,芯片需要根据场景来实现更多的差异化设计。含光800就是基于人工智能视觉场景而研发的一款芯片,在帮助人工智能“看得清”“看得准”“反应快”上,它可发挥独特的作用。

关于含光800以及阿里巴巴的芯片研发计划,解放日报·上观新闻记者整理了相关问题,并得到阿里巴巴的官方答复。

Q:含光800的核心优势是什么?能为企业带来什么价值?

A:在人工智能视觉场景中,含光800可以提供全球最强的算力。

阿里巴巴是全球最大的人工智能应用者之一,丰富的场景为研发人工智能芯片提供了绝佳平台,这是旗下芯片公司平头哥的天然优势。依托阿里巴巴集团丰富的应用场景,平头哥早期就针对场景做了大量优化,因此实现了含光800在性能上的突破。

而且,研发含光800不仅是为了满足阿里巴巴集团内部场景的需求,也会通过阿里云对外输出,帮助企业用更低的成本获取高性能算力,加速业务创新。例如,对于受限于算力瓶颈的企业而言,含光800可以更高效地运行更复杂、更先进的。

Q:能否通俗解释下含光800是如何加速人工智能计算的?

A:顾名思义,神经网络处理器(NPU)就是专门处理深度神经网络算法的芯片,深度神经网络就是一种模仿生物神经网络结构特点的计算机算法,最基本的特征就是模仿大脑神经元之间传递模式,并对输入的信息进行快速处理。

传统通用处理器基于冯诺依曼结构,其存储和运算处理是分离的;如果处理深度神经网络,需要大量读写运行操作,会受到带宽限制,因此效率较低。

而以含光800为代表的神经网络芯片,根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

Q:含光800是阿里巴巴的芯片公司平头哥研发的,平头哥主要做哪些工作?

A:过去一年,平头哥团队在不断探索芯片与场景的融合。阿里巴巴拥有丰富的人工智能应用场景,图像视频分析、搜索、推荐这些业务场景都需要AI专用芯片提供算力,而图像、视频对算力的需求量最大。所以,就有了专注于人工智能视觉的含光800。

人工智能的应用场景很丰富,所以平头哥也针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、框架、工具链等。这为后期开发其他芯片产品打下了基础。

值得注意的是,平头哥用最短的时间完成了含光800芯片的设计、流片整个过程,7个月完成前端设计,之后仅用3个月就成功流片。这说明平头哥构建的芯片软硬件技术栈发挥了作用。

未来,平头哥还会推出更多形态的人工智能芯片,在终端、云数据中心都会有更大规模的部署和应用。

Q:我们注意到,含光800是一款集合算法和芯片架构的产品,可以说创新了算法和芯片架构的协同。平头哥是如何考虑这一设计的?

A:事实上,平头哥研发芯片并非从零开始,而是基于阿里达摩院的算法以及阿里巴巴集团硬件基础设施多年技术沉淀。

由于人工智能芯片的差异化设计主要体现在硬件架构和软件算法上,二者需要高度适配才能发挥芯片的最大价值。从目前来看,传统CPU、GPU在深度学习推理任务上并没有完全发挥硬件能力,例如GPU架构主要针对图像处理设计,其硬件结构、软件生态几乎固化,因此对AI任务很难有深度优化。

含光800性能的突破得益于软硬件的协同创新。芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。

算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果,这些都为平头哥研发芯片提供了帮助。

协同算法和芯片架构的设计理念效果可以说是立竿见影的。例如,功耗是人工智能芯片行业通病,但平头哥的自研架构可大幅减少对内存的访问,在保证极致性能的情况下,把芯片功耗降到最低水平。

Q:我们注意到,在含光800的介绍中,提到了“流片”(记者注:指芯片试生产)。芯片流片的难点在哪?

A:芯片设计是一个复杂的系统工程,单纯完成设计并不意味着就可以流片成功,这是行业的深水区。假如流片失败,意味着硬件设计需要推倒重来,这比软件出BUG问题更加严重。一般芯片公司需要做两次(engineering sample、production sample)或多次才能流片成功。

流片成功后也不代表就可以直接商用。它还需要经过复杂的测试验证,在各项指标都符合实际场景需求后才到了真正的商用阶段。

但值得骄傲的是,含光800已经完成了整个流片过程,已应用于阿里巴巴集团内部各大场景。这背后主要得益于阿里软硬件的深厚积累以及丰富的验证场景。

Q:企业如何获取含光800的算力?

A:含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务已经正式上线,相比传统GPU算力,性价比提升100%。端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端含光800芯片协同。

平头哥致力于做普惠芯片,无剑SoC平台和玄铁处理器IP来帮助企业降低芯片设计门槛;含光800通过阿里云AI云服务的形式让企业随时随地可以享受高性能计算服务。

Q:我们注意到,在平头哥之前发布的产品中,还包括SoC芯片平台“无剑”。这不是一颗芯片,而是芯片设计平台。平头哥为何如此设计产品?

A:平头哥和绝大多数芯片商不同——成立的目的不是卖芯片,而是延续阿里巴巴“让天下没有难做生意”的愿景,希望用全新的商业模式为企业提供普惠算力。所以,目前平头哥已经拥有全栈芯片产品家族,涵盖终端处理器IP“玄铁”、终端芯片设计平台SoC“无剑”、云端AI芯片“含光800”等不同类型的产品。它们互相配合,构建了端云一体的芯片生态,能为企业提供普惠算力。

AIoT场景需要新的计算架构,需要安全、在线和智能等新的特性,所有芯片面临升级,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但AIoT市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难去适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

Q:阿里巴巴为什么要做芯片?

A:总体来说,芯片是计算力的核心。计算力是所有互联网应用的基础。研发芯片可以降低阿里巴巴经济体整体计算的成本,还可以以云服务的方式交付,以更高的性能和更低的成本赋能更多的企业。

阿里巴巴经济体横跨电商、金融、物流、云计算、大数据、全球化等场景,用户规模庞大,拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片。阿里巴巴坚持以技术创造新商业,于2017年成立达摩院,布局颠覆式技术创新研究,在芯片等关键领域做基础性技术的研究投入,能为未来发展提供更多战略可能。

Q:最后一个问题:阿里巴巴对芯片布局还有哪些战略思考?

A:阿里巴巴在芯片上的定位是:端上做芯片基础设施,云端为企业提供普惠算力。例如,处理器是所有高端系统芯片都需要的基础产品,AI芯片是人工智能场景最高效的算力单元,阿里巴巴将投入重金打造好这些技术,同时构建应用生态。

除此之外,平头哥还将继续开发操作系统,软硬件融合的算法,核心的IP等。把这些共性的技术能够做好做精做出竞争力,并形成生态,然后开放给我们的芯片设计产品,让他们基于高质量的基础设施打造芯片产品,有助于提升整体的产业竞争力。

本文来自网络,不代表深度阁立场,转载请注明出处:https://shenduge.cn/index.php/2019/09/25/723b31372c6e4258096f7e9ef3e14cc8/

作者: admin

广告位

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

0898-88881688

在线咨询: QQ交谈

邮箱: email@wangzhan.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部