admin管理员组

文章数量:1631198

阿里平头哥

布局行业4年之久,在经历了成立达摩院立项突破、资本并购等多轮铺垫之后,阿里巴巴正式宣布成立独立芯片公司并将其命名为平头哥半导体有限公司,旨在推进云端一体化的芯片布局。希望通过自研的强大的技术平台和生态系统整合能力,推动国产自主芯片的产业化落地。

3月25日,阿里平头哥在玄铁910处理器、计算存储一体化及AI硬件基准测试等方面的研究成果的三篇论文入选计算机体系结构顶会ISCA 2020,创国内芯片企业纪录。

ISCA是计算机体系结构领域的顶级学术会议,包括谷歌、英特尔、英伟达等企业在ISCA上发表的多项研究成果都已在半导体行业广泛应用。平头哥此次入选三篇论文(包括两篇合作论文),成为ISCA历史上论文入选最多的中国企业。

玄铁910处理器

其中一篇论文首次阐述了玄铁910的设计方法。玄铁910是平头哥发布的基于RISC-V的处理器IP核,开发者可以免费下载FPGA代码,开展芯片原型设计架构创新。

作为平头哥首款产品,玄铁910也是目前业界性能最强的RISC-V处理器。为解决RISC-V性能瓶颈,玄铁910率先将多发射乱序内存访问技术引入RISC-V架构,并通过自适应混合分支处理技术以及多通道、多模式数据预取技术大幅提升了指令及数据访问带宽。

第三方测试平台数据显示,玄铁910已达到业界主流商用高性能架构的水平。该论文团队表示,玄铁910不仅突破了RISC-V处理器的性能边界,也为RISC-V打开了新的应用场景,玄铁系列处理器已经实现了终端、边缘端及云端场景的全覆盖。

计算存储一体化

从2012年开始,AI训练所用的计算量呈现指数增长,平均每3.43个月便会翻倍,那就代表着从2012年到现在,计算量扩大了300,000倍,这已经触碰了传统冯诺依曼架构的天花板。

冯诺依曼瓶颈是冯诺依曼架构本身带来的一些限制。冯诺依曼架构的明显特征是将CPU与存储器分开,计算单元是从内存中读取数据,然后再将结果存回到内存。但这种架构在当初构建的时候,是假设CPU和内存速度接近,但后续的发展是CPU的性能提升速度远远超过了内存的性能提升,这就给两者之间制造了一道存储墙。

为突破AI算力瓶颈,平头哥提出了一种可解决存储墙问题的基于近存储体架构的可编程硬件和软件架构。

AI硬件基准测试

平头哥以及及与谷歌、微软、Facebook等科技公司联合研发的MLPerf推理基准0.5版本,这是目前业界主流的AI硬件性能测试平台。

MLPerf推理基准0.5版本其中包括5项内容,主要针对目前常见的应用,包括图像识别、物体检测及机器翻译项目。而且测试模拟的场景都与真实情况相关。其中单流检测评估如智能手机用户拍照,多流检测评估如检测障碍物的多摄像头气测系统。服务器场景针对在线请求,而离线检测针对批处理系统,主要测试系统的吞吐量。这套测试中还包括了一个负载生成器LoadGen,除了生成负载外,还要负责验证结果的准确性并计算最终的指标。

MLPerf Inference推理基准测试让GPU、AI芯片有了更加全面的测试。

点击查看往期内容回顾

梦幻显示器,国产屏幕OLED崛起

国产系统UOS与office完成适配后的使用亲测体验

长按二维码,关注我们

新睿云,让云服务触手可及

云主机|云存储|云数据库|云网络


本文标签: 三大研究成果芯片自主ISCA