AI Chip（一）|电子爱好者

admin管理员组
文章数量:1590351

AI Chip

https://basicmi.github.io/AI-Chip/

A list of ICs and IPs for AI, Machine Learning and Deep Learning.

NN计算的硬件设计

NN计算问题的瓶颈主要包括两类：

1.数学运算的速度。NN运算主要以乘加为主，实现这类加速功能的硬件单元一般被称为NN Processor。这也是第一代AI芯片主要解决的问题。

再细分的话，又有矩阵派和卷积派两种。

矩阵派的通用性好，且FC运算速度快于卷积派。

而卷积派由于针对Conv的Kernel数据不变这一特点进行优化，Conv速度极快。

2.IO问题，也称带宽问题。早期的NN由于算子有限，基本只有FC、Conv、Pooling、Activation等少数几种算子。但现在的NN模型算子可就多了，且有相当部分算子属于非计算类的搬运数据算子，比如permute等。针对这类运算，一般采用被称作Tensor Processor的硬件单元进行加速。

DEEPHi

2018.8

深鉴科技是一家AI Chip公司。

官网：

http://www.deephi/

它最近出了一套深度学习SDK：

http://www.deephi/zh-cn/dnndk.html

如果说2017年以前的AI Chip领域，主要解决的是芯片有无的问题的话，那么2018年的重点就聚焦在如何更好的使用上了。

性能方面各家各有千秋，即使不考虑功耗、面积等约束，也没有哪家在所有运算上，都比别人快，因此产品只要不是全面落伍，就还有的混。但易用性方面差距就比较大了。

1.CPU+NN混合编程。深鉴这方面做的还不错，似乎一套工具链就可以搞定，就是不知道自动化程度如何。有的友商连这一步都没做好，两套工具链+手动链接，把应用工程师折腾惨了。

2.模型压缩。Pruning方面由于有韩神的加持，确然做的很好，比我司强。Quantization方面，INT8量化算是最基本的量化了，不知道UINT8/INT16，他们做的如何。

3.Tensor Processor。深鉴这方面似乎是空白，这导致的一个结果就是AI Chip支持的运算非常有限，CPU负载过高，而AI Chip的负载相对就不行了。

4.模型导入。这方面深鉴只能说还不入流。虽然表面看来，它支持了Caffe和Tensorflow。然而它的支持方案是修改源代码。。。众所周知，pb文件的易用性是建立在通信双方使用同一套协议的基础之上。但目前AI领域魔改成风，跑个开源模型，还必须要下载作者魔改版的Caffe。。。可以想见深鉴这方面的自动化程度一定不咋样，肯定有很多手工活要做。

那么正确的做法是什么呢？参见ONNX。我司的方案比ONNX略早，但思路基本一致。

5.Model Zoo。这个比较寒碜了，只有三个模型，而且还都是最简单的分类模型。不过从支持Inception v1来看，应该是掌握了加速分支网络的技巧。其他的Face Detection等只有视频，没有模型，似乎还处于实验室阶段，可能易用性还有待提升。

无耻的谈一下我司的Model Zoo。包含40+的模型，涵盖图像分类、目标检测、图像分割、人脸识别、超分辨率、OCR等。目前，主要往RNN、Attention方面发展。这里会遇到循环结构的问题，还没有做的太好。

目前的AI Chip战争，入局的玩家基本都解决了芯片有无的问题。体系结构的红利也吃的差不多了，在未来几年不大可能再保持目前的算力增速。因此，未来争夺的焦点将转向软件方面。实际上，今年以来，已经有客户拿友商产品性能来压我们。然而也就是压一下而已，让他弃用他肯定不干。原因无他，我司80%的功能都已经自动化，没人会和好用过不去。

TPU

Tensor Processing Unit(TPU)是Google推出的AI芯片系列。目前已经有3个版本：

TPU v1, deployed 2015, 92 teraops, inference only.

TPU v2, cloud TPU 2017, pod 2018, 180 teraflops, 64 GB HBM, training and inference, generally available. 11.5 petaflops in a pod.

TPU v3, cloud beta 2018, 420 teraflops, 128 GB HBM, training and inference, beta. >100 petaflops in a pod.

论文：

《In-Datacenter Performance Analysis of a Tensor Processing Unit》

Coral Dev Board

Coral Dev Board是Google于2019年3月推出的一款搭载TPU的嵌入式开发板。

参考：

http://linuxgizmos/google-launches-i-mx8m-dev-board-with-edge-tpu-ai-chip/

Google launches i.MX8M dev board with Edge TPU AI chip

脉动阵列

Systolic array是孔祥重和他的博士生Charles Leiserson于1978年发明的。

论文：

《Why systolic architectures?》

孔祥重（H. T. Kung/Kung, Hsiang-Tsung），1945年生。台湾国立清华大学本科（1968）+CMU博士（1974）。CMU、Harvard教授。台湾中央研究院院士、美国工程院院士。除了Systolic array之外，数据库领域的Optimistic concurrency control（乐观并发控制）也是他的贡献。
除了Charles Eric Leiserson之外，他的博士生还有Robert Tappan Morris，也就是著名的Morris Worm的作者。

参考：

http://web.cecs.pdx.edu/~mperkows/temp/May22/0020.Matrix-multiplication-systolic.pdf

矩阵乘法器原理

http://www.eecs.harvard.edu/~htk/publication/1980-introduction-to-vlsi-systems-kung-leiserson.pdf

Algorithms for VLSI Processor Arrays

https://zhuanlan.zhihu/p/26522315

脉动阵列-因Google TPU获得新生

http://www.sohu/a/142237570_505803

我们应该拥抱“脉动阵列”吗？

https://zhuanlan.zhihu/p/26882794

Google深度揭秘TPU

参考

https://mp.weixin.qq/s/1X9xiZkmVPI-j-aipr-ocg

AlphaGo Master最新架构和算法，谷歌云与TPU拆解

https://mp.weixin.qq/s/Yo0uKd1Mzy4mmS4r0mxfVw

有图有真相：深度拆解谷歌TPU3.0，新一代AI协同处理器

https://mp.weixin.qq/s/kPrZ0PuevXEJjVB7RXs70g

谷歌TPU率队，颠覆3350亿美元的半导体行业

https://mp.weixin.qq/s/wunqEHC6c-yUVXTl4yTG4w

仅需1/5成本：TPU是如何超越GPU，成为深度学习首选处理器的

https://mp.weixin.qq/s/vncPcczTyqglndeZAgjWfw

一文读懂：谷歌千元级Edge TPU为何如此之快？

https://www.nextplatform/2018/05/10/tearing-apart-googles-tpu-3-0-ai-coprocessor/

Tearing Apart Google’s TPU 3.0 AI Coprocessor

HBM

HBM==High Bandwidth Memory是一款新型的CPU/GPU内存芯片（即 “RAM”），其实就是将很多个DDR芯片堆叠在一起后和GPU封装在一起，实现大容量，高位宽的DDR组合阵列。

这是HBM的结构图。

这是HBM和GDDR5的对比图。

从上面两图可以看出，HBM的集成程度在die一级，介于PCB和chip之间。

HBM带宽是传统内存（DRAM）的4.5倍，因此更适合处理AI应用程序所需的大量数据。这种性能的提升是如此之大，以至于许多客户更愿意支付专用内存所需的更高价格(每GB大约25美元，标准内存大约8美元)。

参考：

https://zhuanlan.zhihu/p/33990592

HBM火了，它到底是什么？

https://zhuanlan.zhihu/p/34164501

HBM技术之显卡应用

行业信息

https://mp.weixin.qq/s/vGoWsyaal-gAzsrhPguvFg

深度解读：华为麒麟芯片是如何炼成的！

http://tieba.baidu/p/2250616047

史上最全桌面显卡天梯图

https://mp.weixin.qq/s/jGGGMDokN9akzbjRkvUOaA

NVIDIA GPU架构的变迁史

https://mp.weixin.qq/s/8RDHTn6P63otKXUdrHhbjw

一文看懂AI芯片产业生态及竞争格局

https://mp.weixin.qq/s/jINnom16KWiEKiug3N-f8g

一文看懂AI芯片：三大门派四大场景146亿美元大蛋糕

https://mp.weixin.qq/s/-FwuhibwwG6CFUcZXNBTFA

投资者梳理AI芯片产业，一文秒懂AI芯片生态！

https://zhuanlan.zhihu/p/28325678

零基础看懂全球AI芯片：详解“xPU”

https://mp.weixin.qq/s/Zng0NTR9P78lnR_vniiM8g

Chris Rowen: 分析全球334家真正的深度学习创业公司，盘点25家AI芯片创业公司

https://zhuanlan.zhihu/p/33462550

传统IP Vendor的AI加速器一览

https://mp.weixin.qq/s/IaCWZXQI8mYLJQXwDoNQcQ

自动驾驶芯片：GPU的现在和ASIC的未来

https://mp.weixin.qq/s/KjQ5BTGd92Y0Mqzk1A5JYg

老兵戴辉讲述海思视频监控芯片从0到1的血泪史！如何一步步成为行业霸主的

参考

https://zhuanlan.zhihu/p/58971347

深度学习的芯片加速器

https://cloud.tencent/community/article/244743

深度学习的异构加速技术（一）：AI需要一个多大的“心脏”？

https://cloud.tencent/community/article/581797

深度学习的异构加速技术（二）：螺狮壳里做道场

https://cloud.tencent/community/article/446425

深度学习的异构加速技术（三）：互联网巨头们“心水”这些AI计算平台

https://zhuanlan.zhihu/p/25382177

AI芯片怎么降功耗？

https://mp.weixin.qq/s/8HIZRhb-KJOtPnQtQ3GQVg

第一代芯片是CPU，第二代是GPU，第三代是什么？

https://mp.weixin.qq/s/qkpbKN62YV2f0W5HLnr7Dg

GPU是如何工作的？与CPU、DSP有什么区别？

https://mp.weixin.qq/s/Jof-u8oUuLR4v7t3jjXEmA

GPU和线下训练

https://mp.weixin.qq/s/2aE5fzGZeyX-oFyWbcbA5A

揭开神经网络加速器的神秘面纱之DianNao

https://mp.weixin.qq/s/VAFb0DAZAUyDnjE6SlNcXw

如何对比评价各种深度神经网络硬件？不妨给它们跑个分

https://mp.weixin.qq/s/zTO4UZ3zDLZL0GOjv0YqrQ

GPU加速深度学习

https://mp.weixin.qq/s/7vxJTh4IHeqUsc7IsLFLSA

解密哈萨比斯投资的IPU，他们要分英伟达一杯羹

https://zhuanlan.zhihu/p/26594188

浅析Yann LeCun提到的两款Dataflow Chip

https://zhuanlan.zhihu/p/25728988

AI芯片的几种选择，你更看好哪个？

https://zhuanlan.zhihu/p/25510056

ISSCC 2017看AI芯片的四大趋势

https://zhuanlan.zhihu/p/26404565

AI芯片四大流派论剑，中国能否弯道超车？

https://zhuanlan.zhihu/p/27472524

从AI芯片说起，一起来看芯片门类

https://mp.weixin.qq/s/Cy_vb0PpcvGTDmlMt1VkSw

从GPU、TPU到FPGA及其它：一文读懂神经网络硬件平台战局

https://mp.weixin.qq/s/RKRDBiBzG5u2P2eaqNAFbg

机器学习的处理器列表

https://mp.weixin.qq/s/bL1PoUjZ_sH2VKcBxI6N5A

Wave公司发布数据流处理架构DPU

https://mp.weixin.qq/s/1r7G84les7FihqPbSiS0Ng

华为首款手机端AI芯片麒麟970

https://mp.weixin.qq/s/y9dVg9YtfWxu6NcW-fxi6Q

内存带宽与计算能力，谁才是决定深度学习执行性能的关键？

https://mp.weixin.qq/s/K_dohaZbCISZlxe1Utu50w

如何用FPGA加速卷积神经网络(CNN)？

https://mp.weixin.qq/s/z68hk1yqg60QCjgTyzgG2w

GPU深度学习的“加速神器”

本文标签： AI CHIP

版权声明：本文标题：AI Chip（一）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1728088357a1144958.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

AI Chip（一）

AI Chip

NN计算的硬件设计

DEEPHi

TPU

Coral Dev Board

脉动阵列

参考

HBM

行业信息

参考

更多相关文章

【深度学习】AI一键换天

AI大模型-机器学习多场景实战

AI基于深度学习的代码搜索案例（一）

如何免费使用GPT-4o？国内AI大模型相比又怎样？汇总来了！

PS AI 安装教程

反转！2019程序员吸金榜来了，AI程序员刷爆了..

【AI小项目5】使用 KerasNLP 对 Gemma 模型进行 LoRA 微调

Practice Exam: Oracle Cloud Infrastructure Generative AI Professional

AI实战 | 使用元器打造浪漫仪式小管家

6款AI做图工具分享

技术前言 - AI相关公司简介

科大讯飞语音识别率从97%提升至98% 用AI赋能方言保护

XiaoHu.ai开发日志（自2018年2月6日至2019年4月11日）

【AI+CAD】（一）ezdxf 解析DXF文件

AI工具集(后续有其他工具，持续更新中)

Everypixel: AI图片搜索引擎

用 AI 解决电脑问题、推荐电影、游戏攻略

跟TED演讲学英文：How AI can save our humanity by Kai-Fu Lee

2022.10.9-10.16 AI行业周刊（第119期）：相信坚持的力量

AI医药论文解读--Drug-drug Interaction Prediction with Graph Representation Learning

发表评论

推荐文章

Linux常用命令：文件的下载、压缩与解压

用MySQL后电脑频繁蓝屏_电脑容易蓝屏怎么办_电脑突然开始频繁蓝屏修复方法-win7之家...

Linux驱动面试题

OpenLayers源码解析18 olinteractionDraw.js

全新版大学英语综合教程第二册学习笔记（原文及全文翻译）——6A - I‘M Going To Buy The Brooklyn Bridge（我要买下布鲁克林桥）

热门文章

网络其他计算机无法访问,win7局域网别人无法访问我的电脑是为什么_win7其他电脑无法访问我的电脑如何修复-win7之家...

怎么用计算机搜索文件夹,如何在电脑中查找文件_如何在电脑里查找文件-win7之家...

JQuery开发手册

笔记本一键重装Win7的方法,笔记本一键重装win7教程

cad卸载不干净_如何才能干净的卸载顽固软件？不给恶意软件留机会！

计算机密码设置方法,Win10电脑怎么设置默认账户登录？

win10设置登录Pin码的最小位数

2019.3.3激活码

L203 词汇题

ubuntu系统密码忘了怎么办

最新文章

超快速视频格式转换器

如何快速进行视频截屏？5个软件帮助你快速截屏

mov文件如何转换成mp4视频

mov文件怎么转换成mp4格式？5个软件教你快速转换成mp4格式

如何将MP4视频转换为MP3音频

简单好用的音频转换器分享

如何将mp4视频转换成aac音频

视频怎么转换成GIF？学会这招就能制作表情包了

计算机怎么直接搜索视频文件格式,如何将视频文件转换成可以直接播放的格式？...

免费mp3转换器哪个好用？本期文章告诉你答案

AMV格式转换，试试这五种转换方式

在线mp3转换器怎么用？这里总结了五个使用教程

迅速转换音视频格式的方法

如何将mp4视频转换成m4r音频

视频提取文案，这5种方法让你轻松提取出来

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载