admin管理员组文章数量:1594248
1.NVDLA简介
英伟达深度学习加速器(NVDLA)是一种免费开放式架构,NVDLA具有可扩展性,高度可配置性,旨在简化集成和可移植性。NVDLA软件生态系统包括一个设备上的软件堆栈(开源版本的一部分),一个完整的培训基础架构,用于构建包含深度学习的新模型,以及将现有模型转换为可在设备上使用的形式的解析器软件。可以提供其自己的硬件平台以及软件内核:
- 硬件架构:基于Xavier–全球首款专为汽车产品设计的自动处理器 - 以及完整的验证套件。
- 基于开放行业标准的IP核模型提供:Verilog模型是RTL形式的综合和仿真模型,TLM SystemC仿真模型可用于软件开发,系统集成和测试。
2.硬件架构
2.1硬件简介
NVIDIA®深度学习加速器(NVDLA)是一种可配置的固定功能硬件加速器,适用于深度学习应用程序中的推理操作。通过展示加速与每个CNN层相关的操作的各个构建块(例如,卷积,反卷积,完全连接,激活,池化,本地响应归一化等),为卷积神经网络(CNN)提供全硬件加速。保持独立且可独立配置的块意味着NVDLA的尺寸可以适用于许多较小的应用。
NVDLA架构中的每个块都支持特定的操作,这些操作对于深度神经网络的推理是不可或缺的。推理操作分为五组:
- 卷积运算(卷积核心和缓冲区块)
卷积模式有很多种支持:直接卷积、图像输入卷积模式、Winograd卷积模式、批量卷积模式、卷积缓冲区 - 单数据点操作(激活引擎块)
单数据点操作支持:线性函数、非线性函数 - 平面数据操作(池化引擎块)
池化功能支持:maximum-pooling - 从池窗口获取最大值、最小池 - 从池窗口获取最小值、average-pooling - 池化窗口中的特征值的平均值 - 多平面操作(本地和标准块)
- 数据存储器和重塑操作(重塑和桥接DMA模块)
桥DMA(
本文标签: nvdlainvestigate
版权声明:本文标题:nvdla_investigate 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/xitong/1728178722a1148178.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论