神经网络编译器的Tensor优化：auto tune和auto schedule|电子爱好者

admin管理员组
文章数量:1566224

一般情况下，深度神经网络的计算本质上是一对tensor的计算，例如常见的conv2d的计算本质上是一个7层的for循环，那么底层的硬件，例如内存大小，SM的数量，threads和blocks等都会对最终的for循环造成影响。

现存的深度学习框架（例如Tensorflow，PyTorch ，MXNet）会将DNN中的计算映射到其底层提供的向量计算内核库（例如cuDNN，MKL-DNN）来实现高性能。但是，这些内核库存在以下几个问题：

现存的加速库cuDnn,MKL-DNN针对Tensor的优化是需要耗费大量的人力和经验的。
硬件的发展导致会有更多的硬件出现，这种情况下再去人工手写就很窒息。

因此，目前大家希望设计一套自动搜索的过程。

搜什么：搜tensor计算的for循环如何部署，例如for循环如何安排，如何切割，如何和底层PE map，因此我们针对一个for循环，其实是可以得到一个模板的，每个模板是有参数的。因此搜索就分为两个：搜模板和搜参数。例如图a展示的就是现在模板定了（for循环的次序定了），只需要搜 for循环的参数；图b展示的是搜模板，是通过我规定模板的次序（譬如说先split循环的轴，然后reorder等），然后按照我们规定的顺序进行搜索。所谓的beam搜索是指站在当前的搜索节点上，我们选择最优的几个节点，站在这个节点上往下一个搜索节点走，这种beam 搜索会导致一个问题：局部最优解不一定是全局最优解。

版权声明：本文标题：神经网络编译器的Tensor优化：auto tune和auto schedule 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1725781985a1042296.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

神经网络编译器的Tensor优化：auto tune和auto schedule

更多相关文章

python中的schedule模块定时执行任务

timer中schedule和scheduleAtFixedRate的区别

Quartz实现分布式集群schedule调度(定时任务执行)

linux内核函数schedule()实现进程的调度

Python定时模块--schedule

import schedule ImportError: No module named schedule

amd显卡跑人工神经网络,amd显卡能跑神经网络吗

腾讯多媒体实验室：基于三维卷积神经网络的全参考视频质量评估算法

c语言编程软件有哪些 Win7下用哪种C语言编译器

一周AI回顾 | 特斯拉AI负责人说神经网络正在改变编程，机器学习大神Bengio新论文专注RNN优化

如何检测新移动硬盘--HD Tune Pro硬盘工具

基于BP神经网络的人脸朝向识别

开发工具 之五 Visual Studio 2017中的编译器工具布局

DL：深度学习算法(神经网络模型集合)概览之《THE NEURAL NETWORK ZOO》的中文解释和感悟(五)

MinGW-w64安装教程——著名CC++编译器GCC的Windows版本

自然语言处理系列六十三》神经网络算法》LSTM长短期记忆神经网络算法

DEVC编译器快捷键大全

NotImplementedError: Cannot convert a symbolic Tensor解决办法

卷积神经网络的图像分割,一维cnn卷积神经网络

## win10环境下配置cpu版本caffe的心得（一）openmv机器学习卷积神经网络训练步骤一

发表评论

推荐文章

如何获取手机浏览器中自动填充的账号密码等信息

医疗金融法律大模型：从ChatDoctor到BloombergGPTFinGPTFinBERT、ChatLawLawGPT_zh

oracle windows系统下卸载oracle 11g和安装oracle 11g

电脑变无线打印服务器,废品再利用 老电脑变网络打印服务器

安卓Android百度输入法皮肤-疯狂码字的快乐-《Write 2022升级版》

热门文章

Python + Selenium（二十六）模拟手机浏览器

Win10 的 VMware 中安装 UOS 20，在 UOS 中安装 QtCreator 及搭建 DTK 开发环境

萤石云摄像时间校准

怎么将云服务器上的公网IP，显示到本机来。并且不影响原先的业务？

台式计算机的打印机端口,打印机端口设置，高手教你如何搞定电脑打印机端口设置...

防火墙文件打印共享服务器,防火墙 网络打印机共享服务器

台式机启动时显示您的计算机无法启动,Win10开机出现无法自动修复你的电脑未正确启动的解决方法...

【Android 系统客制化】内置百度输入法

java dwg转pdf_CAD处理控件Aspose.CAD转换功能演示：使用Java将DWG和DXF文件转换为PDF...

【dockerdesktop 汉化 for mac，汉化脚本，理论可永久使用，不会因版本变化而失效】

最新文章

TechSmith Camtasia 2023 v23.2.0.47710 中文激活授权版(附安装教程+激活补丁)

​mathtype7.7永久激活码密钥及2025最新序列号附安装教程​

Windows Server 2016补丁更新机制

windows server 2016版介绍与安装

Mac压缩包在Windows下解压后乱码或丢失(ZIP)

CorelDRAW2024序列号、密钥、注册激活码免费永久分享

Windows10内置Linux(WSL)

怎样把任意exe程序注册成windows系统服务(手动注册服务)

windows 系统密码破解工具（适合各种版本windows）

Kinect for Windows sdk下载 以及安装时错误的解决方案

mathtype7.7.1.258安装教程+激活秘钥+注册码

Windows11 家庭版 安装docker

window redis版本下载

自制 Windows Hello

Windows PowerShell远程连接Linux

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

开发工具之五 Visual Studio 2017中的编译器工具布局

电脑变无线打印服务器,废品再利用老电脑变网络打印服务器

防火墙文件打印共享服务器,防火墙网络打印机共享服务器

mathtype7.7永久激活码密钥及2025最新序列号附安装教程

Kinect for Windows sdk下载以及安装时错误的解决方案

Windows11 家庭版安装docker

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载