gpu浮点计算能力floaps_关于CPU的浮点运算能力计算|电子爱好者

admin管理员组
文章数量:1655344

学了IT那么久，只知道CPU主频不断的提升，核数也越来越多，但是如何理论上计算出不同代CPU性能的提升，还真没有认真思考过，我估计大多数人也不会关注，这次由于要进行高性能集群项目遇到，刚好认真的研究了一下CPU的浮点计算理论值。记录一下过程。

首先，FLOAS=核数*单核主频*CPU单个周期浮点计算值。

上述三个参数中，核数，单核主频在CPU型号都会标明，只有CPU单个周期浮点计算值这个要深入思考一下。

首先要了解CPU指令集的概念。

现在服务器的CPU都是AVX-512指令集了，

对应CPU能处理什么样的指令集，可以查intel官方的Specifications.比如我想查Intel® Xeon® Gold 6142 Processor这款CPU的支持哪种指令，可以查如下链结https://ark.intel/products/120487/Intel-Xeon-Gold-6142-Processor-22M-Cache-2-60-GHz-

同时还能查到此款CPU的AVX-512 FMA Units是2，这个意思是可以单个CPU周期可以同时执行2条512bit 加法和2条512bit 乘法。

其次是理解单精度和双精度浮点运算概念，简单的理解单精度就是指32bit的指令长度的运算，对应操作系统就是32位操作系统；双精度就是指64bit指令长度的运算，对应操作系统就是64位操作系统。

理解上述二个概念，我们就可以算出CPU单周期浮点计算能力了，

CPU单周期双精度浮点计算能力=2(FMA数量)*2(同时加法和乘法)*512/64

CPU单周期双精度浮点计算能力=2(FMA数量)*2(同时加法和乘法)*512/32

可以理解为单个CPU周期能够同时执行加法和乘法的指令的条数。

例如上述的Intel 6142 CPU的浮点能力可以计算出，6142是16核，每核2.6GHz

FLOAS(双精度)=16*2.6*(2*2*512/64)=1331.2GFLOAs

FLOAS(单精度)=16*2.6*(2*2*512/32)=2662.4GFLOAs

可以理解此款CPU的双精度浮点运算峰值为1.3TFLOAs,单精度为2.6TFLOAs.

对一个计算节点，有可能有多个CPU，那么对于计算节点，单个CPU浮点运算峰值要乘以CPU个数才是一个计算节点的浮点运算峰值。

常用的CPU情况：

Intel Core 2 and Nehalem:

4 DP FLOPs/cycle: 2-wide SSE2 addition + 2-wide SSE2 multiplication

8 SP FLOPs/cycle: 4-wide SSE addition + 4-wide SSE multiplication

Intel Sandy Bridge/Ivy Bridge:

8 DP FLOPs/cycle: 4-wide AVX addition + 4-wide AVX multiplication

16 SP FLOPs/cycle: 8-wide AVX addition + 8-wide AVX multiplication

Intel Haswell/Broadwell/Skylake/Kaby Lake:

16 DP FLOPs/cycle: two 4-wide FMA (fused multiply-add) instructions

32 SP FLOPs/cycle: two 8-wide FMA (fused multiply-ad

本文标签：浮点能力 GPU CPU

版权声明：本文标题：gpu浮点计算能力floaps_关于CPU的浮点运算能力计算内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729692161a1210225.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

gpu浮点计算能力floaps_关于CPU的浮点运算能力计算

更多相关文章

操作系统应该如何在多CPU上调度工作？

仿真的硬件选型原则：CPU

Perf IPC以及CPU性能

CPU是怎么做的

03 | 通过你的CPU主频，我们来谈谈“性能”究竟是什么？

Linux性能优化之CPU、内存、IO优化

CPU与GPU 扫盲

社交服务器占用,如何对占据服务器大量cpu资源的用户进行限制

ARM与X86 CPU架构区别

搭载英特尔 N100 CPU，LattePanda Mu微型计算模块现已发售！

AMD 和 Intel 之战：CPU 哪家强？

【转载】CPU散热器详解

使用AMD CPU，打造自己的深度学习服务器

CPU与内存的那些事(1)

Windows云服务器CPU使用率高的问题一例

手把手教女朋友做 Android CPU性能优化

租用的服务器CPU使用率高的原因分析与解决办法

MxNet（GPU版本）安装及相关配置（CUDA，CuDNN，Graphviz，d2l，虚拟环境配置）及最终建议

摩尔的预言 唯有CUDA才是终极的CPU

四核有望崛起 09年三季度cpu核心数量研究

发表评论

推荐文章

解决酷狗音乐缓存文件kgtemp文件无法播放的问题

lora网关软件设计_Lora-sx1278-gateway: 官网的LoRaWan协议，由终端、网关、服务器组成。用户应用层暂不包括在内，目前终端硬件软件全部开源，网关硬件难以获取，硬件成本高。服务...

将电脑文件或百度网盘文件导入ipad

win10安装nvidia驱动，cuda10.1，cudnn7.6.5和tensorflow_gpu2.2.0

identify your project root folder to open source in cisual studio code and sync changs

热门文章

Redis学习

ubuntu下安装杀毒软件Antivir

迅雷看不了html,迅雷看看不能看，可以打开看看网页，但必须刷新才能看到画面的移动，? 爱问知识人...

显示器不亮电源灯闪_台式电脑显示屏不亮指示灯一直闪烁

我为何看到你的提问不想回答？关于如何提问的一些看法

Macfee打造自己的安全系统

解决R语言identify如何退出

i5 10210u和i7 1065g7哪个好

在Windows 10 中用 Bash on Windows（WSL） 给 VSCode 搭建 编译调试 CC++ 环境 (本文已过时)

11 ｜通过程序并行计算，避免CPU资源浪费

最新文章

[ecshop调试]ecshop 数据库查询缓存详解 有三种缓存，query_cache（数据库查询缓存）、static_cache（静态缓存）和cache(普通的缓存)

微信小程序前端开发

花花省V6淘宝客APP社交电商自营商城聚合优惠券系统

微信小程序开发 快速学习 这篇就够了

有感于小米官网的中英文版本的差异

自动化测试-AirTest-移动端测试-笔记

软件测试（从练气境到陆地仙人）

CMS系统开发学习-前言

万字长文：营销活动体系的搭建和18种活动玩法(下篇)

Nginx 啦啦啦啦啦啦啦啦

历时三年，花了200万，小米换的新标值这个价吗？

邓白氏编码的申请流程

国产手机 不只是老罗一张嘴

实现pc和手机两终端都可以在线播放视频的一种方法

Android开发笔记（一百一十五）设计工具

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

摩尔的预言唯有CUDA才是终极的CPU

在Windows 10 中用 Bash on Windows（WSL）给 VSCode 搭建编译调试 CC++ 环境 (本文已过时)

[ecshop调试]ecshop 数据库查询缓存详解有三种缓存，query_cache（数据库查询缓存）、static_cache（静态缓存）和cache(普通的缓存)

微信小程序开发快速学习这篇就够了

国产手机不只是老罗一张嘴

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载