OpenStack下利用透传技术(passthrough)对GPU实现虚拟化|电子爱好者

admin管理员组
文章数量:1567245

Tips：默认已安装好OpenStack相关必要组件并可以正常运行的情况下，本文只涉及GPU 虚拟化的相关配置说明。

一配置GPU Passthrough的系统相关设置
1. 在BIOS中enable VT-x, VT-d, Onboard VGA. Onboard VGA 的enable可以避免一些错误的出现，具体参考Not only for miners GPU integration in Nova environment.

2. 编辑文件 /etc/modules，添加以下内容：

pci_stub
vfio
vfio_iommu_type1
vfio_pci
kvm
kvm_intel
3. 修改文件 /etc/default/grub：

对于Intel芯片：

GRUB_CMDLINE_LINUX_DEFAULT="intel_iommu=on"
对于AMD芯片：

GRUB_CMDLINE_LINUX_DEFAULT="iommu=pt iommu=1"
4. 运行
update-grub
5. 将下列内容加入到blacklist中以避免被宿主机占用，编辑文件 /etc/modprobe.d/blacklist.conf：
blacklist snd_hda_intel
blacklist amd76x_edac
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
6. 查找显卡的Product ID 以及 Vendor ID：

root@computer1:~# lspci -nn | grep NVIDIA
04:00.0 VGA compatible controller [0300]: NVIDIA Corporation Device [10de:1b06] (rev a1)
04:00.1 Audio device [0403]: NVIDIA Corporation Device [10de:10ef] (rev a1)
05:00.0 VGA compatible controller [0300]: NVIDIA Corporation Device [10de:1b06] (rev a1)
05:00.1 Audio device [0403]: NVIDIA Corporation Device [10de:10ef] (rev a1)
相关参数解释参考OpenStack 企业私有云的若干需求（1）：Nova 虚机支持 GPU

7. 编辑文件 /etc/modprobe.d/vfio.conf:

# GTX 1080Ti and its audio controller
options vfio-pci ids=10de:1b06,10de:10ef
8. 运行：
update-initramfs -u
9. 重启服务器

10. 验证：

root@computer1:~$ lspci -nnk -d 10de:1b06
04:00.0 VGA compatible controller [0300]: NVIDIA Corporation Device [10de:1b06] (rev a1)
   Subsystem: Micro-Star International Co., Ltd. [MSI] Device [1462:3609]
   Kernel driver in use: vfio-pci
   Kernel modules: nvidiafb, nouveau
05:00.0 VGA compatible controller [0300]: NVIDIA Corporation Device [10de:1b06] (rev a1)
   Subsystem: Micro-Star International Co., Ltd. [MSI] Device [1462:3609]
   Kernel driver in use: vfio-pci
   Kernel modules: nvidiafb, nouveau
显示结果中"Kernel driver in use: vfio-pci"说明已经配置成功，接下来是OpenStack的配置过程。

如果经过以上步骤设备仍然被占用，可以根据文后参考资料中的最后两篇文章解绑设备。

二 OpenStack的相关配置
1. 配置nova-scheduler （controller节点），编辑文件 /etc/nova/nova.conf:

[DEFAULT]
scheduler_default_filters = RetryFilter, AvailabilityZoneFilter, RamFilter, ComputeFilter, ComputeCapabilitiesFilter, ImagePropertiesFilter, ServerGroupAntiAffinityFilter, ServerGroupAffinityFilter, PciPassthroughFilter
scheduler_available_filters = nova.scheduler.filters.all_filters
重启nova-scheduler服务

2. 配置nova-api （controller节点），编辑文件 /etc/nova/nova.conf:

[pci]

alias = { "name": "nvidia1080", "product_id": "1b06", "vendor_id": "10de", "device_type": "type-PCI" }
重启nova-api服务
3. 配置nova-compute（compute 节点），编辑文件/etc/nova/nova.conf:

[pci]

passthrough_whitelist = { "vendor_id": "10de", "product_id": "1b06" }

alias = {
"name": "nvidia1080",
"product_id": "1b06",
"vendor_id": "10de",
"device_type": "type-PCI"
}
重启nova-compute服务

三验证
1. 创建设置flavor：

openstack flavor create --public --ram 2048 --disk 20 --vcpus 2 m1.large

openstack flavor set m1.large --property pci_passthrough:alias='nvidia1080:2'
nvidia1080 即为alias中的那么， 2为GPU的数量。

2. 创建instance：

openstack server create --flavor m1.large --image cirros-0.3.5-x86_64-uec --wait test-pci
3. 在cirros下查看GPU信息如下：

$ lspci -k
...
00:05.0 Class 0300: 10de:1b06
00:06.0 Class 0300: 10de:1b06
...
四 NVIDIA显卡的问题

因为NIVIDIA显卡的驱动会检测是否跑在虚拟机里，如果在虚拟机里驱动就会出错，所以我们需要对显卡驱动隐藏hypervisor id。在OpenStack的Pile版本中的Glance 镜像引入了img_hide_hypervisor_id=true的property，所以可以对镜像执行如下的命令隐藏hupervisor id：

$ openstack image set IMG-UUID --property img_hide_hypervisor_id=true
通过此镜像安装的instance就会隐藏hypervisor id。

如果是Pike之前的版本，可以参考Consumer-grade GPUs in an OpenStack system (NVIDIA GPUs)这篇文章的做法。

可以通过下边的命令查看hypervisor id是否隐藏：

$ cpuid | grep hypervisor_id
hypervisor_id = "KVMKVMKVM "
hypervisor_id = "KVMKVMKVM "
上边的显示结果说明没有隐藏，下边的显示结果说明已经隐藏：

$ cpuid | grep hypervisor_id
hypervisor_id = " @ @ "
hypervisor_id = " @ @ "

参考资料：

Not only for miners GPU integration in Nova environment

GUIDE: Ubuntu 16.04 GPU Passthrough WITH Raw Disk Access

Multiheaded NVIDIA Gaming using Ubuntu 14.04 + KVM

GPU pass through guide for Ubuntu

OpenStack 企业私有云的若干需求（1）：Nova 虚机支持 GPU

Consumer-grade GPUs in an OpenStack system (NVIDIA GPUs)

OpenStack PCI passthrough（PIC直通）环境配置

Centos 7 + Openstack + PCI passthrough（透传）

本文标签：技术 OpenStack GPU passthrough

版权声明：本文标题：OpenStack下利用透传技术(passthrough)对GPU实现虚拟化内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725806247a1044067.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

OpenStack下利用透传技术(passthrough)对GPU实现虚拟化

更多相关文章

迅雷链技术沙龙第一站：百万级TPS是怎样炼成的

2011年十大技术发展趋势回顾：技术泡沫

10位专家预测2007年巨大潜力技术[转]

怎么样查看服务器的gpu信息,服务器查看GPU等信息

conda配置python环境：安装gpu版本的pytorch、torchvision、torchaudio、pytorch-cuda

vivo 网络端口安全建设技术实践

微信扫码自动群发消息给所有人技术分析 之通过https请求获取微信网页版登录二维码图

懂技术不代表懂互联网

uniapp技术应用，以及案列讲解

NFC技术过硬的谷歌Nexus S的解释

探索语音技术的未来：Microsoft Cognitive Services Speech SDK 示例项目

靠网络信号侦测家算非法？Cognitive Systems开创独门隐私技术

win10win11系统安装Tensorflow-GPU

最好用的win10环境下tensorflow2.0 CPUGPU安装教程

Mac 技术篇-chrome浏览器启用flash插件最强攻略

百度AI输入法发布全感官输入2.0版本，语音技术取得世界级突破

GPU版PyTorch安装、GPU版TensorFlow安装（详细教程）

微信号码检测助手技术完整版介绍

回声消除技术解析

【SpringBoot学习】02-2开发实用篇（热部署、配置、NoSQL、整合第三方技术）

发表评论

推荐文章

第七节、文件系统与磁盘分区

云桌面计算机是什么,云桌面和电脑在使用上的差别你都知道吗

nodejs npm报错 重装 解决方法

谷歌浏览器插件开发--Notes Canvas

Windows Sublime Text 配置Linux子系统(WSL)下的 shell 编译环境

热门文章

Win10 新版Edge浏览器Flash Player不兼容，总是显示flash与地区不兼容(完美解决)

私有云的部署(详细)

QT5.9打包程序应用程序无法正常启动0xc000007b解决方法

Windows 安装 OpenSSL

cad插件_CAD插件三领外挂7

电脑自带的服务器修复,还原或修复运行 Windows Server Essentials 的服务器

苹果7系统更新12无服务器,别再为苹果手机无法更新系统犯难，这几种方式帮你解决！...

u盘容量影响计算机运行速度,插u盘导致电脑运行速度慢的解决方法

u盘电视测试软件,怎么把u盘里的软件装到tcl电视上

金士顿U盘不断自动连接断开解决方法

最新文章

win 10 系统服务器登陆,已解决：Win10 1607版 无法登录Microsoft帐户 系统登录窗口闪退...

Win10安装Python3.9

win10无限蓝屏_win10蓝屏died怎么办_win10无限process died解决方法

【8.14更新】Win11 23H2 正式版：22631.4037镜像下载！

如何从Win10升级到Windows11正式版

解决AE在win1011系统上安装失败问题 AEcc2021-After Effects 2021中文正式版安装教程

win10 iot core linux,微软正式发布Win10 IoT Core物联网版系统

PHP Manager 1.5 for IIS 8.5, IIS 10 官方正式版 支持WIN10和Win2016

win10家庭中文正式版输入法切换快捷键设置为Ctrl+Shift

我的世界win10版与java版_我的世界java版和win10版的区别

写c语言win7还是win10好,做设计系统用WIN7还是WIN10？

win10计算机性能设置,巧设置让Win10运行更流畅

win10默认壁纸_win10主题软件哪个好用 win10主题软件排行

win10安装TensorFlow2.0正式版

Win11官方正式版(免激活)

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

微信扫码自动群发消息给所有人技术分析之通过https请求获取微信网页版登录二维码图

nodejs npm报错重装解决方法

win 10 系统服务器登陆,已解决：Win10 1607版无法登录Microsoft帐户系统登录窗口闪退...

PHP Manager 1.5 for IIS 8.5, IIS 10 官方正式版支持WIN10和Win2016

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载