训练自己业务的行业垂类大模型-生成式模型：从0到1复现ChatGLM的p-tuning和lora 微调|电子爱好者

admin管理员组
文章数量:1590153

1、基础环境配置

2、临时更改当前环境

3、安装chatglm的使用环境

1.安装 Python 3.8

2.安装各种包

4、跑通原本的chatglm：

5、p-tuning微调：

6、lora 微调

1、基础环境配置

下载anaconda版本：Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

使用的是Anaconda3-2020.02-Linux-x86_64.sh

chmod +x Anaconda3-2020.02-Linux-x86_64.sh
sh Anaconda3-2020.02-Linux-x86_64.sh

安装过程中一直enter 键，出现 More 展示协议，输入【yes】统一协议。之后一直enter 键即可，尤其遇到让更改PATH 路径，选择默认的[no]即可，这样之后用conda单独建立想用的python 版本或者环境。

2、临时更改当前环境

export PATH="/home/anaconda3/bin:$PATH"

此时 ~/.bashrc 目录的path 并无变化

更改 PATH 环境变量后，可以通过以下步骤验证是否成功：

打开一个终端窗口（Terminal）。
输入以下命令来激活 Anaconda 环境：

source anaconda3/bin/activate

假设Anaconda 安装在 "/home/user/anaconda" 目录下，那么需要使用上面的命令来激活 Anaconda 环境。
输入以下命令来检查 Anaconda 环境是否激活成功：

which python

如果输出的是 Anaconda 中安装的 Python 的路径（例如：/home/user/anaconda/bin/python），则说明 Anaconda 环境已经成功激活了。
输入以下命令来退出 Anaconda 环境：

conda deactivate

这样就可以将环境还原回系统默认环境了。
然后conda 命令就可以用了

验证步骤尽量实验一下，有时直接conda 命令显示-bash: conda: command not found

3、安装chatglm的使用环境

1.安装 Python 3.8

先修改anaconda 的安装channels：channels 指的是软件包仓库的源地址

sudo vim ~/.condarc

# 将下面信息粘贴进去：
channels:
 - http://大家设置自家的源/cloud/conda-forge
 - http://大家设置自家的源/cloud/pytorch
 - http://大家设置自家的源/pkgs/main/
 - http://大家设置自家的源/pkgs/free/
show_channel_urls: true

创建python 3.8环境详细步骤

使用上一个终端环境，千万别关闭。
输入以下命令来创建一个 Python 3.8 的临时环境：

conda create --name tmp_py38 python=3.8

这个命令会在 Anaconda 中创建一个名为 "tmp_py38" 的新环境，并安装 Python 3.8 版本。
输入以下命令来激活这个新环境：

conda activate tmp_py38
在这个环境下，可以按照需求安装所需要的 Python 包和依赖。
完成后，可以使用以下命令退出这个临时环境：

conda deactivate

2.安装各种包

先安装chatglm需要的基础包：

ChatGLM-6B/requirements.txt at main · THUDM/ChatGLM-6B · GitHub

pip install --retries 0 -r requirements.txt

然后按照微调需要的包：

ChatGLM-6B/ptuning at main · THUDM/ChatGLM-6B · GitHub

pip install --retries 0 rouge_chinese nltk jieba datasets

安装完之后 torch 应该是1.13版本的，此时运行代码出现【libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11 not defined in file libcublasLt.so.11 with link time reference】

参考：解决libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit_be_humble的博客-CSDN博客

pip uninstall nvidia_cublas_cu11

4、跑通原本的chatglm：

将chatglm的源码下载下来，修改模型路径，运行cli_demo.py

修改模型路径

7 tokenizer = AutoTokenizer.from_pretrained("./pretrained_models", trust_remote_code=True)

8 model = AutoModel.from_pretrained("./pretrained_models", trust_remote_code=True).half().cuda()

9 model = model.eval()

使用案例

欢迎使用 ChatGLM-6B 模型，输入内容即可进行对话，clear 清空对话历史，stop 终止程序

用户：你好啊

ChatGLM-6B：你好👋！我是人工智能助手 ChatGLM-6B，很高兴见到你，欢迎问我任何问题。

用户：what is your name?

ChatGLM-6B：my name is ChatGLM-6B.

用户：你都会做什么？

ChatGLM-6B：我是一台人工智能助手，可以回答各种各样的问题，例如学术、语言、文化等方面的问题，提供有关历史、地理、科学、技术、社会和文化等各个领域的信息和知识，帮助用户解决问题和获取信息。同时，我也可以进行文本生成、语言翻译、自动摘要、情感分析等任务，可以帮助用户完成各种自动化操作。

用户：你会写代码吗？

ChatGLM-6B：虽然我是由清华大学 KEG 实验室和智谱 AI 公司于 2023年共同训练的语言模型，但是我并没有编程能力，无法编写自己的代码。我的功能是基于预先训练的大规模语言模型，通过对输入文本的响应来回答问题或完成任务。

用户：用python写一个从1加到10的代码

ChatGLM-6B：以下是使用 Python 编写的从 1 加到 10 的代码：

```python

sum = 0

for i in range(1, 11):

sum += i

print("The sum of", range(1, 11), "is", sum)

```

代码解释：

1. 定义变量 `sum` 初始值为 0。

2. 使用 `for` 循环从 1 加到 10，循环变量 `i` 的范围为 1 到 10。

3. 在每个循环迭代中，将当前数字 `i` 加到变量 `sum` 中。

4. 循环结束后，`sum` 的值会等于 range(1, 11) 中所有数字的总和，即 `sum = sum + range(1, 11)`。

5. 使用 `print` 函数输出结果。

输出结果：

```

The sum of 1 to 10 is 55

```

用户：stop

5、p-tuning微调：

chatglm的微调有没有保姆式的教程？? - 知乎

6、lora 微调

GitHub - mymusise/ChatGLM-Tuning: 一种平价的chatgpt实现方案, 基于ChatGLM-6B + LoRA

pip install -r requirements.txt

peft类的导入

peft的git库：GitHub - huggingface/peft: 🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.

将git库中src/peft目录复制出来，放在.../ChatGLM-Tuning目录下即可

遇到新问题：/usr/lib64/libstdc++.so.6: version `CXXABI_1.3.9' not found


===================================BUG REPORT===================================

Welcome to bitsandbytes. For bug reports, please run

python -m bitsandbytes

and submit this information together with your error trace to: Issues · TimDettmers/bitsandbytes · GitHub

================================================================================

bin /home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/libbitsandbytes_cuda110.so

/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: /home/anaconda3/envs/tmp_py38 did not contain ['libcudart.so', 'libcudart.so.11.0', 'libcudart.so.12.0'] as expected! Searching further paths...

warn(msg)

/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/cuda_setup/main.py:145: UserWarning: WARNING: The following directories listed in your path were found to be non-existent: {PosixPath('/usr/local/nvidia/lib'), PosixPath('/usr/local/cuda/extras/CUPTI/lib64'), PosixPath('/usr/local/nvidia/lib64')}

warn(msg)

CUDA SETUP: CUDA runtime path found: /usr/local/cuda/lib64/libcudart.so

CUDA SETUP: Highest compute capability among GPUs detected: 8.0

CUDA SETUP: Detected CUDA version 110

CUDA SETUP: Loading binary /home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/libbitsandbytes_cuda110.so...

/usr/lib64/libstdc++.so.6: version `CXXABI_1.3.9' not found (required by /home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/libbitsandbytes_cuda110.so)

CUDA SETUP: Something unexpected happened. Please compile from source:

git clone git@github:TimDettmers/bitsandbytes.git

cd bitsandbytes

CUDA_VERSION=110 make cuda110

python setup.py install

Traceback (most recent call last):

File "finetune.py", line 8, in <module>

from peft import get_peft_model, LoraConfig, TaskType

File "./ChatGLM-Tuning/peft/__init__.py", line 22, in <module>

from .mapping import MODEL_TYPE_TO_PEFT_MODEL_MAPPING, PEFT_TYPE_TO_CONFIG_MAPPING, get_peft_config, get_peft_model

File "./ChatGLM-Tuning/peft/mapping.py", line 16, in <module>

from .peft_model import (

File "./ChatGLM-Tuning/peft/peft_model.py", line 31, in <module>

from .tuners import (

File "./ChatGLM-Tuning/peft/tuners/__init__.py", line 21, in <module>

from .lora import LoraConfig, LoraModel

File "./ChatGLM-Tuning/peft/tuners/lora.py", line 40, in <module>

import bitsandbytes as bnb

File "/home//anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/__init__.py", line 6, in <module>

from . import cuda_setup, utils, research

File "/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/research/__init__.py", line 1, in <module>

from . import nn

File "/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/research/nn/__init__.py", line 1, in <module>

from .modules import LinearFP8Mixed, LinearFP8Global

File "/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/research/nn/modules.py", line 8, in <module>

from bitsandbytes.optim import GlobalOptimManager

File "/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/optim/__init__.py", line 6, in <module>

from bitsandbytes.cextension import COMPILED_WITH_CUDA

File "/home/anaconda3/envs/tmp_py38/lib/python3.8/site-packages/bitsandbytes/cextension.py", line 20, in <module>

raise RuntimeError('''

RuntimeError:

CUDA Setup failed despite GPU being available. Please run the following command to get more information:

python -m bitsandbytes

Inspect the output of the command and see if you can locate CUDA libraries. You might need to add them

to your LD_LIBRARY_PATH. If you suspect a bug, please take the information from python -m bitsandbytes

and open an issue at: Issues · TimDettmers/bitsandbytes · GitHub

需要将当前python 环境的lib库加进来：

export LD_LIBRARY_PATH=/home//anaconda3/envs/tmp_py38/lib

基于tensorboard 查看训练进程：

需要指定端口：

tensorboard --logdir=./ChatGLM-Tuning/runs/May19_14-46-33_set-zw04-kubernetes-pc189.mt --port 8000

本文标签：模型业务行业 LoRA 垂类大

版权声明：本文标题：训练自己业务的行业垂类大模型-生成式模型：从0到1复现ChatGLM的p-tuning和lora 微调内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728083942a1144759.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

训练自己业务的行业垂类大模型-生成式模型：从0到1复现ChatGLM的p-tuning和lora 微调

1、基础环境配置

2、临时更改当前环境

3、安装chatglm的使用环境

1.安装 Python 3.8

2.安装各种包

4、跑通原本的chatglm：

5、p-tuning微调：

6、lora 微调

更多相关文章

计算机行业新技术 —— 区块链

AI视界周刊第 1 期：最具性价比 GPT-4o mini 发布、大模型集体失智、语言模型安全漏洞

大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm

（附源码）spring boot 行业信息采集管理系统 毕业设计-91787

NeurIPS 2022 | CATER：针对模型窃取的版权保护之选择性水印

VGG19模型，输入图像，输出指定层特征

​​​​​​​大模型日报2024-05-19

Elasticsearch：使用 huggingface 模型的 NLP 文本搜索

价格战、大厂裁员、模型“翻车”……Q2 的AI 圈子可一点都不无聊

【研究】国内外大模型公司进展

为什么说国产大模型的野心，都藏在 MaaS 的生态中

隔壁公司因业务开了一堆AP，严重干扰我们该怎么办？

训练深度学习模型时电脑自动重启

大模型从入门到应用——LangChain：提示（Prompts）-[示例选择器（Example Selectors）]

大模型微调报错解决 RunTimeError:CUDA Setup failed despite GPU being available. libcudart.so not found.

mac免费CAD模型设计软件FreeCAD怎样设置中文模式

2022.7.4-7.10 AI行业周刊（第105期）：蜗牛

制造业是AI大模型应用的主战场

LLMs之Grok：Grok(一款具有00后特点般幽默、机智和实时的大语言模型)的简介、使用方法、案例应用之详细攻略

大模型从入门到应用——LangChain：记忆（Memory）-[记忆的类型：对话令牌缓冲存储器和基于向量存储的记忆]

发表评论

推荐文章

通过Photoshop cs5.0将视频截取并制作gif

计算机内存条能装几个,笔记本电脑可以装几个内存条_笔记本电脑最多可以插多少条内存-win7之家...

上班族真的有必要买智能猫砂盆吗？解放双手刻不容缓！

springboot 的yaml配置文件加密

平板电脑如何刷linux,平板电脑刷windows的方法是什么_如何把平板刷windows图文步骤...

热门文章

Python藏头诗在线生成器：适合表白的藏头诗情话，想不成功都难~

关于360加固保的使用

AppData、Roaming、Locallow等文件夹中常见大文件夹有哪些、有什么用以及如何清理方法参考资料

ie浏览器下载rar文件，变成do文件

Linux &amp; Docker常用命令

cad2022新功能介绍（autocad2022简体中文版）

计算机自带键盘无法使用,笔记本电脑键盘用不了怎么回事_笔记本电脑键盘不能用如何解决-win7之家...

明翰经验系列之随笔摘抄篇（持续更新）V1.2

联想台式计算机光驱启动,联想电脑怎么设置光驱启动【图文】

基于XR Interaction ToolKit开发的VR双平台兼容项目(二)

最新文章

kali linux 忘记密码如何重置|在 kali 上重置密码

linux之Centos系统破解密码两种方法

RedHat9.0如何修改root密码及设置GRUB密码

xp开机密码破解

深信服 SANGFOR 设备密码恢复和配置备份恢复

华为手机计算机快捷设置密码,华为手机首次重启绘制图案密码后让输入解锁密码。我没有设置呀？怎么办...

树莓派 忘记密码的解决方法

CentOS6忘记密码的解决办法。

macbook重置账户密码

Mac忘记登录密码解决方案

linux 找回登录密码,linux找回密码

Ubuntu 重置密码

Linux系统启动故障与忘记root用户密码时怎么办

专治疑难系列 - 解决Ubuntu忘记root密码问题

Linux找回root密码（Centos7.6）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

（附源码）spring boot 行业信息采集管理系统毕业设计-91787

大模型日报2024-05-19

Linux & Docker常用命令

树莓派忘记密码的解决方法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载