一键运行大语言模型服务，搭建聊天应用

编程入门行业动态更新时间:2024-10-09 13:23:41

前言

本文介绍一个可以快速搭建本地大语言模型的聊天服务，模型和代码已全部提供，不需要联网运行。项目使用的是Qwen-7B-Int4模型，只需要8G显存的显卡都能流畅运行，无论是Windows还是Linux系统都支持使用。

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

pip install -r requirements.txt -i

python server.py

使用Android Studio打开源码中的AndroidClient目录，这是一个Android应用源码，打开之后首先就要修改服务t地址CHAT_HOST，将它修改为你上面使用的服务器IP地址，点击运行安装到Android手机上。

应用效果图：

扫码入知识星球，搜索【基于大语言模型的聊天应用】获取源码

更多推荐

一键运行大语言模型服务,搭建聊天应用

本文发布于:2023-12-04 04:09:37，感谢您对本站的认可！

一键模型语言

评论列表（有 0 条评论）