一键运行大语言模型服务,搭建聊天应用

编程入门 行业动态 更新时间:2024-10-09 13:23:41

<a href=https://www.elefans.com/category/jswz/34/1767003.html style=一键运行大语言模型服务,搭建聊天应用"/>

一键运行大语言模型服务,搭建聊天应用

前言

本文介绍一个可以快速搭建本地大语言模型的聊天服务,模型和代码已全部提供,不需要联网运行。项目使用的是Qwen-7B-Int4模型,只需要8G显存的显卡都能流畅运行,无论是Windows还是Linux系统都支持使用。

安装环境

  1. 安装GPU版本的Pytorch。
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
  1. 安装其他依赖库。
pip install -r requirements.txt -i 

启动服务

  1. 执行server.py程序,启动大语言模型服务。
python server.py

Android应用

使用Android Studio打开源码中的AndroidClient目录,这是一个Android应用源码,打开之后首先就要修改服务t地址CHAT_HOST,将它修改为你上面使用的服务器IP地址,点击运行安装到Android手机上。

应用效果图:

扫码入知识星球,搜索【基于大语言模型的聊天应用】获取源码

更多推荐

一键运行大语言模型服务,搭建聊天应用

本文发布于:2023-12-04 04:09:37,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1659712.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:一键   模型   语言

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!