[开源项目学习]langchain-chatchat学习笔记3|电子爱好者

admin管理员组
文章数量:1566644

文章目录

fastchat
- 去看看源代码
- 如何终止服务
- fastchat的封装解析
vllm

fastchat

来看看fastchat是怎么部署成api的呀

参考教程：

用通俗易懂的方式讲解大模型：使用 FastChat 部署 LLM 的体验太爽了
使用 FastChat 在 CUDA 上部署 LLM

我按照第二个教程链接，一次运行controller，openai api server，还有model worker，然后报错了

[Errno 99] error while attempting to bind on address ('::1', 21001, 0, 0)

按照这篇说的解决了
我给三个命令都加上了host 0.0.0.0

python3 -m fastchat.serve.controller --host 0.0.0.0

python -m fastchat.serve.openai_api_server --host 0.0.0.0

python -m fastchat.serve.model_worker \
   --model-path /root/model/chatglm3-6b --port 21003 \
   --worker-address http://localhost:21003 \
   --host 0.0.0.0

我是分别在三个终端运行的

然后就可以调用端口啦（参考）

下面注释掉的也能用

# import requests
# import json

# response = requests.get('http://localhost:8000/v1/models')
# data = response.json()

# # 使用json.dumps函数美化JSON数据
# pretty_data = json.dumps(data, indent=4)
# print(pretty_data)

import requests
import json

url = "http://localhost:8000/v1/chat/completions"
headers = {
    'accept': 'application/json',
    'Content-Type': 'application/json',
}
data = {
    "model": "chatglm3-6b",
    "max_tokens": 2048,
    # "prompt": "写一篇1000字的作文：《2024回家过年》"
    "messages": [ 
      { "role": "system", "content": "你是一名二次元助手，回答要精简。" },
      { "role": "user", "content": "最近有什么好看的番剧？" }
    ]
}

response = requests.post(url, headers=headers, data=json.dumps(data))

# 打印响应内容
print(response.json())

或者用curl

 curl http://localhost:8000/v1/chat/completions   -H "Content-Type: application/json"   -d '{
     "model": "chatglm3-6b",
     "messages": [{"role": "user", "content": "北京景点"}],
     "temperature": 0.7
   }'

去看看源代码

可以看到是使用了fastapi

可以看看对应的接口文档，

http://localhost:21002/docs

可以去这些url后面加个/docs
然后try it out
就都能测试，这些接口

和那些代码里面@的地方是相对应的

如何终止服务

fastchat的封装解析

这篇写的挺好：FastChat工作原理解析

vllm

没写完，遇到bug没解决

参考：
- 【chatglm】（9）：使用fastchat和vllm部署chatlgm3-6b模型，并简单的进行速度测试对比
- https://github/lm-sys/FastChat/blob/main/docs/vllm_integration.md

python -m vllm.entrypoints.api_server --trust-remote-code --model /root/model/chatglm3-6b
INFO 05-18 15:38:07 llm_engine.py:70] Initializing an LLM engine with config: model='/root/model/chatglm3-6b', tokenizer='/root/model/chatglm3-6b', tokenizer_mode=auto, revision=None, tokenizer_revision=None, trust_remote_code=True, dtype=torch.float16, max_seq_len=8192, download_dir=None, load_format=auto, tensor_parallel_size=1, quantization=None, enforce_eager=False, seed=0)
WARNING 05-18 15:38:07 tokenizer.py:62] Using a slow tokenizer. This might cause a significant slowdown. Consider using a fast tokenizer instead.
INFO 05-18 15:38:19 llm_engine.py:275] # GPU blocks: 18773, # CPU blocks: 9362
INFO 05-18 15:38:22 model_runner.py:501] Capturing the model for CUDA graphs. This may lead to unexpected consequences if the model is not static. To run the model in eager mode, set 'enforce_eager=True' or use '--enforce-eager' in the CLI.
INFO 05-18 15:38:22 model_runner.py:505] CUDA graphs can take additional 1~3 GiB memory per GPU. If you are running out of memory, consider decreasing `gpu_memory_utilization` or enforcing eager mode.
INFO 05-18 15:38:26 model_runner.py:547] Graph capturing finished in 4 secs.
INFO:     Started server process [99226]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)
INFO:     127.0.0.1:40436 - "GET / HTTP/1.1" 404 Not Found
INFO:     127.0.0.1:40436 - "GET /favicon.ico HTTP/1.1" 404 Not Found

本文标签：开源学习笔记项目 LangChain chatchat

版权声明：本文标题：[开源项目学习]langchain-chatchat学习笔记3 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1726826127a1086099.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

2024考研408-操作系统第三章-内存管理学习笔记

1天前

文章目录一、内存管理基础1.1、内存的基础知识1.1.1、什么是内存？有何作用？1.1.2、进程运行的基本原理1.1.2.1、指令的工作原理1.1.2.2、理解逻辑地址与物理地址1.1.2.3、

Makefile学习笔记19|u-boot顶层Makefile05

1天前

Makefile学习笔记19|u-boot顶层Makefile05 希望看到这篇文章的朋友能在评论区留下宝贵的建议来让我们共同成长，谢谢。这里是目录定义常见构建工具变量 # Make variables (CC

ssh框架学习笔记

1天前

黑马程序员ssh框架视频笔记，版权原作者所有，侵立删文章目录 Hibernate_day01Hibernate课程安排今天内容介绍WEB内容回顾JavaEE三层结构MVC思想 Hibernate

Web前端学习笔记——VueJS之组件、路由

1天前

定义Vue组件什么是组件： 组件的出现，就是为了拆分Vue实例的代码量的，能够让我们以不同的组件，来划分不同的功能模块，将来我

探索语音技术的未来：Microsoft Cognitive Services Speech SDK 示例项目

1天前

探索语音技术的未来：Microsoft Cognitive Services Speech SDK 示例项目 cognitive-services-speech-sdkSample code for the Micro

探索神经科学的奥秘：Computational Cognitive Neuroscience Simulations 开源项目推介

1天前

探索神经科学的奥秘：Computational Cognitive Neuroscience Simulations 开源项目推介在科学技术日益发展的今天，对神经科学的研究不仅停留在理论层面&

手机浏览器查看vue项目

1天前

在手机浏览器上面我们可以直接查看vue项目。在有网的条件下，我们使用指令npm run serve启动一个项目，会出现两个网址，一个是本地的，一个是网络

vue手机端项目中怎么禁止手机浏览器默认的左滑返回上一页

1天前

前天测试提了一个需求, 就是我们这个手机端项目在手机浏览器中打开, 有默认的左滑返回上一页的功能, 就是点击按钮进到下一个页面后 , 在屏幕上左滑会返回上一个页面 , 测试说希望把这个默认的功能去掉 , 让用户通过页面的返回按钮返回 , 赶

ionic学习（十）：ionic3项目打包成手机浏览器、安卓apk项目

1天前

主要目的：将ionic项目打包成手机浏览器的项目，可以测试扫描二维码等手机可用的功能。步骤： 1. 添加浏览器打包环境 ionic cordova platform

从React和React Native中学习Facebook在开源项目中的行为准则【code of conduct】

1天前

作为程序员, 在开发工作中难免会遇到一些问题或分歧，本文是一篇关于facebook公司对参与社区活动中的行为准则(code of conduct)的译文，希望大家都能够互相尊重和理解&#x

开源项目指南：Sindre Sorhus 的 conduct

1天前

开源项目指南：Sindre Sorhus 的 conduct conduct🖖 Generate a Code of Conduct for your project项目地址:https:g

学习笔记96—WIN7WIN8WIN10 安装 MSDE SQL2000 卡住不动的解决办法

1天前

金蝶KIS专业版安装数据库msde时提示还有2秒就不动了 KIS专业版安装数据库msde时提示还有2秒（或者是其它的秒数）就不动了，如下图： Windo

项目二任务二认识Linux的文件系统

21小时前

【任务实施】为了简化此任务的学习，我们通过下面的5个子任务的学习来达到我们的目的。【子任务一】熟悉Linux系统中的目录结构【子任务二】了解Linux系统中的路径规则【子任务三】掌握Linux系统中的基本命令【子

【学习笔记】jvm

11小时前

jvm 视频教程网址黑马程序员JVM完整教程，全网超高评价，全程干货不拖沓_哔哩哔哩_bilibili 文章目录 jvm一，jvm的概念二，jvm的内

Git 学习笔记——莫烦PYTHON

6小时前

Git 学习笔记——莫烦PYTHON 一、Git 相关介绍1.1 为什么要使用Git？什么时候需要用Git？什么文献可以被Git管理？什么文件不能被Git管理&#xf

Git版本控制学习笔记

6小时前

特别感谢向军大叔的B站视频分享《GIT版本控制从入门到实战》和后盾人网站上的GIT课程学习使用手册，在这里我会按照他的视频课程进行笔记记录，供自己或其他小伙伴们学习巩固。学习不得朝三暮四&

j-hi项目及应用说明

6小时前

http:blog.csdngangbalisunarticledetails7937807 k 目录(?)[] [置顶]J-Hi Lookup实现级联下拉的效果描述：在DWZ版中lookup的处理机制与

SAP学习笔记

6小时前

SAP读书笔记 Pfcg Su53 查看权限对象 st01 跟踪 St22 看dump，以分析错误 eg.找到ABAP程序出错的地方，找出founction，用se37查看找

【GIMP】免费开源图像处理软件

3小时前

【GIMP】免费开源图像处理软件原文链接：https:blog.csdnyuetaopearticledetails120449121 GIMP是GNU Image Manipulation Progr

阿里Qwen2-72B大模型已是开源榜的王者，为什么还要推出其他参数模型，被其他模型打榜？

5分钟前

6 月 27 日，全球知名的开源平台 Hugging Face 的联合创始人兼首席执行官 Clem 在社交平台激动宣布，阿里 Qwen2-72B 成为了开源模型排行榜的王者。这是一件大好事&am

电子爱好者 - 最新技术资讯及电子产品介绍！

[开源项目学习]langchain-chatchat学习笔记3

文章目录

fastchat

去看看源代码

如何终止服务

fastchat的封装解析

vllm

更多相关文章

2024考研408-操作系统 第三章-内存管理 学习笔记

Makefile学习笔记19|u-boot顶层Makefile05

ssh框架学习笔记

Web前端学习笔记——VueJS之组件、路由

探索语音技术的未来：Microsoft Cognitive Services Speech SDK 示例项目

**探索神经科学的奥秘：Computational Cognitive Neuroscience Simulations 开源项目推介**

手机浏览器查看vue项目

vue手机端项目中怎么禁止手机浏览器默认的左滑返回上一页

ionic学习（十）：ionic3项目打包成手机浏览器、安卓apk项目

从React和React Native中学习Facebook在开源项目中的行为准则【code of conduct】

开源项目指南：Sindre Sorhus 的 conduct

学习笔记96—WIN7WIN8WIN10 安装 MSDE SQL2000 卡住不动的解决办法

项目二任务二 认识Linux的文件系统

【学习笔记】jvm

Git 学习笔记——莫烦PYTHON

Git版本控制学习笔记

j-hi项目及应用说明

SAP学习笔记

【GIMP】免费开源图像处理软件

阿里Qwen2-72B大模型已是开源榜的王者，为什么还要推出其他参数模型，被其他模型打榜？

发表评论

推荐文章

Testing: Conduct search engine discoveryreconnaissance for information leakage (OTG-INFO-001)

云服务器40G50G云硬盘够用吗？

谷歌浏览器安装（Win、Linux、离线安装）

164万年后的日期解析引发的OOM

“元宇宙”，究竟离我们有多远？（下）

热门文章

科大讯飞 SDK 安装梳理

windows和linux访问光盘的区别,linux下挂载光盘镜像文件、移动硬盘、U盘、Windows和NFS网络共享分类...

云服务器环境搭建

Oracle删除后，重装方案有哪些？删除后重装出错？多次安装后出错？如何完全删除Oracle？

打开共享计算机很慢,局域网中,查看一台电脑的共享文件夹,打开很慢(电脑达人进)...

win10共享打印错误0x0000006_win7打印机共享出现0x000006d9错误的解决方法

两个port贴合七夕主题，百度输入法的“情感营销”策略

CodeReview规范

【资源分享】官网runwaymlstable-diffusion-v1-5下载太慢？完整资源分享

【RStudio】【安装&amp;卸载程序包】【四种方法】

最新文章

FL2440(S3C2440A 芯片) 开发板开发笔记

java开发环境搭建

堡垒机(运维审计系统) 干什么的? 看完你就懂了

编程好书推荐

计算机基础基础习题

【题目】【信息安全管理与评估】2018年全国职业院校技能大赛高职组信息安全管理与评估样题

Window基础（黑客基础）

flstudio20.8.3.2293水果软件最新中文语言版本

小android模拟器,小姚Android模拟器工作室版本v6.2.7.0正式版

Android 开发环境搭建

基于android的摆摊进货app

黑盒测试方法

21页报告揭秘华为鸿蒙OS，七年沉淀、称霸5G+IoT时代的野心 | 附下载

个人台式计算机上常用的操作系统,几个常用的操作系统简介

windows7 的新功能!

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

2024考研408-操作系统第三章-内存管理学习笔记

探索神经科学的奥秘：Computational Cognitive Neuroscience Simulations 开源项目推介

项目二任务二认识Linux的文件系统

【RStudio】【安装&卸载程序包】【四种方法】

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载