快速搭建ChatGPT|电子爱好者

admin管理员组
文章数量:1667057

快速搭建ChatGPT

最近了解到高性能应用服务HAI,可以快速体验ChatGLM这款新型对话模型. 现在跟着我的节奏一起实现自己的gpt服务吧!

简单使用gpt

搭建自己的gpt

正文开始

申请高性能应用服务 HAI
- 点击链接进入高性能应用服务 HAI
  - 申请体验资格
- 等待审核通过后，进入高性能应用服务 HAI
  - 点击新建
- 选择配置
  - 温馨提示：如果没有进阶型的算力方案（2.41元/小时），建议您购买基础型的算力方案（0.88元/小时），并在创建成功后参考实验过程中关闭、重新开启 webui 功能的命令，以提高服务器的性能，加速您完成实验的体验！
  - 等待创建完成(预计等待3-8分钟，等待时间不计费)
- 创建完成查看相关状态
- 选择chatglm2_gradio进入WebUI页面
- 启动高性能应用服务HAI配置的ChatGLM2-6B WebUI进行简单的对话

高性能应用服务HAI快速为开发者提供ChatGLM2-6B API服务

在算力管理页面，选择进入jupyter_lab页面 !
选择终端命令
温馨提示：如果您购买使用的是基础型算力服务器（0.88元/小时）请您在开始实验前输入以下关闭 webui 功能的命令，提高服务器的性能，以便后续实验能快速正常进行：
安装软件和关闭webui服务

   apt-get update && apt-get install sudo
   sudo apt-get update  
   sudo apt-get install psmisc
   sudo fuser -k 6889/tcp #执行这条命令将关闭 HAI提供的 chatglm2_gradio webui功能
   pip install aiohttp

如果需要重新开启 webui 服务执行以下命令：

python /root/ChatGLM2-6B/web_demo.py --listen --port 6889

打开右边文件夹下的openai_api.py文件
如果直接使用会在调用时报错，复制以下openai_api.py代码直接覆盖源文件并Ctrl+S保存代码

  # coding=utf-8
  # Implements API for ChatGLM2-6B in OpenAI's format. (https://platform.openai/docs/api-reference/chat)
  # Usage: python openai_api.py
  # Visit http://localhost:8000/docs for documents.
       
  import time
  import torch
  import uvicorn
  from pydantic import BaseModel, Field
  from fastapi import FastAPI, HTTPException
  from fastapi.middleware.cors import CORSMiddleware
  from contextlib import asynccontextmanager
  from typing import Any, Dict, List, Literal, Optional, Union
  from transformers import AutoTokenizer, AutoModel
  from sse_starlette.sse import ServerSentEvent, EventSourceResponse
       
       
  @asynccontextmanager
  async def lifespan(app: FastAPI): # collects GPU memory
  yield
  if torch.cuda.is_available():
  torch.cuda.empty_cache()
  torch.cuda.ipc_collect()
       
       
  app = FastAPI(lifespan=lifespan)
       
  app.add_middleware(
  CORSMiddleware,
  allow_origins=["*"],
  allow_credentials=True,
  allow_methods=["*"],
  allow_headers=["*"],
  )
       
  class ModelCard(BaseModel):
  id: str
  object: str = "model"
  created: int = Field(default_factory=lambda: int(time.time()))
  owned_by: str = "owner"
  root: Optional[str] = None
  parent: Optional[str] = None
  permission: Optional[list] = None
       
       
  class ModelList(BaseModel):
  object: str = "list"
  data: List[ModelCard] = []
       
       
  class ChatMessage(BaseModel):
  role: Literal["user", "assistant", "system"]
  content: str
       
       
  class DeltaMessage(BaseModel):
  role: Optional[Literal["user", "assistant", "system"]] = None
  content: Optional[str] = None
       
       
  class ChatCompletionRequest(BaseModel):
  model: str
  messages: List[ChatMessage]
  temperature: Optional[float] = None
  top_p: Optional[float] = None
  max_length: Optional[int] = None
  stream: Optional[bool] = False
       
       
  class ChatCompletionResponseChoice(BaseModel):
  index: int
  message: ChatMessage
  finish_reason: Literal["stop", "length"]
       
       
  class ChatCompletionResponseStreamChoice(BaseModel):
  index: int
  delta: DeltaMessage
  finish_reason: Optional[Literal["stop", "length"]]
       
       
  class ChatCompletionResponse(BaseModel):
  model: str
  object: Literal["chatpletion", "chatpletion.chunk"]
  choices: List[Union[ChatCompletionResponseChoice, ChatCompletionResponseStreamChoice]]
  created: Optional[int] = Field(default_factory=lambda: int(time.time()))
       
       
  @app.get("/v1/models", response_model=ModelList)
  async def list_models():
  global model_args
  model_card = ModelCard(id="gpt-3.5-turbo")
  return ModelList(data=[model_card])
       
       
  @app.post("/v1/chat/completions", response_model=ChatCompletionResponse)
  async def create_chat_completion(request: ChatCompletionRequest):
  global model, tokenizer
       
      if request.messages[-1].role != "user":
          raise HTTPException(status_code=400, detail="Invalid request")
      query = request.messages[-1].content
       
      prev_messages = request.messages[:-1]
      if len(prev_messages) > 0 and prev_messages[0].role == "system":
          query = prev_messages.pop(0).content + query
       
      history = []
      if len(prev_messages) % 2 == 0:
          for i in range(0, len(prev_messages), 2):
              if prev_messages[i].role == "user" and prev_messages[i+1].role == "assistant":
                  history.append([prev_messages[i].content, prev_messages[i+1].content])
       
      if request.stream:
          generate = predict(query, history, request.model)
          return EventSourceResponse(generate, media_type="text/event-stream")
       
      response, _ = model.chat(tokenizer, query, history=history)
      choice_data = ChatCompletionResponseChoice(
          index=0,
          message=ChatMessage(role="assistant", content=response),
          finish_reason="stop"
      )
       
      return ChatCompletionResponse(model=request.model, choices=[choice_data], object="chatpletion")
       
       
  async def predict(query: str, history: List[List[str]], model_id: str):
  global model, tokenizer
       
      choice_data = ChatCompletionResponseStreamChoice(
          index=0,
          delta=DeltaMessage(role="assistant"),
          finish_reason=None
      )
      chunk = ChatCompletionResponse(model=model_id, choices=[choice_data], object="chatpletion.chunk")
      #yield "{}".format(chunk.json(exclude_unset=True, ensure_ascii=False))
      yield "{}".format(chunk.model_dump_json(exclude_unset=True))
       
      current_length = 0
       
      for new_response, _ in model.stream_chat(tokenizer, query, history):
          if len(new_response) == current_length:
              continue
       
          new_text = new_response[current_length:]
          current_length = len(new_response)
       
          choice_data = ChatCompletionResponseStreamChoice(
              index=0,
              delta=DeltaMessage(content=new_text),
              finish_reason=None
          )
          chunk = ChatCompletionResponse(model=model_id, choices=[choice_data], object="chatpletion.chunk")
          #yield "{}".format(chunk.json(exclude_unset=True, ensure_ascii=False))
          yield "{}".format(chunk.model_dump_json(exclude_unset=True))
       
      choice_data = ChatCompletionResponseStreamChoice(
          index=0,
          delta=DeltaMessage(),
          finish_reason="stop"
      )
      chunk = ChatCompletionResponse(model=model_id, choices=[choice_data], object="chatpletion.chunk")
      #yield "{}".format(chunk.json(exclude_unset=True, ensure_ascii=False))
      yield "{}".format(chunk.model_dump_json(exclude_unset=True))
      yield '[DONE]'
       
       
       
  if __name__ == "__main__":
  tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", revision="v1.0", trust_remote_code=True)
  model = AutoModel.from_pretrained("THUDM/chatglm2-6b", revision="v1.0", trust_remote_code=True).cuda()
  # 多显卡支持，使用下面两行代替上面一行，将num_gpus改为你实际的显卡数量
  # from utils import load_model_on_gpus
  # model = load_model_on_gpus("THUDM/chatglm2-6b", num_gpus=2)
  model.eval()
       
      uvicorn.run(app, host='0.0.0.0', port=8000, workers=1)

服务端开启服务：
```
python openai_api.py
```
使用Cloud Studio快速创建
应用推荐下的ChatGPT Next Web开源项目
选择Fork
等待数秒后，工作空间创建完毕
Fork完成后，选择.env.template文件
修改配置信息： CODE为空 PROXY_URL和BASE_URL为你的服务器地址和端口
修改文件后缀名为.env
安装依赖
```
npm install
```
依赖安装完成后，输入命令开启服务
```
yarn run
```
- 点击端口，可使用浏览器或标签页两种方式运行项目
web浏览器测试：
- 服务端可查看相关的请求记录
不用了记得及时停止Cloud Studio工作空间服务和关闭HAI服务!

全文结束!

快去尝试一下吧,欢迎评论留言!

本文标签：快速 chatGPT

版权声明：本文标题：快速搭建ChatGPT 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1730083056a1222118.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

ChatGPT常见错误解决和封号情形说明

2小时前

1、ChatGPT国内能用吗？ 答：ChatGPT官网国内IP不能（包括港澳台），最好用美国IP，所以需要

可使用ChatGPT，可使用一键视频去除水印，有这免费的app就够用了

2小时前

大家好，我是小凉席，这款APP是我在大学期间试着做着玩的一款工具合集APP 本来是想做着玩的，可是越做用户越多，直到现在群里那么多朋友支持&#

uniapp+springboot搭建一个简单的ChatGpt项目

2小时前

1.项目介绍本项目是新手程序员在工作闲暇之余写的一个项目， 先放效果图，比较简陋前端前端使用UNIAPP，优点是可以根据需要打包成APP，或

十分钟教你搭建类似ChatGPT的安卓应用程序

2小时前

大家好，我是易安！ Chat GPT 是当今著名的人工智能工具，就像聊天机器人一样。Chat GPT会回答发送给它的所有查询。今天，我将通过集成 Ope

ChatGPT涉及的法律风险综述

2小时前

ChatGPT（Chat Generative Pre-trained Transformer），是OpenAI研发的聊天机器人程序，于2022年11月

chatgpt无法发送消息，但是可以打开，控制台报_app-7482b08f82a59f30.js:1 Uncaught (in promise) l {revert: undefined, sil

2小时前

一、解决方法界面刷新下

重磅!阿里版本【ChatGPT】开放测评！

2小时前

前两天突然爆出惊人消息：阿里版ChatGPT开放测评了！ 在本月初，已经有诸多关于阿里巴巴即将推出类似ChatGPT产品的传闻。数日前，首批曝光的天猫

ChatGPT使用的SSE技术是什么？

2小时前

在现代web应用程序中，实时通信变得越来越重要。HTTP协议的传统请求响应模式总是需要定期进行轮询以获得最新的数据，这种方式效率低下并且浪费资源。因此，出现了一些新的通信技

最近大火的ChatGPT到底是什么？为什么这么受欢迎？

2小时前

ChatGPT是一种全新聊天机器人软件，全名：Chat Generative Pre-Trained Transformer。 OpenAI于去年11月30日发布，上线不过2

SpringBoot（SpringAI）高仿Chatgpt实现聊天

2小时前

前言本篇文章介绍的是最新SpringAI 1.0.0-M1 通过openai模型实现的一个高仿chatgpt聊天的程序，即使你是普通的大学生也能懂。因为实现不需要网络开代理，普通国内网就可以实

chatgpt-web-midjourney-proxy 教程

2小时前

chatgpt-web-midjourney-proxy 教程 chatgpt-web-midjourney-proxychatgpt web, midjourney, gpts 一套ui全搞定项目地址:https:gitcodegh

ChatGPT插件开发指南：扩展AI助手的能力

2小时前

ChatGPT插件开发指南：扩展AI助手的能力引言 ChatGPT插件是一项革命性的技术，它允许开发者将第三方应用程序和服务与ChatGPT集成，从而大大扩展了AI助手

用ChatGPT做嵌入式应用开发

2小时前

ChatGPT是一种基于自然语言处理技术的人工智能模型，由OpenAI团队开发的。它基于大规模的语言数据集进行训练，并可以生成高质量的自然语言文本，包括对话、摘要、翻译等多种

ChatGPT热中的冷思考

2小时前

欢迎关注博主 Mindtechnist 或加入【Linux CCPython社区】一起学习和分享Linux、C、C、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法&am

从零开始：如何用Electron将chatgpt-plus.top 打包成EXE文件

2小时前

文章目录从零开始：如何用Electron将chatgpt-plus.top 打包成EXE文件准备工作：Node.js和npm国内镜像加速下载初始化你的Electron项目创建你的Electron

微信小程序 |做一款跟ChatGPT下五指棋的小程序

2小时前

一、写在前面敢问世间万物，何以解忧？时下最为火爆的ChatGPT想必够资格来回答一下这个问题。要想当年AlphaGO打败世界围棋高手李世石，就展露出AI的惊人实力，时隔多年，AI领域在憋了这么多年之后，现如今，ChatGPT 4

微信小程序 | 基于ChatGPT实现电影推荐小程序

2小时前

文章目录 ** 效果预览 **1、根据电影明星推荐2、根据兴趣标签推荐3、根据电影名推荐一、需求背景二、项目原理及架构2.1 实现原理（1）根据用户的兴趣标签（2）根据关联类似主题的题材（3）根据特定的电影明星2.2 技术架构2.3 技术栈

Azure Chatgpt demo部署——本地CentOS Docker

2小时前

参见上一篇 http:t.csdnimgJcyfM 由于本地部署环境，与之前系统、网络、配置等环境不同，可能会遇见一些新的问题。取2023年8月27日代码 git checkout -

川虎 ChatGPT 开源项目指南

2小时前

川虎 ChatGPT 开源项目指南 ChuanhuChatGPTChuanhuChatGPT - 为多种大型语言模型（LLM）提供一个轻快好用的Web图形界面，并支持多种附加

人工智能；ChatGPT的探索与实践-应用篇

2小时前

这篇文章主要介绍在实际的开发过程当中，如何使用GPT帮助开发，优化流程，文末会介绍如何与618大促实际的业务相结合，来提升应用价值。全是干货&#

电子爱好者 - 最新技术资讯及电子产品介绍！

快速搭建ChatGPT

快速搭建ChatGPT

正文开始

全文结束!

快去尝试一下吧,欢迎评论留言!

更多相关文章

ChatGPT常见错误解决和封号情形说明

可使用ChatGPT，可使用一键视频去除水印，有这免费的app就够用了

uniapp+springboot搭建一个简单的ChatGpt项目

十分钟教你搭建类似ChatGPT的安卓应用程序

ChatGPT涉及的法律风险综述

chatgpt无法发送消息，但是可以打开，控制台报_app-7482b08f82a59f30.js:1 Uncaught (in promise) l {revert: undefined, sil

重磅!阿里版本【ChatGPT】开放测评！

ChatGPT使用的SSE技术是什么？

最近大火的ChatGPT到底是什么？为什么这么受欢迎？

SpringBoot（SpringAI）高仿Chatgpt实现聊天

chatgpt-web-midjourney-proxy 教程

ChatGPT插件开发指南：扩展AI助手的能力

用ChatGPT做嵌入式应用开发

ChatGPT热中的冷思考

从零开始：如何用Electron将chatgpt-plus.top 打包成EXE文件

微信小程序 |做一款跟ChatGPT下五指棋的小程序

微信小程序 | 基于ChatGPT实现电影推荐小程序

Azure Chatgpt demo部署——本地CentOS Docker

川虎 ChatGPT 开源项目指南

人工智能；ChatGPT的探索与实践-应用篇

发表评论

推荐文章

华为鸿蒙即将升级手机,好消息！华为鸿蒙公布首批升级机型名单，看看你的手机在里面吗？...

html静态网站基于游戏网站设计与实现共计10个页面 (仿地下城与勇士游戏网页)

Window10 安装Linux子系统

mysql 安装在路由器_怎么样下载安装并使用MySQL？

Cisco路由器中Telnet, Console, AUX口login命令的含义

热门文章

Qt仿win7自动顶部最大化左侧右侧半屏效果

Mac编译QT程序出现Undefined symbols for architecture x86_64

Solvay conference - 1927

计算机会议排名：Computer Science Conference Rankings- -

freeswitch 会议创建命令

​DrissionPage，Python浏览器自动化又一神器~

CDP和Chrome

如何更改电脑密码？（Windows10为例）

miui系统精简——记录我应用包管理组件无法正常安装的问题

ensp防火墙web密码重置（前提通过console可以登录）

最新文章

ARM内核全解析，从ARM7,ARM9到Cortex-A7,A8,A9,A12,A15到Cortex-A53,A57

Windows 7真的来了，你准备好了吗？

原来AI手机是被CPU卡了脖子

Win11家庭版安装+PE 完结版

Android 手机上能跑 ChromeOS？Google 辟谣：别激动，只是个概念验证！

APP技巧：安卓原生跨屏协同终于来了，还能和 Windows「隔空投送」

Java 环境配置 -- Java 语言的安装、配置、编译与运行

安卓10-终于来了，能吃上的只有这些手机！

windowsphone开发_短短几年彻底惨败 揭秘WindowsPhone究竟做错了什么

分享微软手机无管理服务器,Win10 Mobile手机再体验：没有微信的生态算什么生态？...

首款搭载鸿蒙os的手机,首款搭载鸿蒙OS手机版机型将至 或是已入网的新版华为Mate40 Pro...

智能手机行业的“败者”——Windows Phone

微软还不死心？据说又在开发Windows手机 还更新系统

生成式AIの手机

手机游戏服务端怎么找到_抖音游戏直播怎么开启？如何把手机或者电脑投屏到抖音直播？...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

DrissionPage，Python浏览器自动化又一神器~

windowsphone开发_短短几年彻底惨败揭秘WindowsPhone究竟做错了什么

首款搭载鸿蒙os的手机,首款搭载鸿蒙OS手机版机型将至或是已入网的新版华为Mate40 Pro...

微软还不死心？据说又在开发Windows手机还更新系统

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载