【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&效果评测|电子爱好者

admin管理员组
文章数量:1612389

【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&效果评测

文章目录

【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&效果评测
禅与计算机程序设计艺术：评测结论 —— AquilaChat 在写作水平上跟ChatGLM-6B差不多，但是 AquilaChat 多编程语言写代码能力还是比较弱。。
- - 输入：
  - 输出：
  - 输入：
  - 报错输出：
AquilaChat 快速开始
- 环境依赖安装
- 安装相关依赖
- 具体使用方式 / How to use
- - Fork 源代码:
  - 1. 推理/Inference
  - 效果测试
  - - 输入1:
    - 输出1:
  - 输入2：
  - 输出2：
  - 2. 可监督微调/Supervised Fine-tuning(SFT)
  - - Step 1: 配置模型/ Setup Checkpoints
    - Step 2: 修改参数/ Modify Parameters
    - Step 3: 启动可监督微调/Start SFT
- AquilaChat 简介 / AquilaChat Overview
- Aquila 模型细节 / Aquila Model details
- 训练数据集/Training data
- 证书/License

禅与计算机程序设计艺术：评测结论 —— AquilaChat 在写作水平上跟ChatGLM-6B差不多，但是 AquilaChat 多编程语言写代码能力还是比较弱。。

AquilaChat 写代码水平还不行（应该是代码数据集训练不够），问技术性问题（比如说：用golang实现冒泡排序算法）会有一定的概率报错：

 File "/home/me/ai/FlagAI/flagai/model/predictor/aquila.py", line 41, in aquila_generate
    next_token = sample_top_p(probs, top_p)
  File "/home/me/ai/FlagAI/flagai/model/predictor/aquila.py", line 84, in sample_top_p
    next_token = torch.multinomial(probs_sort, num_samples=1)
RuntimeError: probability tensor contains either `inf`, `nan` or element &

本文标签：人工智能上手开源实战模型

版权声明：本文标题：【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&效果评测内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728632168a1167203.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

企业开展开源安全治理必要性及可行性详细分析

1天前

所以，长期来看随着企业应用的开源软件越来越多，这些开源软件的安全漏洞在黑灰产攻击者的利益驱使下会以更快的速度和更高的频率被曝出，进而使得开源软件的安全威胁成为企业面临的主要威

【实战】SpringBoot对接外部API并一步一步性能调优

1天前

需求分析： 本平台对接某某平台的接口，保证接口的稳定性和安全性实战： 首先我们初始化一个Demo，SpringBoot初始化教程略&#x

告别 CentOS，开源操作系统与时代同步更需“根”的力量

1天前

编者按：从云计算到人工智能，时代在变，技术在变，业务也在变，服务器操作系统在守住基础软件底线的同时，也要求新

LLM 大模型学习必知必会系列(十二)：VLLM性能飞跃部署实践：从推理加速到高效部署的全方位优化[更多内容：XInferenceFastChat等框架]

1天前

LLM 大模型学习必知必会系列(十二)：VLLM性能飞跃部署实践：从推理加速到高效部署的全方位优化[更多内容：XInferenceFastChat等框架] 训练后的模型会用于推理或者部署。推理即使用模型用输入获得输出的过程，部署是将模型

一文了解IMU原理、误差模型、标定、惯性传感器选型以及IMU产品调研(含IMU、AHRS、VRU和INS区别)

1天前

在此记录一下测试IMU过程中的其它文章，便于以后查看： IMU的误差标定以及姿态解算ROS下通过USB端口读取摄像头数据(包括笔记本自带摄像头)激光、摄像头、IMU等传感器数据同步方法(messa

第十七章模型压缩及移动端部署

1天前

Markdown Revision 1;Date: 2018114Editor: 谈继勇Contact: scutjy2015163updata:贵州大学硕士张达峰 17.1 为什么需要模型压缩和加速？

我的模型有多快？——深度学习网络模型的运算复杂度、空间占用和内存访问情况计算

1天前

前段时间看了几个笔试题，涉及模型复杂度，主要是参数量和计算复杂度的问题。当时搜了一下感觉中文网上的内容比较乱。刚好本文是对神经网络模型资源消耗情况的一篇介绍，就不自己写了&a

AI公开课：18.05.05 施尧耘(阿里云量子技术CS)—清华AI第四讲之《人工智能与量子计算》Quantum课堂笔记——带你了解量子计算

1天前

AI公开课：18.05.05 施尧耘(阿里云量子技术CS)—清华AI第四讲之《人工智能与量子计算》Quantum课堂笔记——带你了解量子计算导读清华大学“人工智能前沿与产业趋势”系列讲座的第四讲。由阿里云量子技术首

Pytorch 中文语言模型（BertRoberta）进一步预训练（further pretrain）

1天前

Pytorch 中文语言模型（BertRoberta）进一步预训练（further pretrain） 1.Motivation2.相关链接3. 具体步骤3.1 依赖项3.2 数据格式3.3 代码运行4. 结果4.1 完整的目录结构4.2

《异常检测——从经典算法到深度学习》26 Time-LLM：基于大语言模型的时间序列预测

1天前

《异常检测——从经典算法到深度学习》 0 概论1 基于隔离森林的异常检测算法 2 基于LOF的异常检测算法3 基于One-Class SVM的异常检测算法4 基于高斯概率密度异常检测算法5 Opprentice——异常检测经典算法最终篇6

【linux高性能服务器编程】项目实战——仿QQ聊天程序源码剖析

1天前

hello ！大家好呀！ 欢迎大家来到我的Linux高性能服务器编程系列之项目实战——仿QQ聊天程序源码剖析，在这篇文章中，你将会学习到如何利用Linu

机器学习的可解释性：黑盒vs白盒（内附开源学习书） | Deep Reading

18小时前

点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」7折优惠最后2天，请扫码咨询 ↑↑↑ 作者 | Lars Hulstaert 译者 | Linstancy 责编 | Jane 出品 | AI科技大本营&

安装opensuse的笔记-重庆linux开源组织

17小时前

mate: 伙伴 matey: 融洽的, 易于亲近的. get matey with sb. poison: a. 有毒的, n.毒药毒酒v. 下毒, 破坏, 污染 slander [ 撕烂的~~], n. 中伤,诽谤, v. 诽谤 sl

虚拟机Hadoop实战（一）概念总览

17小时前

系统太大，大到完全没有头绪，大到网上一堆培训班。硬骨头还是要啃，之前一直怕自己电脑跑这么多虚拟机跑不下，要不要买几台廉价电脑拼一起呢&#xff

C#按键精灵实战：低级鼠标键盘Hook、XML脚本解析、DLL编写

16小时前

本文还有配套的精品资源，点击获取简介：C#按键精灵是一种用于自动化键盘和鼠标操作的实用技术，广泛应用于游戏自动化、自动化测试等领域。本项目将深入解析按键精灵的实现原理&

《机器学习实战》：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xae in position 199: illegal multibyte

11小时前

问题引入 UnicodeDecodeError: gbk codec cant decode byte 0xff in position 0: illegal multibyte sequence这样的错误估计大家都不陌生。我也是被这种错

Unity中使模型旋转getAxis与GetTouch(0).deltaPosition

10小时前

Unity中使模型旋转getAxis与GetTouch(0).deltaPosition 在unity，ARFoundation中让cube随手指x,y方向移动而旋转。一开始使用的Input.getAxis(“Mo

一文通透Text Embedding模型：从text2vec、openai-text embedding到m3e、bge

3小时前

前言本文已经是今年的第31篇大模型相关的技术文章了，如果说半年之前写博客，更多是出于个人兴趣读者需要那自我司于23年Q3组建LLM项目团队之后，写博客就成了&am

从LongLoRA到LongQLoRA(含源码剖析)：超长上下文大模型的高效微调方法

3小时前

前言本文一开始是《七月论文审稿GPT第2版：用一万多条paper-review数据集微调LLaMA2最终反超GPT4》中4.3节的内容，但考虑到一方面，LongLor

Java 之父：找Bug最浪费时间，现在不是开源的黄金时代！

34秒前

【CSDN 编者按】在编程工作或是学习中，你最头疼的是什么？你知道吗，Java之父也很讨厌Bug，最让他头疼的事情是数值分析。然而&#xff0c

电子爱好者 - 最新技术资讯及电子产品介绍！

【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&amp;效果评测

【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&效果评测

文章目录

禅与计算机程序设计艺术：评测结论 —— AquilaChat 在写作水平上跟ChatGLM-6B差不多，但是 AquilaChat 多编程语言写代码能力还是比较弱。。

更多相关文章

企业开展开源安全治理必要性及可行性详细分析

【实战】SpringBoot对接外部API并一步一步性能调优

告别 CentOS，开源操作系统与时代同步更需“根”的力量

LLM 大模型学习必知必会系列(十二)：VLLM性能飞跃部署实践：从推理加速到高效部署的全方位优化[更多内容：XInferenceFastChat等框架]

一文了解IMU原理、误差模型、标定、惯性传感器选型以及IMU产品调研(含IMU、AHRS、VRU和INS区别)

第十七章 模型压缩及移动端部署

我的模型有多快？——深度学习网络模型的运算复杂度、空间占用和内存访问情况计算

AI公开课：18.05.05 施尧耘(阿里云量子技术CS)—清华AI第四讲之《人工智能与量子计算》Quantum课堂笔记——带你了解量子计算

Pytorch 中文语言模型（BertRoberta）进一步预训练（further pretrain）

《异常检测——从经典算法到深度学习》26 Time-LLM：基于大语言模型的时间序列预测

【linux高性能服务器编程】项目实战——仿QQ聊天程序源码剖析

机器学习的可解释性：黑盒vs白盒（内附开源学习书） | Deep Reading

安装opensuse的笔记-重庆linux开源组织

虚拟机Hadoop实战（一）概念总览

C#按键精灵实战：低级鼠标键盘Hook、XML脚本解析、DLL编写

《机器学习实战》：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xae in position 199: illegal multibyte

Unity中使模型旋转getAxis与GetTouch(0).deltaPosition

一文通透Text Embedding模型：从text2vec、openai-text embedding到m3e、bge

从LongLoRA到LongQLoRA(含源码剖析)：超长上下文大模型的高效微调方法

Java 之父：找Bug最浪费时间，现在不是开源的黄金时代！

发表评论

推荐文章

关于C++中delete释放内存时效性问题

研【生活】【Paper】计算机视觉会议投稿日历+RSS订阅

如何明智选择数据库平台

DB2 BLU acceleration fundamental

计算机视觉基础5——本质矩阵与基本矩阵(Essential and Fundamental Matrices)

热门文章

bps和Bs的区别，暨各种主机接口的WIFI透传模块实际透传速度的评估姿势

Error parsing HTTP request header Note: further occurrences of HTTP header p

做淘淘商城第二天报的错 java.net.ConnectException: Connection refused: no further information

Excel最强玩法！用Excel做“动态日历表”，让你的好记性更牢固！

现代大学英语精读第二版（第一册）学习笔记（原文及全文翻译）——13A - The Greatest Invention（最伟大的发明）

ubuntu设置自动关机

解决pytorch DataLoader 加载数据报错UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xe5 in position 1023

[unity]计算子节点到父节点的长度不能使用子节点的localPosition的长度来计算

为什么电脑用久了，就算重新安装系统也会变得很慢？

Problem H. Curious （莫比乌斯反演）

最新文章

Java 之父：找Bug最浪费时间，现在不是开源的黄金时代！

从游戏机、计算机、智能手机的过去五十年 看VR和AR的未来五十年

MATLAB 被禁点燃导火索，国产软件路在何方？

青蛙设计首席创意执行官：一切都是为了创新

android手机变windows8,你真没有看错！Android手机一秒变Win10

【开源软件开发导论作业-1】

信息技术导论 第四章 云计算 笔记

千万别再瞎招人了

[SSD NAND 2.2] 存储历史（从古老的绳子记忆到如今）

山东大学软件学院网络攻击与防范2022-2023林丰波100词详解

到美国去，挣美元!

Xiph.Org基金会 —— 多媒体开源的先锋

基于java的土地档案管理系统设计与实现(项目报告+答辩PPT+源代码+数据库+部署视频)

Linux学习-01-Linux介绍

windows和linux服务器哪个好？有哪些区别？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【人工智能】国产开源大模型聊天 AquilaChat 快速开始上手实战&效果评测

第十七章模型压缩及移动端部署

从游戏机、计算机、智能手机的过去五十年看VR和AR的未来五十年

信息技术导论第四章云计算笔记

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载