【chatglm3】(4):如何设计一个知识库问答系统,参考智谱AI的知识库系统,

编程入门 行业动态 更新时间:2024-10-07 20:36:43

【chatglm3】(4):如何设计一个<a href=https://www.elefans.com/category/jswz/34/1768615.html style=知识库问答系统,参考智谱AI的知识库系统,"/>

【chatglm3】(4):如何设计一个知识库问答系统,参考智谱AI的知识库系统,

0,视频地址

/?vd_source=4b290247452adda4e56d84b659b0c8a2

【chatglm3】(4):如何设计一个知识库问答系统,参考智谱AI的知识库系统,学习设计理念,开源组件

1,知识库项目地址


知识配置:

2,系统原理参考

项目地址是:

gitee搬运的项目:


文档流程:

3,涉及系统开发

智谱AI大模型接口:

4,向量数据库

名称开源社区星语言说明
weaviate5.3k starGo同时支持向量与对象的存储、支持向量检索与结构化过滤、具备主流模式成熟的使用案例。高速、灵活,不仅仅具备向量检索,还会支持推荐、总结等能力
qdrant6.3k starRust向量存储与检索、云原生、分布式、支持过滤、丰富的数据类型、WAL日志写入
milvus17.7k starGo极高的检索性能: 万亿矢量数据集的毫秒级搜索非结构化数据的极简管理丰富的API跨平台实时搜索和分析可靠:具有很高的容灾与故障转移能力高度可拓展与弹性支持混合检索统一的Lambda架构社区支持、行业认可。

milvus 向量数据库可以研究下:

/

可以使用docker 进行项目部署
.md

5,开源模型 Embeddings

Text2vec文本表征及相似度计算:包括text2vec-large-chinese(LERT,升级版)、base(CoSENT方法训练,MacBERT)两个模型。这个模型也使用了word2vec(基于腾讯的800万中文词训练)、SBERT(Sentence-BERT)、CoSENT(Cosine Sentence)三种表示方法训练

百度的 ernie-3.0-base-zh:
SimCSE:
M3E:Moka Massive Mixed Embedding的缩写,由MokaAI训练,训练脚本使用 uniem,评测BenchMark使用MTEB-zh,通过千万级 (2200w+) 的中文句对数据集进行训练。

6,总结

通过大语言模型快速搭建本地知识库系统。
将本地数据知识结合业务场景应用。非常不错的事情。
最重要的是转换格式,做 embedding ,然后存储到向量数据库中。

更多推荐

【chatglm3】(4):如何设计一个知识库问答系统,参考智谱AI的知识库系统,

本文发布于:2024-02-19 14:54:33,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1764725.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:知识库   系统   问答   AI

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!