一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成|电子爱好者

admin管理员组
文章数量:1630183

Retrieval-Augmented Generation（RAG）作为机器学习和自然语言处理领域的一大创新，不仅代表了技术的进步，更在实际应用中展示了其惊人的潜力。

RAG结合了检索（Retrieval）和生成（Generation）两大核心技术，通过这种独特的混合机制，能够在处理复杂的查询和生成任务时，提供更加准确、丰富的信息。无论是在回答复杂的问题，还是在创作引人入胜的故事，RAG都展现了其不可小觑的能力。

一、什么是RAG？

检索增强生成（Retrieval Augmented Generation），简称 RAG，已经成为当前最火热的LLM应用方案。它是一个为大模型提供外部知识源的概念，这使它们能够生成准确且符合上下文的答案，同时能够减少模型幻觉。

但是大模型应用于实际业务场景时会发现，通用的基础大模型基本无法满足我们的实际业务需求，主要有以下几方面原因：

知识的局限性：模型自身的知识完全源于它的训练数据，而现有的主流大模型（ChatGPT、文心一言、通义千问…）的训练集基本都是构建于网络公开的数据，对于一些实时性的、非公开的或离线的数据是无法获取到的，这部分知识也就无从具备。
幻觉问题：所有的AI模型的底层原理都是基于数学概率，其模型输出实质上是一系列数值运算，大模型也不例外，所以它有时候会一本正经地胡说八道，尤其是在大模型自身不具备某一方面的知识或不擅长的场景。而这种幻觉问题的区分是比较困难的，因为它要求使用者自身具备相应领域的知识。
数据安全性：对于企业来说，数据安全至关重要，没有企业愿意承担数据泄露的风险，将自身的私域数据上传第三方平台进行训练。这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。
而RAG是解决上述问题的一套有效方案。

二、RAG结构

简单来讲，RAG就是通过检索获取相关的知识并将其融入Prompt，让大模型能够参考相应的知识从而给出合理回答。因此，可以将RAG的核心理解为“检索+生成”，前者主要是利用向量数据库的高效存储和检索能力，召回目标知识；后者则是利用大模型和Prompt工程，将召回的知识合理利用，生成目标答案。

完整的RAG应用流程主要包含两个阶段：

数据准备阶段：数据提取 >> 文本分割 >> 向量化（embedding) >> 数据入库
应用阶段：用户提问 >> 数据检索（召回） >> 注入Prompt >> LLM生成答案

2.1 数据准备阶段

数据准备一般是一个离线的过程，主要是将私域数据向量化后构建索引并存入数据库的过程。主要包括：数据提取、文本分割、向量化、数据入库等环节。

数据提取

数据加载：包括多格式数据加载、不同数据源获取等，根据数据自身情况，将数据处理为同一个范式。
数据处理：包括数据过滤、压缩、格式化等。
元数据获取：提取数据中关键信息，例如文件名、Title、时间等。

文本分割

文本分割主要考虑两个因素：

1）embedding模型的Tokens限制情况；
2）语义完整性对整体的检索效果的影响。

一些常见的文本分割方式如下：

句分割：以”句”的粒度进行切分，保留一个句子的完整语义。常见切分符包括：句号、感叹号、问号、换行符等。
固定长度分割：根据embedding模型的token长度限制，将文本分割为固定长度（例如256/512个tokens），这种切分方式会损失很多语义信息，一般通过在头尾增加一定冗余量来缓解。

向量化（embedding）

向量化是一个将文本数据转化为向量矩阵的过程，该过程会直接影响到后续检索的效果。目前常见的embedding模型如表中所示，这些embedding模型基本能满足大部分需求，但对于特殊场景（例如涉及一些罕见专有词或字等）或者想进一步优化效果，则可以选择开源Embedding模型微调或直接训练适合自己场景的Embedding模型。

数据入库

数据向量化后构建索引，并写入数据库的过程可以概述为数据入库过程，适用于RAG场景的数据库包括：FAISS、Chromadb、ES、milvus等。一般可以根据业务场景、硬件、性能需求等多因素综合考虑，选择合适的数据库。

2.2 应用阶段

在应用阶段，我们根据用户的提问，通过高效的检索方法，召回与提问最相关的知识，并融入Prompt，大模型参考当前提问和相关知识，生成相应的答案。关键环节包括：数据检索、注入Prompt等。

数据检索

常见的数据检索方法包括：相似性检索、全文检索等，根据检索效果，一般可以选择多种检索方式融合，提升召回率。

相似性检索：即计算查询向量与所有存储向量的相似性得分，返回得分高的记录。常见的相似性计算方法包括：余弦相似性、欧氏距离、曼哈顿距离等。
全文检索：全文检索是一种比较经典的检索方式，在数据存入时，通过关键词构建倒排索引；在检索时，通过关键词进行全文检索，找到对应的记录。

注入Prompt

Prompt作为大模型的直接输入，是影响模型输出准确率的关键因素之一。在RAG场景中，Prompt一般包括任务描述、背景知识（检索得到）、任务指令（一般是用户提问）等，根据任务场景和大模型性能，也可以在Prompt中适当加入其他指令优化大模型的输出。一个简单知识问答场景的Prompt如下所示：

【任务描述】假如你是一个专业的客服机器人，请参考【背景知识】，回【背景知识】 {content} // 数据检索得到的相关文本【问题】
石头扫地机器人P10的续航时间是多久？

Prompt的设计只有方法、没有语法，比较依赖于个人经验，在实际应用过程中，往往需要根据大模型的实际输出进行针对

本文标签：一文读懂 RAG Generation Augmented

版权声明：本文标题：一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729069395a1184893.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成

一 、什么是RAG？

二、RAG结构

2.1 数据准备阶段

2.2 应用阶段

更多相关文章

一文带你深入理解【Java基础】 · Java语言概述

全新视角！带你一文读懂ChatGPT！

长期保存数据用什么硬盘安全？硬盘数据丢失怎么解决？一文读懂

一文读懂 hosts 文件

一文带你读懂宽带上下行速率不对称的原因

Win11初始化系统遇一文解决

mac系统如何安装nacos(window系统通用)？详细教程一文解决

一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙系统和hyperos

一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？

一文详解车载以太网的应用现状及未来趋势

一文看尽深度学习中的20种卷积（附源码整理和论文解读）

一文读懂 Linux 各发行版之间的联系和区别

最全Linux的发行版简介，一文读懂各发行版之间的联系和区别

笔记本怎么查看hdmi版本_涨知识丨一文看懂笔记本电脑HDMI接口

一文弄懂Jupyter的配置与使用(呕心沥血版)

一文读懂SIFT算法（英文版）

一文解决Windows系统上的R、Rtools、Rstudio的安装，镜像设置和BiocManager等R包的安装。

一文读懂账号体系产品设计

万字长文 | 一文带你读懂账号体系

一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙系统和hyperos(2)

发表评论

推荐文章

清华镜像安装TensorFlow2.20(windows环境)

社区发现(Community Detection)算法

【调剂】985电子科技大学2020年信息与软件工程学院硕士研究生复试调剂办法（第二批）...

如何选择回归损失函数

firefox BUG --输入法转换时,关闭浏览器. 5555....... 心碎...

热门文章

区块链以及区块链技术入门详解

密码抓取

终于把格式工厂3.3.4集成到Windows Server 2003的PE工具盘了

CC++笔试题

怎么录屏？Windows和Mac电脑都适用的3种方法

java加注释的快捷键是什么_eclipse注释的快捷键是什么？

解决html按键事件与浏览器快捷键ctrl+s冲突问题

在 mac 上 使用idea设置eclipse快捷键 之后ctrl +左键进入类或者方法里，弹出右键功能窗口的解决办法

最好的jQuery Flipbook插件比较（免费和付费）

plsql developer 7.1 出来一段时间了，郁闷是与万能五笔冲突

最新文章

汉字录入计算机是什么时候,电脑汉字录入快速通

计算机专业能报税务师,税务师机考模式下 你会遇到哪些技术层面的难题

九种常用输入法特殊符号功能大揭密

表形码 输入法!

税务计算机 试题分析,税务师考试方式、题型、计算器使用规定

国外BT下载网站

输入法卸载的问题解决

税务系统什么时候使用计算机,2020年税务师考试题量、答题要求及计算器使用规定...

学计算机用什么输入语法最好,怎么才能有效的学好电脑打字

浅谈输入法编程(转)

怎么查看电脑配置|win7查看电脑配置教程

职高计算机应用基础试题,中职职高计算机应用基础考试试题doc

台式计算机打字标准手法,电脑打字技巧口诀

学计算机打字重不重要,怎么才能有效的学好电脑打字

cpa用计算机考,cpa是机考还是笔试？考试方式大揭秘！

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

一、什么是RAG？

在 mac 上使用idea设置eclipse快捷键之后ctrl +左键进入类或者方法里，弹出右键功能窗口的解决办法

计算机专业能报税务师,税务师机考模式下你会遇到哪些技术层面的难题

表形码输入法!

税务计算机试题分析,税务师考试方式、题型、计算器使用规定

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载