admin管理员组

文章数量:1633926

▼最近直播超级多,预约保你有收获

 1

文档 AI 助手总体技术架构剖析

腾讯文档(https://docs.qq/)相信大家都使用过,在大模型的新时代,腾讯文档也推出了 AI 大模型助手应用,如下图所示:

腾讯文档的 AI 大模型助手总体架构如下图所示,包括6大模块:AICopilot、AIServer、AIAgent、AIEngine、AIOperation、AIExtension。

AICopilot 模块:提供 AI 侧边栏对话功能,负责意图识别、对话管理、缓存及存档等功能。

AIServer 模块:提供各类别定制化的浮层助手服务。

AIAgent 模块:作为 AI 智能代理,集成并提供各类别的文档处理工具,由上层服务调用识别意图后驱动。

AIEngine 模块:作为文档 AI 引擎,统一抽象并封装各项 AI 能力(比如:文生文、文生图、语音转写、语音识别、图像识别、嵌入式 AI 等),实现能力间无感切换。

AIOperation 模块:负责文档 AI 灰度发布策略、隐私保护措施以及运营操作。

AIExtension 模块:扩展 AI 服务,支持AI应用落地所需的支持能力,比如:文本搜索、图片搜索、Python 执行环境等。

 2

文档问答场景技术架构剖析

文档产品的核心竞争力在于其能够高效地传递信息。在这一过程中,利用 AI 大模型进行信息问答成为了一个尤为关键的应用场景,特别是在处理 Word 文档、PPT 演示、Sheet 表格、思维导图、数据收集表以及知识库等多种不同内容形态时的问题解答。

然而,要构建这样一个文档AI大模型应用,首要且核心的挑战便是构建一个稳固且高效的基础问答系统架构。解决这一挑战的关键在于,如何确保 AI 大模型能够精确地掌握并深入理解各类文档所涵盖的广泛领域知识内容。

针对文档 AI 大模型在掌握领域知识方面的需求,通常有两种解决方案可供选择。一种是通过微调(Fine-tuning)的方式,将特定领域的知识记忆到大模型中,使其能够适应并理解该领域的内容。另一种则是利用 Prompt 技术,即时地将领域知识传递给大模型,以便在问答过程中能够准确应用。

在用户文档信息的处理上,这些数据本质上是用户个人数据的整合,用于提供个性化服务。然而,由于用户文档常常更新,且时效性要求高,因此不可能每次变更都重新训练整个模型。此外,出于对用户隐私的保护原则,用户数据也不能直接用于模型的训练过程。因此,针对每位用户单独训练模型的方案在实际操作中并不现实且不可行。

因此选用第二种 RAG 增强的方案

RAG 检索增强生成的技术方案由以下模块串联完成:

第一、文档加载:定义统一的 Document 数据模型,将实现默认典型的数据源加载实现,业务方也可以根据接口自定义实现自身所需文档数据源。

第二、文档分片:大模型上下文大小有一定限制,需要将大量数据进行分割操作。

第三、文档 Embedding:Embedding 过程将对应文本向量化,以提供更好的语义表达。

第四、文档向量存储:使用向量数据库存储文档向量数据。

第五、文档召回:根据用户输入的问题召回和问题最相关的文档信息。

第六、问题解答:根据召回文档资料 + 用户输入问题提供给大模型进行知识问答。

为解决以下两种场景,在原有架构上规划进行进一步的升级

第一、解决元数据问答、总结、非总结类问题

第二、解决涉及多模态文档的问答

为了帮助同学们彻底掌握大模型 Agent 智能体、知识库、向量数据库、 RAG、知识图谱的应用开发、部署、生产化,今天我会开3场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

参考:https://mp.weixin.qq/s/MNY6647V4hPByNzghyDUfQ

 3

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

本期名额有限

高度起始于速度(手慢无!!)

 4

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

第二步:扫码后,点击以下关注按钮,就可关注我。

第三步:点击"客服“按钮,回复知识图谱即可领取。

 5

精选短视频《数据工程如何做?》

以下视频你将学到:

    1、非结构化数据的数据工程如何做?

END

本文标签: 腾讯架构助手文档技术