admin管理员组

文章数量:1630976

AutoGPT源码解析

第一章 Agent智能体及AutoGPT介绍


文章目录

  • AutoGPT源码解析
  • 前言
  • 一、理解AI Agent智能体
    • 1. Profile
    • 2. Memory
    • 3. Planning
    • 4. Action
  • 二、AutoGPT介绍


前言

最近学些了一些AI Agent的知识,并且阅读了一些AutoGPT、LangChain等现象级AI Agent相关开源项目源码。关于AutoGPT零零散散总结归纳了一些知识,决定开一个系列来分享下。


一、理解AI Agent智能体

下面是个人关于AI Agent智能体的一些理解。

LLM的理解、推理和生成能力,使智能体Agent的实现成为可能。LLM就像人类的大脑一样,内部存储了很多的知识,但如果只有LLM而没有与现实世界交互的能力,那么LLM大多情况就像植物人一样;同样,没有LLM智脑加持的Agent即使有与现实世界交互的能力,也会像一个弱智一样。

如下图,我们完全可以把一个基于LLM的AI Agent架构跟一个正常的人做类比。

1. Profile

对于个体的人,有人社、有三观、有行为准则、约束等,同样AI Agent的Profile通过设置Prompt提示词、可用的Action动作等来规范、限制LLM和Agent的执行;

2. Memory

包括短期记忆、长期记忆、大模型预训练知识、外部知识库;

3. Planning

对应大模型的推理能力,同时可以基于一些ReAct、COT、TOT等推理框架来增强LLM的罗辑推理能力。

4. Action

Agent通过Action动作跟外部世界进行交互,例如Web Search、命令执行(执行代码、发送邮件、文件操作等)。
Action的执行要求LLM具有结构化输出或Function Call能力。

二、AutoGPT介绍

AutoGPT源码地址:https://github/Significant-Gravitas/AutoGPT
AutoGPT从开源到现在已经积累了165k Star,非常恐怖!

AutoGPT包括如下模块

  1. autogpt:AutoGPT核心模块,主要通过一个loop循环与LLM进行持续交互,实现了ReAct推理框架;
  2. forge:方便创建可定制的Agent应用,内置了一些常用的Component模块为Agent提供了沙盒命令执行、文件操作、图像生成、网页搜索等能力,并且支持通过集成自定义Component来扩展Agent的能力范围;
  3. benchmark:测试Agent的性能;
  4. UI:与forge创建的Agent server api配合使用,提供agent图形化使用。
  5. CLI:通过命令行运行Agent。

本文标签: 智能AgentAutoGPT