AI on Looe Chao

Reasoning Agent的来龙去脉

Thu, 24 Oct 2024 15:01:13 +0800

LLM agent 的三个层次

从Text Agent到 ReAct Agent

Text agent

观察和响应文本

eg. ELIZA、LSTM-DQN

最早的ChatBot

Eliza
LLM agent

仅仅使用LLM做出相应

eg. SayCan、Language Planner
Reasoning agent

为LLM加上执行动作和更强的推理能力，Resoning 和 Action

eg. ReAct, AutoGPT

关于Question answering的问题

需要推理

Q: 有人说真话，有人说假话，根据他们的话来判断谁说了真话。例如：“A说‘B在撒谎’，B说‘C在撒谎’，C说‘A在撒谎’。其中只有一个人说了真话，谁说了真话？

A: 需要推理
需要行动（搜索，计算，编程）

Q: 一个袋子里有5个红球和3个蓝球，随机抽取一个球，抽到红球的概率是多少？

Q: 需要计算
需要新知识

Q: 今年英国首相是谁

A: 需要最新资料

推理和行动的手段

sequenceDiagram
 participant User
 participant Agent
 participant Tools
 
 User->>Agent: 提出问题
 loop ReAct Process
 Agent->>Agent: 推理思考
 Agent->>Tools: 执行行动
 Tools->>Agent: 返回结果
 Agent->>Agent: 分析结果
 end
 Agent->>User: 返回最终答案

推理 Reasoning

主要是通过思维链(Chain of thoughts)增强可持续时间