REACT：SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

（ICLR 2023）

姚顺雨腾讯实习之作。

交错执行： 模型生成的轨迹由 Thought（想法）、Action（行动）和 Observation（观察结果）组成的循环步骤构成。

推理的作用： 分解目标、提取关键信息、通过常识推理填补缺失、跟踪进度、处理异常情况。

稀疏与密集推理：

代码简单示例：

#深度学习 #大模型 #agent

REACT：SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

https://lijianxiong.space/2026/20260208-1/

作者

LJX

发布于

2026年2月8日

许可协议