wdong的AI agent模型

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 2月 17日 17:12

对AI agent的三种理解：

1，“智能体”：理解，规划，执行。像一个机器人，自给自足。

2，各领域AI agent：基础模型+专业模型+专业领域里的执行。比如AlphaGeometry2，基础模型是Gemini，专业模型是用平面几何训练的，专业领域的执行是提示给出一个辅助线。这个执行并不明显，但是也算一个执行。这个看起来像个server。

3，代理。@wdong的AI agent系统我感觉是一个纯代理，是个人机交互的界面。viewtopic.php?t=714520

wdong

TheMatrix 写了： 2025年 2月 17日 17:12 1，“智能体”：理解，规划，执行。像一个机器人，自给自足。

2，各领域AI agent：基础模型+专业模型+专业领域里的执行。比如AlphaGeometry2，基础模型是Gemini，专业模型是用平面几何训练的，专业领域的执行是提示给出一个辅助线。这个执行并不明显，但是也算一个执行。这个看起来像个server。

3，代理。@wdong的AI agent系统我感觉是一个纯代理，是个人机交互的界面。viewtopic.php?t=714520

我的agent是第一类。我的系统是第三类，可以忽略。

我的agent的定义是一个邮箱地址和这个邮箱收发的所有邮件。(我认为我这个构造型定义比google那篇whitepaper以及别人高明，关于什么是agent至今为止所有人都语焉不详，就是按照他们说的你很难判定一个东西是不是agent。我要解决的是怎么通过收发邮件干各种事情）。这些邮件合起来构成agent的记忆，这个记忆在llm上运行(回邮件）时会呈现出self-awareness，也就是llm会知道自己是以哪个agent的身份在写邮件。我认为一个人也是由他的记忆定义的。

TheMatrix · 帖子由 **TheMatrix楼主** » 2025年 2月 17日 20:57

wdong 写了： 2025年 2月 17日 20:10 我的agent是第一类。我的系统是第三类，可以忽略。

我的agent的定义是一个邮箱地址和这个邮箱收发的所有邮件。(我认为我这个构造型定义比google那篇whitepaper以及别人高明，关于什么是agent至今为止所有人都语焉不详，就是按照他们说的你很难判定一个东西是不是agent。我要解决的是怎么通过收发邮件干各种事情）。这些邮件合起来构成agent的记忆，这个记忆在llm上运行(回邮件）时会呈现出self-awareness，也就是llm会知道自己是以哪个agent的身份在写邮件。我认为一个人也是由他的记忆定义的。

有点记忆外挂的意思。

我想象中的记忆是一种大脑的浸染。事件来了，在神经网络之中留下了痕迹，永不磨灭，因为它改了weights，也对未来所有的行动有影响。没有外挂，无限存储，因为不占地方。

wdong

对。或者说是脑子共享。这个也是没办法的办法。因为普通人肯定训练不起模型了，需要折腾出来不需要训练模型也可以玩的玩法。

从编程的角度来说，记忆就是程序。llm则是一个cpu。大家不需要会制造cpu，只要会用就可以。也说得过去。

目前我没想清楚的事怎么实现草稿纸机制。怎么让AI打草稿。

我最感兴趣的是，把agent个体定义成它的记忆，那么记忆不断长，就会有不能再长的一天。这时候就可以选择分裂，比如把记忆内容聚成几类，每一类分出去一个agent。在这个基础上可以搞演化算法。

新未名空间

wdong的AI agent模型

#1 wdong的AI agent模型

#2 Re: AI agent的三种理解

#3 Re: AI agent的三种理解

#4 Re: wdong的AI agent模型