wdong的AI agent模型

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

回复
头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 268
帖子: 13445
注册时间: 2022年 7月 26日 00:35

#1 wdong的AI agent模型

帖子 TheMatrix楼主 »

对AI agent的三种理解:

1,“智能体”:理解,规划,执行。像一个机器人,自给自足。

2,各领域AI agent:基础模型+专业模型+专业领域里的执行。比如AlphaGeometry2,基础模型是Gemini,专业模型是用平面几何训练的,专业领域的执行是提示给出一个辅助线。这个执行并不明显,但是也算一个执行。这个看起来像个server。

3,代理。@wdong的AI agent系统我感觉是一个纯代理,是个人机交互的界面。viewtopic.php?t=714520
上次由 TheMatrix 在 2025年 2月 17日 20:58 修改。
原因: 未提供修改原因

标签/Tags:
wdong(万事休)
见习作家
见习作家
帖子互动: 99
帖子: 418
注册时间: 2023年 11月 13日 15:13

#2 Re: AI agent的三种理解

帖子 wdong(万事休) »

TheMatrix 写了: 2025年 2月 17日 17:12 1,“智能体”:理解,规划,执行。像一个机器人,自给自足。

2,各领域AI agent:基础模型+专业模型+专业领域里的执行。比如AlphaGeometry2,基础模型是Gemini,专业模型是用平面几何训练的,专业领域的执行是提示给出一个辅助线。这个执行并不明显,但是也算一个执行。这个看起来像个server。

3,代理。@wdong的AI agent系统我感觉是一个纯代理,是个人机交互的界面。viewtopic.php?t=714520
我的agent是第一类。我的系统是第三类,可以忽略。

我的agent的定义是一个邮箱地址和这个邮箱收发的所有邮件。(我认为我这个构造型定义比google那篇whitepaper以及别人高明,关于什么是agent至今为止所有人都语焉不详,就是按照他们说的你很难判定一个东西是不是agent。我要解决的是怎么通过收发邮件干各种事情)。这些邮件合起来构成agent的记忆,这个记忆在llm上运行(回邮件)时会呈现出self-awareness,也就是llm会知道自己是以哪个agent的身份在写邮件。我认为一个人也是由他的记忆定义的。
头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 268
帖子: 13445
注册时间: 2022年 7月 26日 00:35

#3 Re: AI agent的三种理解

帖子 TheMatrix楼主 »

wdong 写了: 2025年 2月 17日 20:10 我的agent是第一类。我的系统是第三类,可以忽略。

我的agent的定义是一个邮箱地址和这个邮箱收发的所有邮件。(我认为我这个构造型定义比google那篇whitepaper以及别人高明,关于什么是agent至今为止所有人都语焉不详,就是按照他们说的你很难判定一个东西是不是agent。我要解决的是怎么通过收发邮件干各种事情)。这些邮件合起来构成agent的记忆,这个记忆在llm上运行(回邮件)时会呈现出self-awareness,也就是llm会知道自己是以哪个agent的身份在写邮件。我认为一个人也是由他的记忆定义的。
有点记忆外挂的意思。

我想象中的记忆是一种大脑的浸染。事件来了,在神经网络之中留下了痕迹,永不磨灭,因为它改了weights,也对未来所有的行动有影响。没有外挂,无限存储,因为不占地方。
wdong(万事休)
见习作家
见习作家
帖子互动: 99
帖子: 418
注册时间: 2023年 11月 13日 15:13

#4 Re: wdong的AI agent模型

帖子 wdong(万事休) »

对。或者说是脑子共享。这个也是没办法的办法。因为普通人肯定训练不起模型了,需要折腾出来不需要训练模型也可以玩的玩法。

从编程的角度来说,记忆就是程序。llm则是一个cpu。大家不需要会制造cpu,只要会用就可以。也说得过去。

目前我没想清楚的事怎么实现草稿纸机制。怎么让AI打草稿。

我最感兴趣的是,把agent个体定义成它的记忆,那么记忆不断长,就会有不能再长的一天。这时候就可以选择分裂,比如把记忆内容聚成几类,每一类分出去一个agent。在这个基础上可以搞演化算法。
回复

回到 “STEM”