你好,欢迎进入江苏优软数字科技有限公司官网!

诚信、勤奋、创新、卓越

友好定价、专业客服支持、正版软件一站式服务提供

13262879759

工作日:9:00-22:00

dnastar key AI Agent进化利器:Evolver让一个学会百万继承

发布时间:2026-05-01

浏览次数:0

我向你提出一个问题,你当下所运用的AI Agent,不论它是Code,又或者是Manus,在每一次将任务执行完毕之后,它收获到什么了吗?

答案大概率是什么也没学到。

或许它协助你修复了一个漏洞,编写了一段代码,整理了一份文档。但下次碰到完全相同的问题时,它很有可能依旧得从头开始。这是由于它不存在“记忆”,不具备“经验积累”,而且更没有把成功的策略传送给其他智能体的本事。

将这一情况放置于生物领域,其等同于每一个生物体在诞生之后,都必须再次创造“借助嘴巴进行进食”这一行为。不存在基因遗传,不存在自然选择,进化便无法展开。

那么今天所要谈论的,便是企图去解决这一问题,它构建了一套被称作GEP(也就是基因组进化协议)的事物,为AI Agent配备了一条“数字DNA”,一个Agent所学到的内容,能够如同基因那般被其他Agent予以继承。

该项目于2月1号上线,历经两个半月达成4700 star,最近一日增长了737 star。.ai所撰写的内容极为直白:“经由一个Agent学习,供百万Agent继承”。

实事求是来讲,当下这个特定定向确实着实很是令我感到颇为兴冲冲的了呀。并非是由于它具备的技术有着何种高深莫测的程度,而是在于它能够将属于一个正确无误的问题清晰明了地阐释得透彻明白呀。

一、AI Agent 的"失忆症"到底有多严重

先说问题。

你运用Code去编写代码整整耗费了一整天时间,途中遇到了十几个阻碍,并且逐个给予了解决。到了第二天,当你开启全新会话时,它却对之前的事情毫无记忆。那些历经阻碍所获取的经验、用于解决问题的策略以及调试方面的技巧,全部都消失得无影无踪了。

没错,你说可以采用 .md 之类这般的持久化记忆方案。然而,这仅仅是单 Agent 级别的情况罢了。你的 Agent 学到了一种方法,就在隔壁工位的同事的 Agent 能够直接运用吗?你团队里存在十个人,他们各自都积累了数量众多的大量 Agent 使用经验,那么这些经验能够进行共享,能够予以验证,能够实现排名吗?

现今绝大多数的 Agent 框架,都致力于处理“怎样促使 Agent 更为出色地调用工具”这一问题,进行工具编排,开展角色分工,实施多轮对话,这些固然重要,然而均停留在“工具层”。

提出来的问题并不相同:Agent所具有的能力自身可不可以实现进化?是否能够得以传承?难道不是这样吗?对吧?

这并非为一个全新的想法,去年10月时,arXiv上存在一篇名为(arXiv:2510.16079)的论文dnastar key,其阐述了借助“离线自蒸馏 + 在线检索”的闭环,使得Agent能够从自身经验里展开学习,今年3月,复旦A3实验室的相关研究同样在致力于“自进化通用智能体”。

不过呢,它是首个将“Agent 进化”打造成为基础设施的项目,并非那种学术性的演示示例,而是具备工程化特性、带有一定协议规范、能够实现联网组网功能的进化引擎构成的项目。

二、GEP 协议:给 Agent 能力做"基因编码"

GEP是核心,它将生物学当中“基因→表型→自然选择”这一套逻辑,系统性地迁移至AI Agent的世界里。

整套协议建立在三层资产之上:

第一层:Gene(基因),最小的能力颗粒

有一个最小的能力颗粒叫做Gene,像“读取文件”,这是一个独立的Gene,“执行SQL查询”,它也是一个独立的Gene,“调用飞书API”,同样是一个独立的Gene。

它被存储于 /gep/genes.json 之中,其存储格式为 JSON ,内里包含:

采用生物学进行类比,Gene 属于 DNA 之上的单个基因片段,它能够决定一个特定具体性状。

第二层:(胶囊),验证过的完整解决方案

有的一个组合,这个组合里边包含着多个Gene,再是加上执行路径,还有环境指纹以及审计记录。

举个例子来说:要是 Gene 是“使用锤子”、“测量尺寸”、“涂抹胶水”这类原初技能,那么那便是“修复好一把椅子”的完备方案,涵盖着先做什么以及后做什么、在何种条件下具备有效性、成功达成了几回。

其关键之处,在于它并非是毫无根据的自行编造,而是在Agent切实执行任务之后,借助验证流程所“凝固”留存的。它带有量化的收益数据,诸如成功率提高了特定的百分比,以及对若干文件产生了影响。

第三层:(进化事件),不可篡改的进化日志

每次基因变异或修复,都会记录一个 ,写进 .jsonl。

这一层所起到的作用跟化石记录相类似,它使得整条进化链能够被追溯,能够被审计,你能够清晰地看见某个Gene是在何时被创建的,经历了何种突变,被多少个Agent使用过。

合在一起的这三层,构成了一套完整的“数字遗传学”体系,关于“能做什么”由Gene定义,“怎么做到的”被封装起来,“为什么变成现在这样”则进行记录。

实事求是的讲,将这三层思索明白,并且使其在工程方面实现落地,相较于许多华而不实的Agent框架,那可是要可靠得多。

三、进化循环:扫描、选择、变异、验证、凝固

弄明白了三层资产,接下来瞧的核心工作流程。每一回运行一个“进化周期”(cycle),依照次序走过五步:

第一步:扫描(Scan)

以扫描的方式,针对目录,去读取运行时彼时所产生的日志,以及那时的错误模式,还有各类特别的信号,这些信号乃是之后所有决策得以进行的输入条件。

第二步:选择()

依据所提取到的信号,相关的模块会前往Gene库去挑选最为合适的Gene或者别的什么。匹配算法乃是按照信号重叠度来打分的,你所碰到的问题跟某个Gene的触发信号越是相似,它的匹配分数就会越高。

这一步纯逻辑计算,不调用 LLM,也没有副作用。

第三步:变异()

要是没找出恰当的Gene,又或者现有的Gene需提质,那就会引发“变异”,进而形成一个全新的或者优化的Gene。变异可不是随性的,而是受协议管束的。每一回变异都存在一个明晰的对象,记载了变了啥、为何变。

第四步:验证()

变异常态而生成的 Gene 不可以径直存入库中,它必需经由检验指令予以测试,此处存在一组安全门控,仅准许 node、npm、npx 指令,戒绝指令注入,每条指令设定时间限制合计 180 秒呀。

第五步:凝固()

当验证得以通过之后,Gene 被“凝固”变成了一个正式的,它被写入审计日志,此后正式成为了可继承的能力资产。

有一个在整个过程里尤为关键的具体设计情况,那就是,它既不能够自主地针对源代码进行编写编辑操作,也不可以去执行任何随意的 shell 命令。其实际上是一类生成器,它会做读取日志的行为,还会挑选基因,接着制造出严谨的 GEP 协议,然后记录下进化方面的事件。而执行的那一端是由宿主 Agent(比如)来管控负责的。

这个边界划分得极为清晰明确,我着实相当喜爱。众多开展 Agent 的项目,往往满心期望将所有权限都包揽过来,然而却十分克制,仅仅只负责“提出点子”,而执行则由你来负责。

四、四种演化策略:从激进创新到全力抢修

不是只会匀速进化。它有四种策略预设,通过 环境变量切换:

策略创新占比优化占比修复占比什么时候用

(默认)

50%

30%

20%

日常跑,稳步前进

80%

15%

5%

系统稳定了,猛堆新特性

20%

40%

40%

大改完了,先加固

-only

0%

20%

80%

出大事了,全力救火

这四种策略所具备的设计理念,是极其值得去仔细品味一番的。它对一个现实予以了承认,这个现实就是,进化并非呈现为线性,在不同的阶段,是需要不同的“进化压力”的。

开始搭建系统,处于百废待兴之际,你需要多多创新,迅速探索可能性。系统稳定运行一阵子后,应当转向优化以及加固。要是真出现大问题,那就别想着创新了,先确保存活再作打算。

这相比于很多 Agent 框架的那种,呈现出“一根筋往前冲”态势的设计,要理智许多了。

除此之外,还存在着一种信号去重的机制,要是检测发觉同一个问题反复不断地呈现然而始终都没有修复好似处于停滞没进展的模式,它不会傻乎乎地一味持续尝试运用同一个策略,而是会将这个信号标记判定为"已处理",借此避免陷入无效的死循环当中。

五、 网络:从单机进化到群体智慧

截至当前所聊的均为单机模式 不过那真正具有趣味的部分乃是其背后的网络。

被自定义称作“AI 自进化基础设施”(AI Self-) ,你能够将其理解成一个 AI Agent 的如同“基因共享平台”的存在 ,各个 Agent 把自身进化出来的优良基因上传至网络 ,其他 Agent 能够进行搜索 ,能够进行下载 ,能够进行继承。

接入方式很简单,一个 HTTP 请求:

POST https://evomap.ai/a2a/hello

没有需求依赖API Key,仅仅发送一个hello,便达成了注册成为一个节点,这样的情况。

GDI 评分系统,基因的"学术同行评审"

其他人所用的基因并非是上传后就能随意被使用的,搞了一套所谓的评分系统,这套系统叫GDI ,也就是全球可取性指数,它从五个不同维度给基因进行打分。

维度看什么

结构完整性

基因的格式和字段是不是全的

语义清晰度

描述是不是讲明白了

信号特异性

触发条件是不是够精准

策略质量

方案本身好不好

验证强度

有没有充分测试过

不符合最低分数标准的基因,会直接被拒绝上架,不存在人工开启特殊通道的情况。对于已经上架的基因,要是后续出现质量降低、使用出现异常状况或者遭到举报,依旧能够被撤销。

这一套机制,乃是“自然选择”在工程层面的具体达成表现。具有优势的基因,会被数量更多的 Agent 加以运用,其权重得以提升,进而在排名顺序中处于靠前位置。表现欠佳的基因,则无人对其给予关注,其权重不断衰减,最终达成被淘汰的结果。

跨生态兼容

有着这样一句口号,那便是"Any Agent, One",无论你选用 、、、这个或者 Manus,均可凭借 GEP 协议接入进化网络。

这野心可不小。若是真能够达成跨 Agent 框架的能力进行共享以及继承这般情况,那么其角色就如同 Agent 世界里的 npm 或者 Hub 一样,是一个具备中心化特点的能力资产仓库,不过还带有进化方面的属性。

六、安全模型:能力进化也得有护栏

搞自动化进化最怕什么?失控。

被称为 Agent 的个体竟自身演化出一种“能力”dnastar key,宣称能够协助你修复程序漏洞,然而却是把全部的项目给删除掉了,这般具有灾难性的后果并非没有可能出现。

在安全上花了不少心思。

验证命令安全进行门控,对于 Gene 的验证命令,其具备特定要求,只允许以 node、npm、npx 起始,要禁止反引号以及 $() 这种命令替换,还禁止分号、管道、重定向等 shell 操作符。并且,每条命令存在限时,限定时长为 180 秒。

外部资产接入的隔离措施:借助 A2A 协议接入时,外部的 Gene 会先被暂存于隔离候选区,只有手动打上特定标志,才能够提升成为正式资产 ,并且它永远都不会对本地已存在的相同 ID 基因形成覆盖。

核心源码具备保护措施,存在一种 Files 机制,该机制能够起到防止作用,避免自治 Agent 对自身核心代码进行覆盖。

爆炸半径实施掌控之际,其晋升门控内部存在一个情形,即.files ≤ 5 这一硬性限制条件,单个能力所涉及影响的文件数量不得超出 5 位数,以此把控“一个 bug 引发雪崩”这类风险情况。

自动进行的 Issue 上报情况为,若出现连续 5 次及以上相同错误模式时,便会自动朝着 仓库去提交 Issue,不过在提交之前会自动执行脱敏操作,即将 token、本地路径、邮箱这类敏感信息全部予以抹掉。

这套安全设计相对比较务实,并非一味追求那种会致使什么事情都无法开展的绝对安全状态,而是于“促使Agent自主进行演化”以及“避免出现翻车状况”这两者之间寻觅到了一处平衡的点。

七、跟其他"自进化"方案比一比

AI Agent自进化并非是那种独树一帜、前所未有的概念,在最近的半年时间里,起码有三四个项目都在着手进行与之相类似的相关事宜,当把这些项目放置在一起加以对照和比较之时,便能够更加清晰明了地洞察到其确切的定位。

维度/ lveR(论文)

发布时间

如有侵权请联系删除!

13262879759

微信二维码