发布时间:2026-03-31
浏览次数:0
等到AI agent 产生了对一个“家”地需求之际,它们并非入驻到单独的 App 之中,反而是迁入了聊天软件里面。
2月在春节期间,当机器人到处都是之时,Manus发布了agent,首发平台进行了选择,选的不是自家的那个。
在同一时间,于1月宣告新版正式上线,其定位是「你的个人工作agent」,飞书开放平台上线了AI Agent工作流节点以及MCP工具支持,在社区当中,AI bot的数量和复杂度也在迅速地攀升。
拜其所赐,这当然。作为 AI 开源项目之一,它增长十分快速,从一个周末项目涨到 10 万 star。它的默认交互界面,既不是网页,也不是独立客户端,而是。
有一个趋势当前正在明晰地形成,即时通讯工具正由「人与人之间的对话」转变为「人与人工智能的接口」,而聊天软件出人意料地迎来了其「第二春」。
但“第二春”不是均匀地降临于每一处地域,不同IM平台的开放尺度、技术框架以及治理理念悬殊极大,它们在agent潮流里的站位也全然不同,要明白这些差别,需要一条剖析脉络——开放性的天平。
为什么是聊天软件?
为何偏偏是即时通讯软件呢,开启属于自身生活里最为常用的对话框,进而能够使唤AI,这着实极为契合人类对于「科技生活」之所畅想,然而,真正的答案,却是跟agent的架构存在关联之处。
AI agent 的工作原理并非复杂,它会监听用户指令,接着将指令交给 AI 进行处理,随后把处理结果返回。这个呈现出「消息进—处理—消息出」形式的循环,天然与即时通讯的基础设施相适配,此基础设施涵盖长连接、实时推送以及富文本消息。聊天软件在过去十几年里为人类对话构建的管道,几乎无需改造便能够供 agent 使用。
需要着重指出的是,human-in-the-loop的需求。当下的AI agent距离完全自主的程度还差得远,在执行诸如发一封邮件、修改一段代码这类关键操作之前,常常需要人类予以点头确认。聊天窗口里的某一个回复,相较于打开一个全新的管理后台、登录一个全新的而言,显得自然许多。IM本质上就是一个“确认/驳回”的界面。
还有一个更具决定性意义的因素,那就是用户已然居住在聊天软件之中。无需去下载全新的 App,也无需去学习全新的界面,agent 就在你每日打开的对话列表里,夹处于同事群与家庭群之间。这般零迁移成本,是任何独立 AI 产品都极难复制出来的优势。对于开发者而言,这意味着获客成本已经趋近于零——即你无需去说服用户安装任何物品,仅仅只需让他们点击一下「添加 bot」。
谁先吃到红利?
但并非每一款聊天软件,都可以在这波趋势里均等受益。决定谁能率先获取agent红利的关键变量,乃是平台的开放程度 ,我们能够顺着一条从「完全开放」延伸至「完全封闭」的光谱路径,去观察各个IM平台所处的位置以及所采用的策略。
光谱最左端:——零摩擦的开放性
其能成为agent浪潮里头首个受益的对象,并非缘于是它最大且最好用,而是由于在所有主流IM中它是开发者门槛最低的那个。
打造一个bot,仅需与@对话几步,先取个名字,再获取API token,接着就能着手接收与发送消息。既无需企业认证,也无需审批流程,更不用等待人工。从完全的零状态到运行起来的且可用的bot,能在5分钟内达成。
这种所谓的「零摩擦」,并非仅仅局限于注册环节所带来的便利,其 Bot API 的设计,本身就对开发者展现出超乎寻常的友好。它拥有一种机制,能使 bot 实现实时响应消息,还具备一种模式,可让 bot 在任何对话当中被成功唤起。并且,支持 和 HTML 的富文本渲染,能让 agent 返回条理清晰、结构规整的输出。
更为关键之处在于, 对于bot的功能限制是极少的,bot能够创建群组,也能够管理频道,还能够处理支付等一系列的操作。这样一种“bot所能进行之事几乎等同于人所能进行之事”的设计理念,近期的更新还对 bot 的流式输出予以了支持,从而使得开发者拥有极大的发挥空间。
因这般开放性,故而选择其作为第一交互渠道。于官方文档当中,它是首个被详尽说明的频道,配置教程最为完备,社区讨论亦最为活跃。一位典型的其用户,能够于一台VPS上部署agent实例,绑定自身的bot token,接着借助对话窗口使agent协助自己达成从信息检索直至代码部署的一整套任务。
2月时,Manus挑选了作为首发平台,其逻辑相仿。Meta旗下产品未选自家的,要知道后者月活用户超20亿呢,却选了用户量远小于它的那个。这充分表明在agent早年阶段,开放性相较用户基数更为关键。通过库时,需用真实手机号验证,而且API审核流程繁杂,还不支持商业大规模部署,对一个急需麻利迭代的AI产品来讲,阻碍太大了。
但 的开放性是一把双刃剑。
给开发者提供零门槛创建这种方便条件的开放性,却让长期沦为灰色产业的滋生地。安全公司在今年 1 至 2 月进行扫描时,发现有超出 30000 个暴露于公网的相关存在,在最新出现的一个所谓「曝光看板」里,暴露数量达到令人震惊的 22 万个,好多实例的 API 密钥以及数据库凭证直接暴露在默认配置之中,安全完全不起作用。
存在这样一个悖论,使得agent生态能够以最快速度繁荣起来的那些条件,恰好同时也是会让安全风险以最快速度进行积累的条件,并且,存在着一个无法借由「加强审核」这种方式简单予以解决的问题,这是因为审核本身所代表的含义就是提升门槛,然而低门槛恰恰是开发者做出选择的缘由。
天平中间:Slack 与
倘若要讲,所代表的是那种“先上车后买票”的非正规、不走寻常路的方式,那么Slack以及所代表的是不一样风格的“有限开放”。
Slack 所走发展路径为企业级路线,借助 Bolt 框架,与开发工具进行深度整合集成,在 2026 年 1 月,宣称新版正式实现上线,针对 +以及 Grid 用户,其定位为「your agent for work」,具备支持查找信息、分析文档、管理日程、生成摘要的功能。
同一个月,另外还推出了在Slack里的集成,它把CRM数据以及客户交互直接引入到了对话流当中。对于第三方agent,Slack的态度是开放然而可控的:所有的bot都需要经过审核,数据访问存在明确的OAuth scope限制,企业管理员能够精细地控制哪些bot可以进入哪些频道。
bot 所在的生态同样成熟,然而其底色更偏向社区以及创作者。对于开发者而言,要求进行注册应用、配置权限(相较于 的@要多几个步骤),不过远远达不到企业级 IM 的审核强度。此 的 agent 具备的优势在于社区场景的密度方面:它是从 bot 起步的,如今众多 AI 项目依旧把它作为兼具用户社区与产品交互的双重入口。并且它自身也在 上运营着活跃度较高的开发者社区。
两者存在的共同点在于,它们均于开放性方面设置了一个“限速器”,Slack的“限速器”乃是企业合规,另一个的“限速器”则为伍社区治理,相较于完全放任的情况,这表明agent生态的发育速度会慢一些,不过系统性风险也会低一些。
天平向右:飞书
面向国内用户而言,飞书是一个值得专门拎出来予以探讨的实例,其开放的方式,展现出中国IM平台在agent浪潮里的独特情形。
过去一年间,飞书的开放平台有着显著的能力提升,自2025年下半年起始,飞书相继上线了Bot API 的多项增强,工作流里的AI Agent节点(当前是Beta版),还有对MCP(Model)工具集的支持,于 方面,飞书官方维护的lark--mcp项目收获了超400颗star,提供了飞书核心功能的MCP 封装。存在着官方的飞书插件(@/),它具备支持把 agent 部署至飞书对话里的能力。
从功能角度来看,飞书的agent基础设施此时正在迅速追赶,bot能够读写文档,还支持发送带有按钮、表单的交互式卡片,并且能触发审批流,以及能够创建和管理日历事件,而这些均属企业场景里agent具备的高价值能力。
但飞书的开放性有两重限制:
第一重是平台治理,飞书的agent生态生来皆为B2B,并非C2C与B2C的混合样式,飞书的bot须于企业应用框架里运行,开发者得打造企业自建应用或者商店应用dnastar key,配置权限完毕后需企业管理员进行审批,这表明个人开发者难以如往其他之处的那般“5分钟创建一个bot”。
作一个直观的对比,有这样一种情形,有个开发者,从进行bot注册开始算,直到收到第一条消息回复为止,整个这个过程,所经历的时长竟然不超过5分钟。然而呢,同样是这样的事情,要是放在飞书上,光是等待企业专门的管理员去审批应用权限这一情况,就极有可能需要耗费一个工作日时长。
企业级管控致使安全性得到了更高提升,然而其所付出的代价于开发者体验方面得以体现,具体表现为:权限配置环节、调试环节、上线等各类环节所产生的摩擦明显高于其他,这种摩擦并非缺点而是具备自身特性——但它的确使得agent生态的自发生长速度有所减缓且确实是的。
第二重所指的是生态位,在国内的商场之中,能够和飞书形成主要竞争态势的恰恰是钉钉以及企业微信这两者,处于这三者的情形之下,都在对agent能力作出更大投入,只是所采取的路径并非一致。其中,钉钉表现出更趋于和通义系列大模型进行深度捆绑的倾向,而企业微信则是凭借微信生态所拥有的用户数量基础。
出现了一个有意思的现象,中国IM市场呈现出高度碎片化的状态,在agent这件事情上,首先跑出来的并非是用户基数最大的企业微信,也不是市场份额最高的钉钉,反而是飞书。
这完全是偶然吗?不一定。
其一,飞书的开放平台并非是后续追加的附加部分,而是属于产品特性的构成片段,多维表格自身便是具备可编辑程序能力的数据层面,文档原本就对应用程序编程接口的读取与写入予以支持,这些基础架构方面的设计致使智能体的接入所需成本相较于其他竞争产品更低。
其次,字节跳动具备大模型能力,包括豆包以及云雀,还兼有企业协作平台,此种垂直整合使得飞书于agent场景里的迭代速度更为快捷,与此同时,存在这样的情况,对比来说,钉钉与通义之间的组织协调链条较长,企业微信跟混元之间的组织协调链条同样长。
第三,飞书的客户画像存在偏向,偏的是互联网以及科技企业 ,这 批企业自身开发者密度是更高的 ,自动化需求是更强的 ,对AI的接受程度也是更高的 ,agent生态在这个群体当中更容易形成冷启动。
当然,这也就表明,飞书的agent故事当前主要是一种「科技公司圈子之内的叙述方式」了,而它能不能朝着更为宽泛的企业市场去渗透,至今依旧是个疑问。
这个案例还反映出另外一件事情,那就是,agent 中继不太可能被一个创业公司从无到有地做出来,因为,agent 需要的不仅仅是消息管道,更多的是企业内部的数据信息,以及权限设定,还有工作流程,而这些,正是现役 IM 玩家的护城河所在,是他们的优势所在,是他们得以立足的根本所在。
另外,中国市场的 IM 格局呈现出更加碎片化的态势,agent 开发者需要针对多个平台进行适配,这无疑提高了生态成形的难度,所以存量优势就具备了很大的决定性作用。
从中国市场的角度而言,IM的“第二春”并非仅仅取决于开放性,它还取决于与本土大模型之间的集成深度,以及企业客户的采购逻辑,更得考虑监管环境对bot能力边界所做出的定义。 这呈现出的是与全球市场存在明显差异的一种竞争维度。
天平背后
有开放性特质的天平,揭示出的不仅仅是各个家IM的策略方面的差异,而是一个agent时代所存在的基础矛盾,那就是,平台越是趋向开放的状态,agent生态就会越发繁荣,然而安全风险同样也就会更高。
这是那个矛盾的极端表述,同一种给予开发者零门槛创建bot的开放性,与此同时却开启了创新与滥用的通道。假如果监管收紧致使提高bot创建门槛,这并非毫无可能,被法国警方制裁后,已然着手调整部分内容政策,那么会对开发者造成影响吗?他们又会转移至何处?是、Slack、还是飞书?
然而,封闭平台遭遇的是相反的那种困境,即:要是不开放 API,那就会错过 agent 红包带来的好处,若开放了,则又得去承担当下正经历着的那种安全还有声誉方面的成本;从技术这个角度来讲,确实绝对是具备完成一个类似@的轻量级工具的能力的,然而它背后可是有着 20 亿用户的体量,所以实在是不能不多方经过慎重思考。
于此刻,每一个IM平台,皆需于这架天平上寻觅自身的方位。“第二春”究竟能够延续多久,取决于一个直至当前依旧欠缺标准答案的问题:处于agent时代,一个聊天平台究竟应当具备何种程度的开放性?
于开放性方面存在的争论背后,有一个更为激进的猜想正在开发者社区逐渐形成,这个猜想是,当一个聊天窗口能够调用任意 agent 去完成从订票开始,历经编程,再到数据分析等各类任意任务时,它已然不单纯只是一条管道,它正处在转变成为一个超级接口的过程之中。
若讲不讲,这般逻辑于中国读者来讲,挺眼熟呀——这难道不就是微信么。
微信借助小程序、支付以及政务服务,于一个封闭的生态环境当中达成了「一个 App 解决所有问题」的目标。而其所呈现的这种模式,指向了一种犹如镜像般的可能性,即通过开放生态以及全球开发者社区,在随便哪一个 IM 里达成相似的功能紧凑程度。
并非是去打造另一个微信软件,而是要运用截然相反的路线,也就是开放的状态而非封闭的情形,去中心化的模式而非平台主导的方式,最终达成一个存在功能上相似之处的最终成果。
诚然,这依旧不过是一种猜想,并非预言。微信超级应用的成立依存于中国市场特有的移动支付基础设施以及用户习惯,这类条件在全球市场并不普遍适用。更为根本的是,开放生态能不能在不损害安全性的情形下达成那般服务密度,当下没人能够给出答案。
这是一个假设成立的情况,即若这个方向无误,那么IM的“第二春”并非仅仅是一段插曲,而是一次身份转变的起始点,转变源自消息管道,至AI时代的通用交互层。在开放性与安全性之间,能够最先寻觅到那个可持续的平衡点的一方dnastar key,最有机会去定义这个新物种的模样。
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码