发布时间:2025-08-16
浏览次数:0
智东西AI于7月28日进行前瞻报道,当日,在2025世界人工智能大会(WAIC)进行中,启明创投主管合伙人周志峰进行了主题演讲,演讲题目为《技术向上生长,应用向下扎根——AI共振周期暨2025 AI十大展望发布》,并且公布了“AI十大展望”。
这份文件囊括了基础模型、多模态智能体、AI基础设施以及新型交互与机器人应用等众多领域,全面梳理了未来一两年内值得关注的重点技术与实际应用动向,形成了一份对未来AI发展阶段具有重要参考价值的趋势分析图。
本年度文件里,启明创投把接下来两年间的动向归纳为两个层面,分别是“实力拓展”和“实践拓展”。
启明创投分析,接下来一两年时间,大型模型行业可能发生一个关键性发展:核心模型的输入信息容量或许能扩充到两百万个单位,视频类通用模型有望达成制作、分析、认知功能整合,从而彻底更新内容设计与人机沟通模式。
倘若这些技能得以实现,其直接后果将是“数字员工”的真正出现——Agent不再仅是辅助,而是会深入公司内部环节去达成目标;具备多种交互方式的智能体也将在极其复杂的状况下进行逻辑分析和任务操作。
此外,国产人工智能处理器即将开始“国产设计”与“国产制造”的批量供应,人工智能专用设备可能会在特定领域将部分用户需求从移动设备中分离出来,具有实体智能的物品例如通用型机器人有望首先在工业生产和物流配送过程中的选取、运输以及装配等环节开展商业应用。
以下是周志峰讲话记录(智东西在不改变本意的基础上进行了编辑):
一、AI投资热度不减,技术与应用进入“共振”周期
每年一次,难得相逢。首先感到格外高兴,能够再次在WAIC启明创投的创业与投资论坛上,和各位老朋友新朋友,不论是在现场还是观看网络直播的,相聚一堂。熟悉我们论坛的人都知道,每年都是我开启这个序幕,接着才会有后续的演讲和讨论。
今年我的主题是“技术向上攀升,应用向下延伸”。为何这样命名?回想2023年首次论坛上,我曾向大家倾诉过我的体会:作为AI领域的投资家,最深刻的感受便是“疲惫”。
那个时期美国大型模型企业频繁推出新版本,我常常在凌晨两三点钟就醒来,目的是为了获取那些公司发布新模型后为数不多的试用资格,以便及时体验最新的大型模型技术。
过去我曾提及,人工智能领域日渐喧嚣,然而每当某种“时代风潮”高涨之际,虚浮的声响便格外刺耳。身为一个资本从业者,如何在这片喧嚣中保持内心的沉静?能够形成独立的见解,凭借深思熟虑来规划未来,实属一项极为艰巨的挑战。
今年,AI行业展现出全新的发展态势:一方面,相关技术持续高速发展,前景广阔且不受限制;另一方面,技术在效能与经济性上取得显著突破,已具备实际应用条件,我们观察到广泛的部署已经展开,如同树根般稳固扎根、稳健成长,正在产生巨大的社会效益。
因此当前人工智能行业正经历一个特殊阶段,称之为“AI技术与应用的同步发展期”。启明创投在整个人工智能产业环节都有广泛投资,我们扶持了众多中国人工智能公司。
我们的信息与见解,并非凭空捏造,而是汇集了产业内部直接获取的资讯,这构成了我此刻十分钟讲述的根基。从投资人的立场出发,我依然甘愿付出辛劳,毕竟这是当前最引人注目的领域。
可以观察,2025年AI占据全球一半以上的投资比例。一个领域获取全球一半的投资,表明:即便AI大模型已经发展了两三年,人们依然觉得“它的前景非常可观”。不断有投资人intellij idea 14,拿出实际资金进行投资,持续向AI领域投入。
最近半载乃至整年,众多人士在探询:预训练这条途径是否已近终点,巨型模型的上限是否已显?律法效力是否随之衰减?然而,依据资本界的“裁决”,情形并非如此。2024年,模型相关企业获取了330亿美元资金,此数额占据全年全球风险投资总额的将近二十比率。
二、大模型关键能力跃迁,推理与多模态成技术主线
这也反映出,大型模型的进步速度依然很快。在最近的一年时间里,大型模型实现了许多重要的创新,例如多专家模型架构、人造数据集、以及更宽泛的上下文处理范围等。若要我挑选出一两项最核心的技术突破,首当其冲的便是其推理能力的显著提升。
早先的模型依靠庞大的token数量进行信息压缩训练,在接收到提问后,仅将信息传递给使用者。当前,模型已获得推理功能,能够进行更精密的逻辑思考,既可前瞻性分析,也能回顾性审视,展现出极为丰富的能力。这种改进带来的成效十分显著。
去年那个时段,我们讨论的是GPT-4o,那个时期,它是性能最突出的模型。然而,若以人类智力考核的尺度来衡量,它的得分仅在70分左右。可以回想一下电影《阿甘正传》中的主角Gump,他的智商是75分,被归类为“轻微的智力障碍者”。因此,当时的大型模型,也处在“人类轻微智力障碍者”的程度intellij idea 14,仅能处理基础的应用,无法胜任繁重的任务。
如今,新式推理工具,诸如上周五面世的“阶跃星辰Step-3”工具,其智能程度已接近120分。这说明了什么?全球八十亿人口中,高达87%的人的才智处在90至120区间。换言之,这类大型工具的智能水准已经超越了超过八成人类的才智层级。这是相当关键的发展。
另一个核心要素是“多模态”。以往,我们提及“大语言模型”,然而语言仅是人类感知和沟通的一种方式。倘若能够整合声音、画面、影像,乃至未来物联网的多元资讯,那么模型对世界的认知与互动将更为多元和立体。
语言驱动的模型之外,图像及视频制作模型的进步也很显著。今年五月,谷歌推出的“Veo 3”,已经能够制作出极为逼真的影像,并且能自动配置声音效果、对话内容、环境杂音,让人感觉仿佛是在观看现实生活中的视频资料。
我们参投的生数科技,先前也推出了更新的视频生成工具。这个工具能够接收“最多七个对象”(包括人物、动物、车辆等)的参考图像,并且在生成的影片中维持这些对象“极为相似的形态”。
三、Agent进化走向“七月定律”,AI产品应用迈向全球
接下来谈谈智能体,这已是今年三月以来最热门的议题,智能体走红,根本原因在于基础模型性能得到改善,比如上下文容量增加,能够调用外部资源,关键在于“推理功能”更为出色,如今甚至诞生了“智能体发展规律”——任务解决难度每半年增长一倍。我们不妨设想Agent在再经历一两个为期七个月的阶段之后,其智能程度将发展至何种地步。
今年一月,V3/R1模型问世,引起世界广泛关注。该模型在计算开销方面表现突出,仅相当于同类产品的百分之五。因此,全球各大人工智能团队纷纷致力于降低成本。谷歌进一步削减开支,而阶跃星辰最新研发的模型,其计算开销又有所减少。目前市场上普遍使用的大型模型,即便不采用压缩技术,完整规模的模型每处理一百万个符号所需的费用也降低到大约一美元,与去年相比,降幅接近百倍。
讨论完技术层面,接下来要关注应用层面。这款广为人知的产品,可以说是本次人工智能发展热潮的导火索。2023年7月,在首次于WAIC举办论坛期间,其周活跃用户数不足1亿;到了2024年再次举办论坛时,这一数字已经翻倍达到2亿;而目前周活跃用户总数已经接近八九十亿。人工智能应用领域的进步速度十分惊人。
哈佛商业评论近期提出了一个现象,AI产品正从提供创意支持转变为实现深度交流。以往我们借助AI进行图像创作或文案构思,并借鉴其构思。如今,用于情绪疏导的辅助工具最为普遍,它们切实帮助人们找到情感宣泄的途径,扮演起虚拟伙伴的角色。
应用的热度可以通过Token调用量看出,以豆包为例,它在12个月内的调用量增加了超过100倍。
硬件领域同样传来好消息。我们支持的“未来智能”发布的翻译耳机,用户数量已经超过一百万。来自华人的Plaud AI团队专注于北美市场,其用户规模也刚刚达到百万级别。
最新的人形机器人项目在中国启动实施。举例来说,就在两个礼拜以前,优必选公司获得了全球规模最大的此类机器人合同;同时智元科技和宇树公司也成功争取到了具体应用场景的订单。
如今存在一种现象,即“全球一体化”。原先网络企业多遵循“立足本土,逐步走向国际”的模式;然而当前,人工智能产品却“天生具备世界性”。以快手旗下的可灵人工智能为例,其网页服务的八成访问量源自海外地区。再看生数科技推出的视频制作软件Vidu人工智能,自发布三个月以来,注册用户数已突破千万,其中超过八成的用户同样分布在全球各地。
四、十大预测:基础突破、应用转向与硬件新形态
我们每次交流的收尾,也是核心的部分,要再度考验一下自我,向各位介绍我们对于未来十二到十八个月的十项预测。
1、基础模型上下文窗口突破
今年预期,首要涉及基础模型方面,我们相信此类模型将涌现诸多革新,不过有一点可以肯定,就是未来十二个月里,中国与美国领先的基础模型,其上下文窗口规模将突破两百万Token。注意力机制等设计思路的革新,促使长文本处理水平快速提升;而要创作出内容翔实、逻辑严密且符合背景的优质作品,就必须拓展分析的语境范围。
2、通用视频模型进入实用期
第二点涉及跨模态框架,不仅包含我们启明自身的考量,还融合了众多企业家、科学家、开拓者的见解。
本行业预测,未来两三年内,会出现一种真正的通用视频模型,这种模型能够应对视频领域的多种挑战,涵盖内容创作、逻辑分析和工作目标解析,从而推动内容创造与互动模式的深刻变革。
3、Agent迈入“数字员工”时代
接下来要谈的是AI Agent。AI Agent是当前备受关注的一个议题。我们预测在未来的12到14个月期间,Agent的表现将会从“作为工具的补充”转变为“真正地承担工作”。
我们预测,在接下来的两三年里,会出现第一批具备实质作用的“数字劳动力”,他们将在公司的多个核心部门发挥作用,包括技术开发、市场拓展、日常管理和客户维护等方面。这些人工智能助手将不再局限于辅助角色,而是转变为能够创造价值的工具,它们能够独立负责目标管理、及时汇报进展,并与其他人员紧密配合完成任务。
4、多模态Agent将不断走向实用化
这种新型智能体能够整合图像、声音、感应器等多种信息来源,开展深度分析、借助工具完成工作以及处理具体事务,在医疗、金融、法律等领域首先取得显著进展。
5、更多国设国造的GPU开启批量交付
接下来涉及AI的硬件基础,首先是处理器。预计在接下来的一两年间,将会涌现出大量具备国产化设计和国产制造的图形处理器产品。
中国团队研发的GPU,并且在中国本土供应链制造,现已具备真正面向市场,实现规模化供应的条件。这对于中国人工智能产业来说,无疑是一则重大利好消息。
不过也有许多新兴AI芯片正在挑战传统GPU的“冯诺依曼架构”,例如采用3D内存堆叠技术的产品,以及实现通算融合设计的芯片,这些创新产品正逐步进入市场,开始获得关注。
6、AI Infra侧将大幅降低Token成本
下面是我们对另一项人工智能基础建设层面的分析。近两年内,推理费用已经降低了百倍以上,我们认定这一态势还将持续。
未来12至24个月,Token的消耗程度还将大幅度攀升,增长幅度可达原有数值的一至两个数量级。集群推理性能的改善、终端推理效率的提升,以及软硬件结合的优化措施,将构成AI基础设备进一步削减Token使用成本的核心途径。
7、AI催生“非屏幕中心”的新型硬件
接下来谈谈实际应用,我们很有信心很快会迎来一次“模式转换”。以往或当下的主要应用,都是依托手机,采用“人+屏幕”的交互模式。这种以屏幕为核心的人机互动方式,正逐渐无法适应人工智能能力的进步。
未来将涌现众多更为自然、更契合人类特性的“人与机器沟通途径”,这将重塑我们运用手机的方式。或许不久的将来便会诞生一种兼具AI功能且贴近人类需求的新型设备形态。当年手机曾于十五年前、二十年前将诸多个人对电脑的依赖“迁移”过来,新一代的器具,亦会将我们当前许多人类需求从手机上“迁移”开去。
8、垂类切入成为创业破局关键
站在投资人和创业者的立场,我们其实更倾向于持续深耕。我们的策略是:要选定一个狭窄的专业领域,并对其进行透彻的研究。这样公司才能更有效地与大企业形成不同,摆脱所谓巨头的笼罩。
9、AI-BPO模式崛起
另有一种AI应用的趋势值得关注,这些年,商业运作方式持续演进,从单纯的产品销售,逐步转向提供订阅服务,模式日益多样化。目前,一种名为“AIBPO”的新形态正在快速兴起,它指的是由人工智能技术支撑的业务流程外包服务。
人工智能业务外包形态预计在接下来一两年内达成商业上的重大进展,其服务重心将从提供执行手段转变为确保成效,同时会借助以成效作为支付标准的机制,在金融、客户服务、市场推广、网络零售等具备流程规范性的领域迅速铺开。
10、具身智能将在三个场景率先落地
最后一项预测,涉及近期备受关注的“具身智能”领域。众多媒体纷纷向我咨询:这类智能机器人,究竟会在哪些具备实际价值的场景率先部署?而非仅仅用于展示表演?我们预测,未来一两年之内,将首先在拣选、运输以及组装这三个场景实现应用,而且会以“大规模部署”的形式出现——我所说的“大规模”,指的是数量达到“千台以上、万台以上”的规模。
我们认为这非常重要。必须先在一些具体应用中取得成效,才能产生“从算法、知识库到应用数据”的循环促进作用,进而带动整个机器人智能领域快速进步。
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码