发布时间:2025-07-06
浏览次数:0
钛媒体AGI报道,1月8日上午,位于北京的智源人工智能研究院(简称“智源研究院”)发布了《十大人工智能技术及应用趋势》这一报告。该报告涵盖了诸如“具身智能”、世界模型、合成数据等新兴的AI技术趋势,旨在深入分析科技发展的脉络。
王仲远,智源研究院的院长,指出我们正站在人工智能发展的新转折点。大型模型能力的快速涌现正加速通用人工智能(AGI)时代的来临。原生统一的多模态、具身智能以及AI for,这些都将进一步加深人工智能对世界的感知、理解和推理能力,实现数字世界与物理世界的连接,并推动科学研究的创新和突破。智源研究院,作为一家专注于AU领域的研究开发新型机构,期望在当前这个重要时刻,以十大趋势为基准,为人工智能技术领域描绘出明确的发展路径,并与各方携手同行。
林咏华,智源研究院的副院长同时也是总工程师,在会议中提到,众人普遍渴望看到人工智能的智慧超越人类,达成通用人工智能(AGI)的境界,并且能够从虚拟的数字领域跨越至真实的物理世界,甚至有望在将来协助我们探索那些尚未被认知的领域(世界)。然而,随着AGI目标的逐步推进,多种路径和方法(如同百花齐放)将在实现这一目标的过程中涌现。至于究竟哪条路径能够引领我们抵达终点,以及我们距离真正实现AGI还有多长的路要走,这些问题目前尚未有明确的答案。
在智源研究院发布的2025年十大AI技术趋势中,位列首位的是AI for (简称AI4S),它引领着科学研究方法的变革。据数据显示,到2024年,科研工作者运用AI技术的比例显著提升,约有一半的科研工作者相信AI将对他们的研究领域带来正面效应。然而,在美国这一比例仅为28%,而在印度则高达41%。这意味着,AI对科学研究方法和流程的变革效应也开始显现。
诺贝尔物理学奖与化学奖相继授予了人工智能领域,这一举措促进了科研与人工智能技术的深度融合,使研究焦点从单一任务的优化转向了对更为复杂、多变以及跨学科问题的探索。2025年,多模态大模型将在科学研究领域得到更深入的融合应用,它将助力对多维数据的复杂结构进行深入挖掘,同时,它还将辅助科研人员对科研问题进行综合性的理解和全面的分析,从而在生物医学、气象学、新材料研发、生命模拟技术以及能源科学等基础与应用研究方面开启新的研究路径。
趋势二:迈入“具身智能元年”,大脑、小脑与本体实现协同发展。到了2025年,“具身智能”的发展将沿着从本体向具身脑延伸的主线推进,对此sketch up 2025,我们有三点期待。在行业结构方面,我国约百家的具身初创企业或许将面临一次重新洗牌,制造商的数量逐渐减少;在技术发展路径上,从端到端的模型持续更新,而小脑与大模型的探索或许能够取得显著进展;在商业价值实现层面,我们有望目睹更多工业领域中具身智能技术的应用,部分人形机器人也将步入批量生产的阶段。
趋势三:所谓的“未来Token预测”:统一的多模态大型模型将推动人工智能的更高效率。人工智能的核心在于对人类思维信息处理过程的模仿,而人类在信息交互与处理过程中,往往展现出多模态、跨模态的输入与输出特征。目前通用的语言大模型以及拼接式的多模态大模型,在模拟人类思维过程时,不可避免地存在固有的限制。自训练伊始便着手整合各类多模态数据,成功构建了从输入到输出的全流程原生多模态技术路径,这一举措为多模态技术的进步开辟了新的道路。在此基础上,训练过程中便着手将视觉、音频、三维等不同模态的数据进行同步处理,确保了多模态数据的统一性,而打造原生多模态大型模型则成为了推动多模态大模型技术演进的关键趋势。
趋势四,在Law的拓展领域,强化学习(RL)与大型语言模型(LLMs)的结合日益显著,模型在泛化能力上实现了从预训练到后训练、推理迁移的跨越。随着基于Law推动的基础模型性能提升的训练模式“性价比”逐渐降低,后训练与特定场景的Law探索日益深入。强化学习,作为挖掘后训练、推理阶段Law的关键技术,其应用和创新使用也将迎来更广泛的推广。
趋势五:全球范围内的世界模型正迅速推出,预期将成为多模态大型模型的未来发展方向。据悉,这些模型更加强调“因果关系”的推理功能,为人工智能赋予了更高层次的认知能力以及更贴近逻辑的推理和决策技巧。这种能力不仅能够促进人工智能在自动驾驶、机器人操控和智能制造等领域的深入应用,还可能打破传统任务的限制,开拓人机交互的新前景。
趋势六,合成数据正逐步成为推动大模型迭代及实际应用的关键驱动力。然而,优质数据却可能成为大模型持续进步的障碍。合成数据已逐渐成为基础模型厂商补充数据资源的主要选择。这种数据类型能有效减少人工管理和标记的成本,减轻对真实数据的依赖,同时避免了数据隐私的担忧;此外,它还能丰富数据的多样性,从而增强模型在处理长文本和复杂问题上的能力。此外,合成数据的运用有助于减轻大型企业对通用数据的垄断现象,同时,针对专有数据,其获取成本较高的问题也能得到一定程度的缓解,进而推动大型模型在实际应用中的实施和推广。
趋势七:推理优化迭代的加速发展,已成为AI应用成功落地的关键因素。随着大模型硬件载体从云端逐渐渗透至手机、PC等端侧硬件,这些设备在AI算力、内存等资源方面存在限制,大模型的实际应用在推理环节将遭遇较大的成本开销,这对部署资源、用户使用体验以及经济成本等方面都构成了重大挑战。算法与硬件优化技术不断更新发展,两者共同推动着人工智能应用的快速实施。
在圆桌讨论中,蚂蚁集团大模型对齐项目的负责人温祖杰透露,在发布会现场,他们展示了一款名为“Her”的现实版本,用户可以与之进行实时交流,通过大模型来观察你的行为举止,并观察周围环境,使得交互过程更加自然流畅。这里的“多模态”不仅限于视频生成,实际上还包括了图文多模态以及OCR多模态等多种功能。蚂蚁集团的“探一探”功能,不仅具备拍照识图的能力sketch up 2025,还依托多模态技术支持多轮对话交流,这种设计更贴近用户的真实体验,有望在这些领域展现出良好的发展潜力。
趋势八:对产品应用形式进行革新,人工智能技术成为产品实际应用的关键途径。至2025年,具备更高通用性和自主性的智能体将革新产品应用形式,进一步渗透到工作和生活的各个领域,成为大型模型产品实际应用的主要形式。届时,我们将见证更多智能化水平更高、对业务流程理解更为深刻的智能体系统在应用层面的实际应用。
智源研究院行业研究组的负责人倪贤豪指出,从最初对AI应用形态的初步认知,到逐步深入,再到关注Agent与AI的结合,行业对AI应用形态的理解不断加深。特别是从Agent到AI的转变,这一过程不仅标志着行业从判断产品是否属于Agent,转向了对产品智能化水平的探讨,而且这一转变具有更为实际的应用价值。在未来的一年中,我们或许无法目睹众多显著的应用形态转变,同时,也未必会有众多全新的Agent应用模式涌现。
趋势九显示,AI应用的热度正在逐渐升温,而关于哪款Super App(超级应用)将脱颖而出,目前尚无定论。在过去的一年里,生成式AI模型在图像和视频处理方面的能力有了显著增强,再加上推理优化带来的成本降低,Agent/RAG框架、应用编排工具等技术的不断进步,为AI超级应用的普及奠定了坚实的基础。大型模型的应用正逐步提升其功能,并深入到AI原生应用的构建以及AI操作系统的生态重构之中。尽管关于Super APP的归属尚未有定论,但根据用户数量、互动频率以及用户停留时间等指标分析,AI应用的受欢迎程度持续上升,仿佛已站在应用爆发的前夜。
倪贤豪指出,现阶段开发“超级应用”仍存一定可能性。尽管移动互联网用户增长已达到顶峰,然而在非网民用户群体中,我们依然可以发现那些规模超过亿级、具备消费能力却因代际差异难以轻松接入网络的个体。这些用户正面临着诸如非现金支付、信息获取、线上购票挂号等基本需求问题。在应对这些挑战时,我们无需对Agent的智能化水平和自主性要求达到极致,只需依托于现有的优秀基础模型,并整合上述不同能力所对应的厂商接口适配(以及工具),便能够开发出一款能够满足目标用户群体需求的Agent。就目前而言,这样的模型构建和工程实现都是切实可行的。
倪贤豪指出,按照这一逻辑,如何实现不同厂商间的接口适配与封装,同样构成了一个关键议题。此类适配对接,实则对厂商在渠道构建与运营方面的能力提出了相应要求。
倪贤豪指出,鉴于以All in One为显著标志的超级应用叙事模式,大型企业或许拥有更大的胜算机会。他们所拥有的渠道建设能力相对较为成熟。然而,对于初创企业而言,这些任务必须从零开始逐步构建,其难度相当之大。
趋势十:在模型能力增强与风险防范方面,AI的安全管理体系不断得到优化。大模型的出现催生了新的现象,然而,这些复杂系统特有的现象,如不可预测性和循环反馈等,也给传统的安全防护措施带来了新的挑战。基础模型在自主决策能力上的不断攀升,随之而来的是潜在的失控风险。我们需思考如何采纳创新的技术监管手段,以及如何在人工监管中实现行业进步与风险控制的平衡。这些问题对于所有投身于人工智能领域的参与者而言,都是一项需要不断深入研究的课题。
温祖杰指出,AI的安全性呈现明显的“对抗性”特点,这种特性表现为相互制约的关系。换言之,随着攻击手段的增强,防御措施也会随之加强。因此,在提升大型模型安全能力的过程中,我们必须持续提高攻防两方面的能力。同时,采取“大模型对抗大模型”的策略,正成为一种积极的进步方向。此外,在安全围栏技术领域,我们必须严格保障信息的输入与输出安全,有效减少被攻击的可能性;为此,我们需要构建一套完善的策略体系以及综合的安全防护措施,进而促进人工智能大型模型在安全环境下的实际应用。
实际上,人工智能作为推动新生产力发展的核心动力,不仅彰显了科技发展的尖端方向,更是引领未来经济增长的核心力量,其已显著带来了可观的经济和社会效益。
IDC最新发布的研究报告指出,随着人工智能技术的不断深入实际应用,各大行业中的大型模型已在金融、医疗、教育、零售、能源等多个领域展开初步应用。据预测,到2025年,全球在人工智能领域的投入将达到2270亿美元。展望2030年,人工智能预计将为全球经济带来19.9万亿美元的贡献(约合145.9万亿元人民币),并助力全球GDP增长3.5%。而目前,几乎98%的企业领导者将AI视为其组织的优先事项。
在谈及对未来的展望时,众多行业内的专家们纷纷表达了自己的期待,他们希望能在2025年目睹类似GPT-5的下一代大型模型的问世,并且在大模型的安全性以及理论上的可解释性方面实现显著的突破。虽然我不确定这样的愿景是否过于理想化,但我的愿望是能拥有一个与人类学习效率相仿的人工智能。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码