发布时间:2026-05-19
浏览次数:0
带领IDEA研究院,也就是粤港澳大湾区数字经济研究院,走过第五个年头的沈向洋,新鲜分享了他用来梳理智能演进所依据的五个维度,——。
身为IDEA研究院创院理事长,相较于给出一条技术路径路线图,他更期望提出一个识别机会的思考框架,从而助力创新者,使其在智能演进历程里,寻找到技术、产品以及商业的切口。
源于对算法范式这一维度予以考量,AI算法历经了从构建和展现表达以及生成具备的能力的监督学习时期,进而发展达成引入因果关联以及执行方面情况的强化学习时期。
后面,将继续朝迈向高层认知的自主学习阶段探索。
立足智能载体这一维度来考量, 当前所聚焦的要点, 已从语言以及多模态模型, 转变至世界模型和具身模型。
这个变化反映出智能载体正从抽象符号空间迈向物理空间。
在人机交互维度上,沈向洋强调交互创新的重要性。
在过去的70年当中,人机交互历经了从命令行,到图形界面,再到搜索,接着是推荐,直至自然交互的多次范式迁移,而每一次这样的迁移背后,都对应着底层技术浪潮所发生的变化。
产品开发者在今天,必须要能够看懂,由智能特性所带来的交互机会。他与此同时还提到,自然交互在其内部,也存在分层的情况:
被动响应,交互式执行,具备提议能力的主动模式,交互方式从文本扩展到语音,从语音扩展到手势,从手势扩展到未来的脑机接口。
在计算架构的维度方面,已然呈现出这样一种趋势,即从通用朝着专用转变,从单一朝着多元发展。GPU对深度学习的第一波爆发起到了刺激作用,然而,其能耗以及成本也在持续不断地攀升。
因而,性能、成本以及能效成为众望所趋的全新平衡点是这样的情况,推理、呈现于客户端的那部分、强化学习等适配各异应用任务的专门用途芯片接连不断地出现形成众多态势。
最后提及数据,于模拟世界的阶段之时而言,数据属于静态教材,于探索世界的阶段之际来讲,数据是动态反馈;于归纳世界的阶段当中而言,数据为验证假设的证据。
随着人类数据走向枯竭,合成数据开始兴起,而后AI主动展开探索并且获取实验数据,在这些变化的背后,所体现出来的是,数据从曾经限制模型能力的那种约束,一步步地转变成了推动AI主动学习的工具。
综上,不难得出沈向洋的:
机会并非单单源于技术本体,还源于明白技术怎样去改变载体、交互、计算以及数据的方式,怎样再度分配能力、资源以及价值。
此外,沈向洋特别提到对未来个体和未来公司的思考。
要是个体的能力借助AI得以放大,那么好多那种原本得靠多环节协同合作的任务,能够由单个个体从起始到末尾全部完成。
在某些领域当中,组织的重心,会从管控演变成为,去定义问题,以及融合个体之间的协作。
他打趣地说道:
我想未来的CEO应该怎么定义呢?
可能不是Chief ,而是Chief (首席氛围官)。
还发布了啥?一揽子创新项目
此次大会之时,IDEA研究院另外宣告了国际先进技术应用推进中心(深圳),还有深港高等研究交流中心(SHARE)这两个创新平台,以及一系列创新项目。
量子位选取了与具身、AI-编程语言等项目与大家分享——
从视觉切入,发布“万物可抓取”DINO-X Grasp模型
由张磊作为负责人的、IDEA 研究院的计算机视觉与机器人研究中心,在 2025 IDEA 大会上,首次对研究院于具身智能方向所产出的最新成果进行了系统介绍:
DINO-X Grasp。
过去的两年当中,具身智能突然之间有了显著的发展进步,有不少的团队都试着借助VLA(视觉-语言-动作)这样的大模型架构,想要达成让机器人如同人一般能够听得懂所说的话,能够看见并理解这个世界,还能够灵活地做出相应的动作。
但这条路线背后的问题很快浮现出来:泛化能力不足。
有这样一个情况,就是与其着手于动作建模,倒不如啊,先把“看清楚”这个问题给,解决得更为彻底,而这呢,成为了IDEA研究院发力的突破口。
IDEA团队过往在开集目标检测以及视觉感知方面有着研究积淀,在此依托之上,以具有强大泛化能力的视觉检测模型DINO-X作为基础,IDEA研究院进而发起了DINO-X Grasp项目。
这个模型,能够精准识别物体,能够预测抓取点位,会结合深度信息,将会还原物体的三维结构,进而指导机械臂,完成稳定的操作,实施精确的操作。
更重要的是,它不挑设备也不挑场景。
在现场所展示的视频里头intellij idea 2026,由DINO - X Grasp进行驱动的机器人,能够灵活地去应对各种各样形状不相同的物品,从食品包装袋开始,一直到异形障碍物,每抓一次都能精准抓住。
现在,这一套方案已经在招商局集团的好些个不同子公司当中得到了应用,其应用范围涵盖了港口集装箱验残,桥梁螺钉检测,夜间车辆识别等诸多复杂场景。
与之不同的是,DINO - X Grasp,已然跟美团机器人研究院,构建起了合作的关系。
张宏波团队:中国人写的编程语言有了10万用户
写过语言的张宏波,现在又带领团队在IDEA研究院开发。
沈向洋专门提了出来,张宏波是他晓得的,唯一一个所写的编程语言,在全世界有着以万作为计量单位人数正在使用的人。
他带领而出的团队,直至2022年年底方才成立,恰好遇见了陡然出现。张宏波于台上进行分享时分阐述道:“身为全新的编程语言,(于这个时间节点遇上),能够使我们获取到机会去再度思索于AI时代情形下该如何去打造开发者工具。”。
专门为AI时代设计。
它是编程语言发展历程之中首个原生配备AI助手的语言,并且为语言模型构建了基于语义剖析方式的IDE。
在数字计算之类的基准测试里,表现出了出色的性能,这一点更为重要,其性能在这些测试中超越Java将近10倍,后端代码体积要远比Rust小30%,只是Go的二分之一,为后者代码体积的50%。
在过去一年半的时间里头,先是从一种能够支持多个后端程序的编程语言开始,接着逐渐地进行演变发展,成为了一套完整的、全面的工具链条,其中囊括了得以为人工智能专门设计的、原生性质的工具集合,最后终于成功建构起了一个,在上面既能够集合开发者所需要使用的工具链条,又能够形成智能体开发所需生态环境的开发者平台。
张宏波透露,存在商业付费客户了,其中有北美的云厂商,用其开展服务器开发。”多数编程语言在前四年、前五年并无知名度,而我们在如此早期阶段便积累了众多用户。”。
就当下而言,表示,用户数量从去年的2.6万,发展到如今已超过10万。张宏波预估在2026年年底的时候,会有将近100万用户,“达成首个自中国迈向全球且拥有世界影响力的开源平台”。
提前预告一下:
智能体平台agent SDK,下个月将正式开源,它是用编程语言开发的,且支持使用多种编程语言。
GPU渲染器:五年磨一剑,打破国外垄断
王嘉平团队有GPU渲染器,这一渲染器是更为直观的,它是IDEA研究院的新近成果。
王嘉平在演示的时候介绍说,电影工业的渲染跟游戏是完全不一样的,在电影工业里intellij idea 2026,一个镜头通常包含着六百个G数据,游戏那是要求毫秒级响应的,电影渲染一帧画面呢,有可能需要几个小时,甚至有时候得需要一天。
目前全球电影渲染市场被三家公司垄断:
占据半壁江山的是美国,剩余市场则由皮克斯的以及欧洲的V-Ray进行瓜分。
此前,《流浪地球》等国产大片几乎必须使用渲染。
经历了漫长的5年光阴,从根基算法起始,而后迈向工业标准集成,最终IDEA研究院成功推出了渲染器。
现场演示环节,王嘉平展示了的实时渲染能力——
用几秒钟就渲染完成了,原本身材高大形象威猛的雄狮的场景图,而这场景图原本是需要花费几分钟时间才能够看清的,再就是还能够如同玩第一人称射击游戏那样在其中自由自在地进行场景中的一番探索了。
更令人感到惊喜的是,它不但支持英伟达GPU,而且支持AMD,还支持国产GPU,甚至支持苹果芯片。
当下,《流浪地球》特效制作的那一方,《哪吒》制作的光线动画等处于顶级行列的公司,已然着手开始运用。
— 完 —
量子位 · 头条号签约
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码