你好,欢迎进入江苏优软数字科技有限公司官网!

诚信、勤奋、创新、卓越

友好定价、专业客服支持、正版软件一站式服务提供

13262879759

工作日:9:00-22:00

谷歌DeepMind推出Project Genie,AI工具助力AGI研究

发布时间:2026-02-02

浏览次数:0

一款名为Genie的AI工具被推出,它能够借助文本或者图像来生成交互式3D世界。这个实验性原型当前仅仅是面向美国AI Ultra订阅用户开放的,其目的在于收集反馈并且推动AGI研究。在其中,用户可以进行探索以及对世界进行重混,不过每次体验是有着严格时长限制的,而且真实感和物理效果依旧是有待提升的。

Key

1. 发布 Genie

一款名为Genie的AI工具发布了,它能凭借文本提示或者图像来创建交互式游戏世界,Genie概述中提到,此工具已面向美国AI Ultra订阅用户开放,目的是收集用户反馈以及训练数据,以便开发出更强大的世界模型

世界模型概念与重要性

由AI系统构成的世界模型,其作用是生成环境的内部表示,还能够预测未来结果,并且规划行动,而这些行动是依据控制输入来创建响应式视频的,此视频能让用户如同探索虚拟世界那般进行模拟。

许多针对AI领域的领导者,那些其中包含的专家,都觉得世界模型与AGI的意义相关那是实现通用人工智能的关键一步,世界模型能够使得AI代理去对世界演变加以预测,还有对自身行为所产生的影响进行预测,进而能够去探索无限的真实环境,如此。

世界模型市场存在竞争,世界模型领域竞争正日益变得激烈起来,World Labs推出了首款商业产品,AI视频生成公司发布了世界模型,前Meta首席科学家Yann LeCun所在的AMI Labs也会专注于世界模型开发。

Genie的潜在应用

近期的应用方面,是游戏以及娱乐,设想一下,Genie的近期应用会从视频游戏还有其他的娱乐形式起始,并且会逐步朝着训练模拟环境里的具身智能体(也就是机器人)去扩展。

以后的应用方向:训练以及模拟 ,Genie接下来能够被应用到电影的制作过程当中,还有有交互性质的教育类媒体方面,汽车进行自动驾驶测试的时候也可以用它,教育领域以及视频游戏的开发进程里面它也能发挥作用。它还能够在帆船训练时派上用场,医学领域,经济范畴,以及社会影响的模拟工作都可以借助它 ,甚至借助截屏的方式以此来对影视后期的工作流程作出改变。

2. Genie功能与操作

核心功能

创建环境以及角色,用户能够做的方式是既可以借助文本提示,也能够利用上传图像,并且还能挑选第一人称或者第三人称视角,这是在世界草图绘制时做到的。Nano Pro会生成图像预览,之后用户能够给予修改,然后于这个基础之上,Genie会构建交互世界句号。

在世界探索里,供用户创建的世界属于可导航环境,Genie能够依据用户行动当下实时生成前方路径,并且还允许对镜头作出调整,于此期间用户能够控制角色进行移动,也能够改变方向,而世界会伴随此情况而不断生长,展现出呈现出动态变化的景象。

用户,可依据现有世界所给出的提示词来构建,将那些提示词,重混成为完全是新一种的诠释,还能够去探索图库,或者借助随机功能来获取灵感,并且在获取灵感的这种基础之上进行创作。当完成探索之后,用户能够去下载世界,同时还能下载探索过程的视频。

Genie由最新世界模型Genie 3、图像生成模型Nano Pro共同驱动,提供技术支撑,Genie 3具备突破性的一致性,可针对动态世界模拟物理及交互。

Genie所生成的视频,其分辨率是720p,帧率为24fps,这属于技术规格范畴。它具备实时渲染前方既定路径的能力。并且,它还支持凭借键盘方向键、空格键以及W-A-S-D键来达成移动以及跳跃这样的操作。

3. Genie的局限性与改进方向

当前局限性

生成效果存在不稳定状况,Genie于生成艺术风格的世界之际展现出出色表现,然而在生成逼真样式或电影风格的世界之时却常常浮现问题,其效果相较于真实场景而言更类似视频游戏googie sketch up80,它对于真实照片的响应同样欠佳googie sketch up80,所生成的物体有可能显得呆板且具数字化特征。

交互跟物理限制所生成的角色,有时很难去控制,有可能穿透墙壁或者固体物体。世界模型在物理法则、时间连贯性以及持久记忆方面依旧存在不足,可能会出现生成伪像的情况,进而导致认知不适或者VR晕动症。

关于内容生成存在着限制,Genie没有办法去生成那种呈现裸体状态或者是受到版权保护的内容,就好比迪士尼角色那样算受版权保护的类型。在进行测试的过程当中,有一些涉及任天堂游戏的提示词被予以阻止,其原因就是所谓的“第三方内容提供商的利益”。

目前,Genie每次世界生成存在时长限制,时长被限制为60秒,导航时长同样限制为60秒,部分原因在于预算方面的限制以及计算资源方面的限制。Genie 3属于自回归模型,它需要大量的专用计算资源。

用户反馈操作体验存在不佳情况,比如导航键不灵敏,或者致使出现错误方向,进而让移动变得混乱,操作体验不佳。研究总监认可了这些缺点,同时强调Genie仍旧是实验性原型。

希望未来朝着改进方向,团队能增强Genie的真实感,改进其交互能力,赋予用户更多对动作以及环境的控制权,并且还计划逐步扩大Genie的访问范围。

4. Genie的访问与费用

美国已向年满18岁的AI Ultra订阅用户开放Genie访问权限,用户能够通过Labs访问该工具,并且未来有着逐步扩大访问范围的计划。

供订阅的费用,AI Ultra这一具备的订阅费用,是每月250美元,如此高昂的订阅费,体现出的则是生成AI视频所需的巨大计算成本。

如有侵权请联系删除!

13262879759

微信二维码