重新定义“生成式AI”,谷歌DeepMind推出世界模型Genie 3

音符科技网

  来源:华尔街见闻

  谷歌 DeepMind 周一宣布推出第三代通用的世界模型 Genie 3 ,可以生成前所未有的多样化交互式环境,给出文本提示,Genie 3 可以生成动态世界,可以以每秒 24 帧的速度实时导航,并以 720p 的分辨率保持几分钟的一致性。

  Genie 3将首先以有限研究预览的形式,向一小部分学者和创作者开放 Genie 3,以收集关键反馈。

  Genie 3 的突破

  DeepMind 在模拟环境领域已有十余年的深厚积累。从训练能玩转即时战略游戏的 AI,到为开发开放式学习环境,这些研究都指向了一个共同的目标:构建强大的世界模型。

  与前代模型(如 Genie 1/2)和视频生成模型(如 Veo 2,Veo 3对直觉物理学的深刻理解)相比,Genie 3 是之一个允许实时交互的世界模型,同时与 Genie 2 相比,其一致性和真实感也得到了提升

特性

Genie 2

Veo

Genie 3
分辨率

360p

720p 至 4K

720p
领域

3D 环境

通用

通用
控制方式

有限键盘/鼠标

视频级描述

实时导航;可提示的世界事件
互动时长

10-20 秒

8 秒

数分钟
互动延迟

非实时

不适用

实时

  核心能力

  模拟世界的物理特性: Genie 3 对物理规律有深刻理解,能逼真地模拟水流、光影变化以及复杂的环境互动,例如直升机在悬崖瀑布边小心翼翼地机动

  模拟自然世界: 从冰川湖畔充满生机的生态系统,到幻想世界中可爱的毛茸茸生物在彩虹桥上跳跃,Genie 3 能将想象力转化为可探索的现实

  动画和小说建模:可以发挥想象力,创造奇幻的场景和富有表现力的动画角色

  探索不同地域与历史场景:模型能超越地理和时间的限制,带领用户探索不同地点和历史时代,无论是身穿翼装飞越雪山,还是置身于历史悠久的古城

  突破实时性能的极限:实现高度的可控性和实时交互性,在每一帧的自回归生成过程中,模型必须考虑先前生成的随时间增长的轨迹。例如,如果用户在一分钟后重新访问某个位置,则模型必须引用一分钟前的相关信息。为了实现实时交互性,这种计算必须每秒进行多次,以响应新用户输入的到来

  长时程环境一致性: 为了让人工智能生成的世界身临其境,它们必须在很长一段时间内保持物理上的一致性。然而,自动回归生成环境通常比生成整个视频更难的技术问题,因为不准确之处往往会随着时间的推移而累积,Genie 3 环境在几分钟内基本保持一致,视觉记忆可以追溯到一分钟前,Genie 3 生成的世界更加动态和丰富,因为它们是根据用户的世界描述和作逐帧创建的

  可提示的世界事件 (Promptable World Events): 除了导航输入之外,Genie 3 还支持一种更具表现力的基于文本的交互形式,称之为可提示的世界事件 。可提示的世界事件可以改变生成的世界,例如改变天气条件或引入新的物体和角色,从而增强导航控制的体验,这种能力还增加了反事实或“假设”场景的广度, *** 可以使用这些场景从经验中学习来处理意外情况

  赋能具身智能体研究

  Genie 3 的终极目标之一是为具身智能体(Embodied Agent)提供一个无限丰富的训练场。DeepMind 已将其与通用智能体 SIMA进行结合测试。研究人员可以为 SIMA 设定一个目标(如在面包房里找到工业搅拌机),SIMA 则通过向 Genie 3 发送导航指令来尝试完成任务。Genie 3 像一个真正的世界一样,根据 SIMA 的行为实时反馈结果,从而让智能体在海量的what if场景中学习和成长

  当前的局限性

  Genie 3目前存在的局限性:

  行动空间有限: 智能体的直接行动范围仍受限制

  缺乏多智能体模拟: 难以精确模拟多个独立智能体之间的复杂互动

  地理精度不足: 无法完美复现实世界的地理位置

  文本渲染较差: 除非在初始提示中指定,否则生成的文本通常模糊不清

  互动时长有限: 目前支持数分钟的连续互动,而非数小时

  本文作者:AI,原文标题:《谷歌DeepMind深夜放核弹:世界模型Genie 3登场,重新定义“生成式AI”

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 中国驻墨尔本总领事馆通报塔州中国留学生被打伤案最新进展
  • 最高法重拳整治高利贷、砍头息,叫停银行“随意抽断贷”行为
  • 中国留学生被当地五名未成年人殴打致重伤,驻墨尔本总领事馆通报最新进展
  • 甘肃榆中受灾区域80%已恢复供电,15名伤员已送医治疗
  • 餐饮店使用草酸清洗龙虾,南京公布4起涉及食品安全案例
  • 千岛群岛以东海域发生6.0级地震,震源深度10千米
  • 2025世界机器人大会观察:机器人越来越强,集体“找活干”
  • 小米汽车在丢掉消费者信任吗?
  • 伊朗处决一名核科学家!他被指是以色列间谍,因泄露伊核机密被判死刑
  • 50年来,共有197个批次超过2000名中国医护人员驰援摩洛哥——“中国医疗队是摩中友谊的使者”(新时代中非合作)
  • 6岁女童殒命酒店水上乐园,夺命14分钟:母亲拼尽全力却无能为力……
  • 法治课|法律是如何界定网暴的?与正常的批评、维权有何区别?
  • 泽连斯基与欧洲三国领导人通电话,讨论结束俄乌冲突等问题
  • 柯文哲:告诉赖清德,我绝不投降
  • 美俄往事:那些起起伏伏的“顶峰相见”
  • 靴子落地,宁德时代枧下窝采矿端确定停产!相关人士:短期未有复产计划
  • 加沙地带媒体办公室:以方蓄意制造混乱致援助物资被抢
  • 何以中国|中新网评:以六百年和合水韵,成世界之津,答时代之问
  • 事关存钱取钱!超过5万元或将全面尽调
  • 韩再芬带着新剧《延年和乔年》来到上海,黄梅戏演绎安庆子弟
  • 又有个股,被外资买到“限购”
  • 中超争冠悬念回归!上海德比海港击败申花,积分仅落后1分
  • 何以中国丨天津:从百年风华到科创未来
  • 巴勒斯坦,会亡国么?
  • 甘肃榆中县95%灾毁道路已恢复通行
  • 华裔女子在澳洲出车祸交了天价保释金?确获保释,但保释金信息未披露
  • 广西北海被雷击的比亚迪宋PLUSEV车况首次曝光
  • 万岁山NPC被游客锁喉抢银票,景区回应:及时制止,NPC身体无碍
  • 24岁中国男子落地柬埔寨数小时内身亡,监控曝光:被绑架带往网赌园区
  • 大河奔涌万象新丨陕西韩城:以金文铭刻唤醒尘封千年的“芮国记忆”
  • 女子逆行与骑车小伙发生剐蹭,小伙只回答“我听交警的!”
  • 包头通报人才引进问题调查处理结果:讲师团主要负责人被免职
  • 【文物里的抗战记忆】小纺车背后的延安大生产运动
  • 盐城市政府秘书长徐宁建被查,9个月内已有多名建湖县委原常委被查
  • 北京新政执行首日:购房者高温下看房,房企火速营销抢客
  • 包头通报讲师团人才引进问题:讲师团主要负责人被免职
  • 西安雁塔警方通报汉服馆消费冲突:顾客涉嫌寻衅滋事被拘6天
  • 俄美领导人为何急于落实会晤又为何选在阿拉斯加?
  • 印官员称印度暂停购买美国武器
  • 佛山超九成基孔肯雅热病例已痊愈,是否有后遗症?解答来了
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码