加入收藏 | 设为首页 | 会员中心 | 我要投稿 南京站长网 (https://www.025zz.com.cn/)- 自然语言处理、建站、经验、云计算、图像分析!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

Wayve演示GAIA-1自动驾驶世界模型,号称可预测事件看见未来

发布时间:2023-10-12 09:30:21 所属栏目:外闻 来源:未知
导读:   英国初创公司 Wayve 大方披露其在 GAIA-1 上开发的新型生成式模型,在今年 6 月的时候,Wayve 建立了将生成式模型用于自动驾驶的概念性验证,而在这几个月中,Wayve 公司持续扩展 GAIA
  英国初创公司 Wayve 大方披露其在 GAIA-1 上开发的新型生成式模型,在今年 6 月的时候,Wayve 建立了将生成式模型用于自动驾驶的概念性验证,而在这几个月中,Wayve 公司持续扩展 GAIA-1,使其拥有 90 亿个参数,能够生成逼真的驾驶场景影片,展示自动驾驶“在各种情境的反应”,并且更好地预测未来事件。
 
  GAIA-1 是一个可以利用不同类型的资料,包括影片、文字和动作,创建逼真驾驶场景影片的世界模型(World Model)。可对自动驾驶车辆的行为和场景特征进行细致的控制,且由于 GAIA-1 多模态的性质,能够从多种提示模式和组合中生成相关视频。
 
  另外据悉,GAIA-1 机器人会先通过运用人工智能专门的编码器,将用户的影片或文字等各种形式的输入,有效地编码成一个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。
 
  而 GAIA-1 的核心,是一个自回归 Transformer,能够预测序列中下一组图像 token,世界模型不只考虑过去的图像 token,还参照文字和动作 token 的上下文资讯,运用这个方法所生成的图像 token,不仅会在视觉上连贯,而且和预期的文字和动作指引保持一致。
 
  在此之后,模型会启动视频解码器这个阶段被启动,主要功能是将这些图像 token 转换回像素空间,视频解码器作为一个扩散模型,其强大之处主要在于可保证生成的影片,具语义意义、视觉准确且时间序一致性。
 
  从官网得知,GAIA-1 的世界模型经过 64 个英伟达 A100 GPU 上长达 15 天的训练,包含了高达 65 亿个参数,而视频解码器则在 32 个英伟达 A100 GPU 上训练了 15 天,总共拥有 26 亿个参数。15天,总共拥有26亿个参数。这些数据将被存储在一个专门的硬盘上,用于分析gpu性能。nvidia表示,这些数据将在未来几个月内公布。

(编辑:南京站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章