96006资源网
当前位置: 首页>科技资讯>谷歌AI机器人项目创佳绩:836平米场景中,用户指令执行率飙升至九成

谷歌AI机器人项目创佳绩:836平米场景中,用户指令执行率飙升至九成

时间:2024-09-29 02:30:01

人气:3

编辑:96006资源网

近日消息,谷歌旗下的DeepMind团队正在利用名为Gemini的先进AI模型对其机器人进行训练,以增强它们在复杂环境下的适应能力和任务执行能力。

谷歌AI机器人项目创佳绩:836平米场景中,用户指令执行率飙升至九成

DeepMind 团队已经发表了最新的研究论文,利用 Gemini 1.5 Pro 的上下文窗口(达到 200 万个词元),让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。

注:上下文窗口(context window)是指语言模型在进行预测或生成文本时,所考虑的前一个词元(token)或文本片段的大小范围。

其工作原理是拍摄指定区域(如家庭或办公空间)的视频导览,研究人员使用 Gemini 1.5 Pro 让机器人“观看”视频以了解环境;然后,机器人可以根据观察到的情况,通过语言和 / 或图像输出来执行命令。

例如用户向机器人展示一部手机,并询问“在哪里可以充电?”,机器人会引导用户找到室内的电源插座。

DeepMind 称,在一个 9000 平方英尺(约 836.13 平方米)的操作区内,机器人在升级 Gemini 之后,测试发出 50 多条用户指令,成功率高达 90%。

研究人员还发现 "初步证据" 表明,Gemini 1.5 Pro 能让机器人计划如何完成导航以外的指令。

例如,当一位桌上摆放着许多可乐罐的用户询问机器人是否有他们最喜欢的饮料时,Gemini “知道机器人应该导航到冰箱,检查是否有可乐,然后返回用户处报告结果”。DeepMind 表示计划进一步研究这些结果。

谷歌Pixel 9系列新机搭载自适应触控技术:优化湿手操作,体验再升级

近日消息,谷歌Pixel9系列手机发布后,其隐藏的自适应触控功能悄然成为科技爱好者讨论的热点。这一未曾官方宣传的功能据说能智能调整屏幕触感反应,为用户带来更加流畅和个性化的操作体验。随着更多使用心得涌现,Pixel 9系列的惊喜特性正待用户进一步发掘。

谷歌Pixel 9系列新机搭载自适应触控技术:优化湿手操作,体验再升级

在设置 > 显示 > 触摸灵敏度下,Pixel 9 系列有一个新的自适应触控功能。启用自适应触控时,“触控灵敏度将根据您的环境、活动和屏幕保护膜自动调整”。

AndroidAuthority比较了具有自适应触控的 Pixel 9 与没有自适应触控的 Pixel 8 Pro 的触摸灵敏度,结果很明显:Pixel 9 在湿手指操作方面比 Pixel 8 Pro 表现更好。在 Pixel 9 上用湿手指触控非常正常,相比之下,在 Pixel 8 Pro 上用湿手指触控时会出现随机的跳跃和滑动。

猜想自适应触控功能还会在检测到屏幕保护膜时会提高触摸灵敏度,实际上这并不是新功能,因为 Pixel 8 也支持该功能。主要区别在于,Pixel 9 可以在更多场景下自动调整其触摸灵敏度,而不仅仅是屏幕保护膜。

自适应触控功能默认启用,如果要禁用,可以在设置 > 显示 > 触摸灵敏度下找到切换开关。

DeepMind解锁新成就:GenRM技术优化LLMs为奖励模型,加速生成式AI推理革新

近日消息,DeepMind团队在arXiv上最新发表的论文揭示了GenRM生成式验证器的研究成果,该研究创新性地引入了一种奖励模型机制,旨在显著增强生成式AI系统的逻辑推理与内容生成能力,开辟AI技术发展的新路径。

DeepMind解锁新成就:GenRM技术优化LLMs为奖励模型,加速生成式AI推理革新

AI 行业内,目前提高大语言模型(LLMs)的主流做法就是 Best-of-N 模式,即由 LLM 生成的 N 个候选解决方案由验证器进行排序,并选出最佳方案。

这种基于 LLM 的验证器通常被训练成判别分类器来为解决方案打分,但它们无法利用预训练 LLMs 的文本生成能力。

DeepMind 团队为了克服这个局限性,尝试使用下一个 token 预测目标来训练验证器,同时进行验证和解决方案生成。

DeepMind 团队这种生成式验证器(GenRM),相比较传统验证器,主要包含以下优点:

无缝集成指令调整

支持思维链推理

通过多数投票利用额外的推理时间计算

在算法和小学数学推理任务中使用基于 Gemma 的验证器时,GenRM 的性能优于判别式验证器和 LLM-as-a-Judge 验证器,在使用 Best-of-N 解决问题的百分比上提高了 16-64%。

据报道,GenRM 相对于分类奖励模型的边标志着人工智能奖励系统的关键演化,特别是在其容量方面,以防止新模型学成到的欺诈行为。这一进步突出表明,迫切需要完善奖励模型,使人工智能输出与社会责任标准保持一致。

相关推荐
热门应用排行榜
热门游戏排行榜
热门合集