谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动

未知
2025-03-17 15:51:58
0

谷歌DeepMind推出了他们的秘密武器——Gemini Robotics! 这可不是你家扫地机器人那点小打小闹,而是要将AI的智慧真正注入钢铁之躯,让机器人也能像咱们一样(甚至更聪明地)在物理世界里大显身手。


所不能的“多面手”

Gemini Robotics的核心在于其基于先进的Gemini2.0模型。要知道,Gemini本身就具备处理文本、图像、音频和视频的强大能力。

而Gemini Robotics更进一步,让机器人拥有了理解物理空间并采取行动的“超能力”。这意味着,无论是应对文字指令、识别眼前画面、听懂你的“灵魂”语音,还是分析一段操作视频,Gemini Robotics都能心领神会,并转化为实际的物理操作。

想象一下,以后只需动动嘴皮子,或者给机器人看张图,它就能帮你把家务安排得明明白白,是不是有点小激动?

要说Gemini Robotics最让人眼前一亮的,还得是它的泛化能力。这可不是只会执行预设程序的“憨憨”,它拥有Gemini强大的世界知识,即使面对全新的物体、五花八门的指令,甚至是前所未有的环境,也能迅速理解并找到解决方案。 

谷歌自豪地表示,在综合泛化基准测试中,Gemini Robotics的性能比其他顶尖的视觉-语言-动作模型高出两倍以上。这就像一个学霸,不仅能轻松应对考试,还能举一反三,解决各种实际问题。以后遇到突发状况,再也不用担心机器人“掉线”啦!

谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动

“秒懂你心”的贴心助理

在人机交互方面,Gemini Robotics也展现出了惊人的互动性。它不仅能理解日常口语化的指令,还能对指令的突然变化或周围环境的改变做出快速反应。

更厉害的是,它还能在接收到初步指令后,无需过多干预就能自主完成任务。 设想一下,你一边悠闲地喝着咖啡,一边随口说一句“帮我收拾一下桌子”,Gemini Robotics就能迅速领会,并灵活应对可能出现的各种小意外,比如不小心碰倒了水杯,它也能及时调整动作。。

别看Gemini Robotics“智商”高,它的“情商”——也就是灵活性也同样出色。许多我们人类习以为常的精细动作,对于传统机器人来说往往是巨大的挑战。

但Gemini Robotics却能轻松应对,无论是折纸、打包午餐,还是制作一份精致的沙拉,它都能展现出细腻的动作和精准的协调性。以后想吃个爱心便当,或许只需要给Gemini Robotics一个简单的食谱就行了。

“百变金刚”适应性强

更令人惊喜的是,Gemini Robotics还具备多形态适应性。它并非只适用于某一种特定的机器人形态,无论是双臂机器人平台ALOHA2,还是人形机器人Apptronik的Apollo,Gemini Robotics都能轻松驾驭。这意味着,未来我们可以看到各种各样搭载Gemini Robotics的智能机器人,在不同的领域发挥其独特的作用。

谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动

除了Gemini Robotics这个“全能选手”,谷歌还推出了Gemini Robotics-ER。这里的“ER”代表“具身推理”(Embodied Reasoning)。

这款模型更侧重于提升机器人对物理世界的空间理解能力,并能与现有的低级别控制器相结合。它可以大幅提升Gemini2.0在物体指认和3D检测等方面的能力。

通过结合空间推理和Gemini的编码能力,Gemini Robotics-ER甚至可以“即时”创造全新的机器人功能。例如,当看到一个咖啡杯时,它就能自主判断出最合适的抓握方式和安全的移动轨迹。

当然,在让AI走进现实世界的同时,安全问题也是重中之重。谷歌强调,他们采取了全面的安全措施,从底层的电机控制到高层的语义理解,都进行了细致的考虑。

Gemini Robotics-ER可以与机器人原有的安全控制器进行交互,判断潜在动作的安全性,并生成合适的响应. 此外,谷歌还发布了一个新的数据集ASIMOV,以评估和提升具身AI和机器人的语义安全性。他们还与内外部专家、政策制定者以及责任与安全委员会紧密合作,确保Gemini Robotics的发展符合伦理和安全标准。

为了加速Gemini Robotics的落地应用,谷歌已经与多家机器人公司展开合作,包括Apptronik、Agile Robots、Agility Robotics、Boston Dynamics和Enchanted Tools等。通过与这些行业领军者的合作,我们可以期待在不久的将来,看到更多搭载Gemini Robotics的智能机器人出现在我们的生活和工作中。

谷歌的Gemini Robotics无疑为人工智能和机器人领域注入了新的活力。它强大的多模态理解能力、出色的泛化性、自然的人机交互以及精湛的操作技能,都预示着一个智能机器人时代即将到来。至于这到底是“打工人福音”还是会带来一些“小小的”职业挑战,就让我们拭目以待吧!毕竟,谁不想拥有一个聪明又勤劳的机器人助手呢?

官方博客:https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

以上就是谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动的详细内容,更多请关注全栈开发网其它相关文章!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 service@p2hp.com 进行投诉反馈,一经查实,立即处理!
-- -- 0

相关内容

用Gemini翻译文章的优缺点及注意事项
用Gemini翻译文章的优缺点及注意事项
用Gemini翻译文章的优缺点及注意事项,Gemini优点是上下文超长,翻译完成度极高,优...
2025-03-20 10:39:43
最近 Google 的 Gemini 2.0 Flash 正式发布,已经能做到一句话改图了。
最近 Google 的 Gemini 2.0 Flash 正...
最近 Google 的 Gemini 2.0 Flash 正式发布,已经能做到一句话改图了...
2025-03-20 10:04:19
谷歌推出Gemma 3:单GPU上运行的最强AI模型
谷歌推出Gemma 3:单GPU上运行的最强AI模型
谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3,声称这是 “全球最强的...
2025-03-17 15:29:40
Google Gemini 2.0 Flash 新增「原生图像生成」功能
Google Gemini 2.0 Flash 新增「原生图...
Google 发文宣布,Google Gemini 2.0 Flash 引入了「原生图像生...
2025-03-17 15:24:18
Google 的 Gemini 2.0 正式面向所有用户开放!
Google 的 Gemini 2.0 正式面向所有用户开放...
Gemini 2.0 现已全面开放,为开发者和用户带来了显著更新和新模型。这次的发布建立在...
2025-03-08 10:53:31
全球首发!中国团队推出革命性通用AI Agent:Manus Manus(官网:https://manus.im/)是一款由中国团队开发的人工智能产品,被称为全球...
复刻Manus,无需邀请码,开源版Manus!OpenManus 复刻Manus,无需邀请码,开源版Manus! OpenManus 支持在电脑上完成很多任务,包括网...
通俗解读MCP和Agent原理,包你看完秒懂! 什么是MCP?模型上下文协议(Model Context Protocol,简称 MCP):是一个由...
OpenAI 生产环境最佳实践官方指南 这份指南全面介绍了如何将产品原型发布到生产环境的最佳实践。不论你是资深的机器学习工程师还是刚入门的技...
agent互联网时代来了,mcp协议相当于互联网时代的http协议 近期见到人就安利:agent互联网时代来了,mcp协议相当于互联网时代的http协议,打通了大模型、...
🧠什么是AI 在聊ChatGPT之前,应该先聊聊AI。我们先来界定下到底什么叫AI(Artificial Inte...
人工智能如何增强软件工程,你需要知道的一切 通过这个指南,可以了解人工智能增强软件工程领域的快速发展,以及它如何帮助开发人员更快地开发软件。
AI 领域名词解读:SOTA SOTA(State of the Art)是一个经常被用于描述科技领域中表现最优秀的技术和解决方案...
4个顶级的搜索引擎API,构建AI应用必备 本文介绍四款Web搜索API:博查、微软Bing、GoogleSerpApi和Exa.ai,各自具有...
中国AI硬件,正在占领CES 美国时间1月6日晚上,英伟达演讲会场外排起“几公里”的长队。无数观众们盼望着能快一点进入会场;快一点...
AI基础概念 本章介绍了企业AI应用可能涉及到的一些相关概念,帮助大家更好的理解 AI的相关操作。

最新文章

4个顶级的搜索引擎API,构建AI应用必备 本文介绍四款Web搜索API:博查、微软Bing、GoogleSerpApi和Exa.ai,各自具有...
AGI时代不可避免了,给8点建议 不管大家相不相信、愿不愿意接受,随着gpt、deepseek和manus这类产品的加速发展。以及机器...
四部门联合印发《人工智能生成合成内容标识办法》 为了促进人工智能健康发展,规范人工智能生成合成内容标识,保护公民、法人和其他组织合法权益,维护社会公...
很多普通人忽视了人工智能的一个影响就是:学习的革命 很多普通人忽视了人工智能的一个影响就是:学习的革命。人工智能可能会带来一个新的学习范式,与以往的学习...
世界首个免费无限制 分布式 AI 算力平台 世界首个免费无限制 分布式 AI 算力平台基于来自全国各地 50 台家用电脑的 3090、4080、...
别让AI淘汰你!2025普通人“打不过就加入”的5条铁律 别让AI淘汰你!2025普通人“打不过就加入”的5条铁律。当我们还在讨论AI带来的焦虑时,已经有人开...
分享10个AI导航网站,里面有各种各样的AI工具! 分享10个AI导航网站,里面有各种各样的AI工具!
什么是具身智能? 具身智能(Embodied Intelligence)是一个涉及人工智能、机器人学和认知科学的综合性...
谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动 谷歌DeepMind推出了他们的秘密武器——Gemini Robotics! 这可不是你家扫地机器人...
什么是prompt工程? Prompt工程,又称提示工程(Prompt Engineering),是指设计和优化用于与生成式人...