谷歌深夜炸场发布Gemini 2.0，2025属于智能体之年？

AI大厂的竞争日趋白热化，一边OpenAI正如火如荼进行着为期12天的产品发布活动，另一边谷歌也在频频放大招。

12 月 11 日晚，刚刚发布量子芯片的谷歌，又投下一枚重磅炸弹，正式发布其最新版大模型Gemini 2.0系列，谷歌表示这是他们迄今为止最强大的人工智能模型，“专为智能体时代设计”，并同时介绍了多个智能体应用（AI Agent）。

如果说去年底发布的 Gemini 1.0 是整合和理解信息，那么 Gemini 2.0 是能够让信息更加有用。谷歌在博客中表示，基于此前多模态方面的进展，Gemini 2.0能够构建新的AI智能体，从而离通用助手的愿景更进一步。

目前谷歌完全对外开放的新模型是Gemini 2.0 Flash体验版，这是谷歌的主力模型，具有低延迟特性。与此前的1.5 Flash版本相比，Gemini 2.0 Flash 在同样快速的响应时间下性能进一步增强。谷歌提到，2.0 Flash 在关键基准测试中甚至超越了此前的旗舰模型 1.5 Pro，其速度是 1.5 Pro 的两倍。

同时2.0Flash 还具有新功能，除了能够支持图片、视频和音频等多模态输入，2.0 Flash可以支持多模态输出，例如可以直接生成图像与文本混合的内容，以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用 Google Search、代码执行以及第三方用户定义的函数等工具。

作为提供给开发者的体验版模型，Gemini 2.0 Flash 现在可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 获取，所有开发者均可使用多模态输入和文本输出。该产品将于 1 月全面上市，谷歌称届时将推出更多型号。

对于Gemini 2.0模型，谷歌表示会先将开放给开发者以及受信任的测试人员，并将其整合到产品中。Gemini 2.0基于谷歌定制的硬件第六代 TPU Trillium 构建而成。谷歌表示，TPU 为 Gemini 2.0 的训练和推理提供 100% 算力支持。

模型之外，谷歌这次的重头戏是智能体。在发布产品的同时，谷歌CEO桑达尔·皮查伊（Sundar Pichai）在X上着重提到了智能体Project Astra，认为其“展示了通用 AI 助手的曙光”。

皮查伊表示，“2025 年将是令人兴奋的一年。”帖子下则有评论表示，2025 年会是属于智能体的一年。

‌Project Astra‌是谷歌最初在5月的I/O大会上首次对外发布的AI助手，彼时主要是对标OpenAI的GPT-4o，其主要功能包括实时语音和视觉处理，能够通过手机或谷歌眼镜进行跨文本、音频、视频的多模态实时推理‌。谷歌在此次的博客中将其称为“使用多模态理解现实世界的智能体”。

谷歌深夜炸场发布Gemini 2.0，2025属于智能体之年？

谷歌深夜炸场发布Gemini 2.0，2025属于智能体之年？

每天学习更多>>