谷歌I/O大爆发：一夜连推近10款模型，Android迎来AI革新，多模态技术再升级

2024-05-16

206

在2024年的Google I/O开发者大会上，谷歌采取了一系列行动以回应竞争对手的挑战。这些行动包括发布多款模型、扩展Gemini 1.5 Pro的上下文窗口、推出Veo视频模型以及将Gemini模型整合到Android系统中。

在发布会上，Sundar Pichi 分享了 Google 内部的最新的进展：

Gemini 应用程序现在已上线 Android 和 iOS 系统。通过 Gemini Advanced，用户可以访问 Google 最强大的模型。
Google 将向全球所有开发者推出 Gemini 1.5 Pro 的改进版本。此外，今天拥有 100 万个 token 上下文的 Gemini 1.5 Pro 现在可以直接在 Gemini Advanced 中供消费者使用，它可以跨 35 种语言使用。
Google 将 Gemini 1.5 Pro 上下文窗口扩展到了 200 万个 tokens，并以私人预览版的形式提供给开发人员。
虽然我们还处于 Agent 的早期阶段，但是 Google 已经开始先行探索，尝试了 Project Astra，通过智能手机摄像头分析世界，识别及解释代码、帮助人类寻找眼镜、还能辨别声音…
比 Gemini 1.5 Pro 更轻量级的 Gemini 1.5 Flash 发布，针对低延迟和成本等重要的任务进行了优化。
可制作“高质量” 1080p 视频的 Veo 模型和文本生成图像模型 Imagen 3 发布；
采用全新架构、27B 大小尺寸的 Gemma 2.0 来了；
Android，第一个包含内置设备基础模型的移动操作系统，深度集成了 Gemini 模型，成为以 Google AI 为核心的操作系统；
第六代 TPU Trillium 发布，与上一代 TPU v5e 相比，每个芯片的计算性能提高了 4.7 倍。

在发布会上，谷歌首席执行官Sundar Pichai分享了谷歌的最新进展。Gemini应用程序现在可在Android和iOS系统上使用，用户可以通过Gemini Advanced访问谷歌最强大的模型。Gemini 1.5 Pro的改进版本将向全球所有开发者推出，并且Gemini 1.5 Pro的上下文窗口已扩展到200万个tokens，供开发人员使用。

此外，谷歌还展示了一些新的模型和技术，如Project Astra，该项目通过智能手机摄像头分析世界，识别代码、帮助人们寻找眼镜等。谷歌还发布了Gemini 1.5 Flash，这是一个轻量级的Gemini版本，针对低延迟和成本进行了优化。而Veo视频模型和Imagen 3模型则展示了谷歌在图像和视频处理方面的能力。

谷歌还宣布推出Gemma 2.0，这是一个全新架构的模型，大小为27B。另外，谷歌还将Gemini模型整合到Android系统中，这使得Android成为一个以谷歌人工智能为核心的操作系统。

谷歌在2024年的Google I/O开发者大会上采取了一系列积极的行动，展示了其在人工智能领域的强大实力和创新精神。这些举措显示了谷歌在人工智能领域的实力和创新能力。谷歌通过发布多款多模态大模型和整合Gemini模型到Android系统中，展示了其在人工智能技术方面的全面能力。这些举措不仅是对竞争对手的回应，也为谷歌未来的发展奠定了基础。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。