在2024年的Google I/O开发者大会上,谷歌采取了一系列行动以回应竞争对手的挑战。这些行动包括发布多款模型、扩展Gemini 1.5 Pro的上下文窗口、推出Veo视频模型以及将Gemini模型整合到Android系统中。

在发布会上,Sundar Pichi 分享了 Google 内部的最新的进展:

  • Gemini 应用程序现在已上线 Android 和 iOS 系统。通过 Gemini Advanced,用户可以访问 Google 最强大的模型。

  • Google 将向全球所有开发者推出 Gemini 1.5 Pro 的改进版本。此外,今天拥有 100 万个 token 上下文的 Gemini 1.5 Pro 现在可以直接在 Gemini Advanced 中供消费者使用,它可以跨 35 种语言使用。

  • Google 将 Gemini 1.5 Pro 上下文窗口扩展到了 200 万个 tokens,并以私人预览版的形式提供给开发人员。

  • 虽然我们还处于 Agent 的早期阶段,但是 Google 已经开始先行探索,尝试了 Project Astra,通过智能手机摄像头分析世界,识别及解释代码、帮助人类寻找眼镜、还能辨别声音…

  • 比 Gemini 1.5 Pro 更轻量级的 Gemini 1.5 Flash 发布,针对低延迟和成本等重要的任务进行了优化。

  • 可制作“高质量” 1080p 视频的 Veo 模型和文本生成图像模型 Imagen 3 发布;

  • 采用全新架构、27B 大小尺寸的 Gemma 2.0 来了;

  • Android,第一个包含内置设备基础模型的移动操作系统,深度集成了 Gemini 模型,成为以 Google AI 为核心的操作系统;

  • 第六代 TPU Trillium 发布,与上一代 TPU v5e 相比,每个芯片的计算性能提高了 4.7 倍。

在发布会上,谷歌首席执行官Sundar Pichai分享了谷歌的最新进展。Gemini应用程序现在可在Android和iOS系统上使用,用户可以通过Gemini Advanced访问谷歌最强大的模型。Gemini 1.5 Pro的改进版本将向全球所有开发者推出,并且Gemini 1.5 Pro的上下文窗口已扩展到200万个tokens,供开发人员使用。

此外,谷歌还展示了一些新的模型和技术,如Project Astra,该项目通过智能手机摄像头分析世界,识别代码、帮助人们寻找眼镜等。谷歌还发布了Gemini 1.5 Flash,这是一个轻量级的Gemini版本,针对低延迟和成本进行了优化。而Veo视频模型和Imagen 3模型则展示了谷歌在图像和视频处理方面的能力。

谷歌还宣布推出Gemma 2.0,这是一个全新架构的模型,大小为27B。另外,谷歌还将Gemini模型整合到Android系统中,这使得Android成为一个以谷歌人工智能为核心的操作系统。

谷歌在2024年的Google I/O开发者大会上采取了一系列积极的行动,展示了其在人工智能领域的强大实力和创新精神。这些举措显示了谷歌在人工智能领域的实力和创新能力。谷歌通过发布多款多模态大模型和整合Gemini模型到Android系统中,展示了其在人工智能技术方面的全面能力。这些举措不仅是对竞争对手的回应,也为谷歌未来的发展奠定了基础。