查看内容

I/O大会一文速览，新模型不是重点，谷歌要让AI进入一切
== 2026/5/20 9:05:34 == 热度 192

摘要：AI开始模拟现实凤凰网科技出品作者｜董雨晴这是一个非凡的时刻。这是一个超高速发展的时期。北京时间5月20日凌晨，谷歌CEO Sundar Pichai在I/O大会上，用一句话定调了谷歌当前对AI行业的判断。在凤凰网科技看来，与其说这是一场技术发布会，不如说谷歌在向外界传递一个清晰的信号：当行业还在追逐参数榜时，谷歌已经把战火烧到了世界模型和极致性价比两条新赛道上了。Gemini Omni正式登场：AI开始模拟现实今天最值得关注的模型更新，不是某个跑分更高的文本模型，而是Gemini Omni。谷歌将Omni定义为世界模型向前迈出的关键一步。用Pichai的话说，AI正从预测文本转向模拟现实，而Omni是第一个可以从任何输入生成任何输出模态的模型，这次率先落地的是视频输出。谷歌DeepMind首席架构师Korai在讲解中放出了一段演示：给Omni一个简单的提示词蛋白质折叠的解说，模型直接生成了一段讲解蛋白质如何从氨基酸链折叠成螺旋和折叠、最终形成三维形状的视频。并且，这个视频还不是从素材库拼接的，而是基于模型在训练中积累的知识直接生成的。换句话说，Omni开始展现出对直觉物理学的理解它没有在检索信息，而是在模拟现实世界的运行逻辑。行业感到兴奋的是Omni在视频编辑上的能力。Korai演示了用户上传自己的视频后，Omni能基于音频、图像和视频等多种输入进行跨模态推理，然后自然地对角色、细节、风格进行改变。某种意义上看，这相当于把Nano Banana在图像编辑上重新定义规则的能力，完整复制到了视频领域。Omni Flash将从本周二起向Google AI订阅用户开放，用户可以在Gemini应用、Google Photos和YouTube Shorts上体验。值得注意的是，所有由Omni创建或编辑的内容，都会被嵌入谷歌不可察觉的数字水印，以应对急迫的安全伦理问题。Pichai同时宣布，OpenAI和ElevenLabs正在采用SynthID 2，这种跨行业合作在AI透明度议题上并不多见。Gemini 3.5 Flash：一场针对成本的闪电战如果说Omni是谷歌向未来的技术储备，那Gemini 3.5 Flash就是一把当下刺向市场痛点的快刀。根据谷歌官方数据，3.5 Flash在几乎所有基准测试中都超越了上一代旗舰模型3.1 Pro，编码能力尤
=*=*=*=*=*=
当前为第1/3页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页