logo
I/O大会一文速览,新模型不是重点,谷歌要让AI进入一切
== 2026/5/20 9:05:34 == 热度 192

摘要:AI开始模拟现实凤凰网科技 出品作者|董雨晴这是一个非凡的时刻。这是一个超高速发展的时期。北京时间5月20日凌晨,谷歌CEO Sundar Pichai在I/O大会上,用一句话定调了谷歌当前对AI行业的判断。在凤凰网科技看来,与其说这是一场技术发布会,不如说谷歌在向外界传递一个清晰的信号:当行业还在追逐参数榜时,谷歌已经把战火烧到了世界模型和极致性价比两条新赛道上了。Gemini Omni正式登场:AI开始模拟现实今天最值得关注的模型更新,不是某个跑分更高的文本模型,而是Gemini Omni。谷歌将Omni定义为世界模型向前迈出的关键一步。用Pichai的话说,AI正从预测文本转向模拟现实,而Omni是第一个可以从任何输入生成任何输出模态的模型,这次率先落地的是视频输出。谷歌DeepMind首席架构师Korai在讲解中放出了一段演示:给Omni一个简单的提示词蛋白质折叠的解说,模型直接生成了一段讲解蛋白质如何从氨基酸链折叠成螺旋和折叠、最终形成三维形状的视频。并且,这个视频还不是从素材库拼接的,而是基于模型在训练中积累的知识直接生成的。换句话说,Omni开始展现出对直觉物理学的理解它没有在检索信息,而是在模拟现实世界的运行逻辑。行业感到兴奋的是Omni在视频编辑上的能力。Korai演示了用户上传自己的视频后,Omni能基于音频、图像和视频等多种输入进行跨模态推理,然后自然地对角色、细节、风格进行改变。某种意义上看,这相当于把Nano Banana在图像编辑上重新定义规则的能力,完整复制到了视频领域。Omni Flash将从本周二起向Google AI订阅用户开放,用户可以在Gemini应用、Google Photos和YouTube Shorts上体验。值得注意的是,所有由Omni创建或编辑的内容,都会被嵌入谷歌不可察觉的数字水印,以应对急迫的安全伦理问题。Pichai同时宣布,OpenAI和ElevenLabs正在采用SynthID 2,这种跨行业合作在AI透明度议题上并不多见。Gemini 3.5 Flash:一场针对成本的闪电战如果说Omni是谷歌向未来的技术储备,那Gemini 3.5 Flash就是一把当下刺向市场痛点的快刀。根据谷歌官方数据,3.5 Flash在几乎所有基准测试中都超越了上一代旗舰模型3.1 Pro,编码能力尤
=*=*=*=*=*=
当前为第1/3页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页