谷歌颁布多模态大模型旗舰Gemini Omini —— Hassabis)在本届 I/O 正式颁布 Gemini Omni,这是 Gemini 模型家族迄今为止能力最为全面的版本。
‘Omni’顾名思义,意指‘全能’——该模型在处置文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。在演示素材中,Gemini Omni 展示了多项令人印象深刻的能力:面对用户手绘的一条鱼,它不仅可能鉴别并与之互动,还能实时天生流动动画;在‘弹珠世界知识’(Marble World Knowledge)演示中,它将各类知识点具象化为弹珠穿行于复杂管路的视觉叙事;面对天文级此外‘黑洞素描’,Omni 能精准鉴别物理概想并发展深度解说;在蛋白质折叠演示中,则直观出现了其在科学领域的推理与可视化潜力。

65%的受访者暗示愿意为谷歌颁布多模态大模型旗舰Gemini Omini支付额表用度。