Xin Zhiyuan报告编辑:编辑YXH社论[Xin Zhiyuan简介]今晚,Google将完全杀死Madman!在2小时的新闻发布会上,双子座提到了95次以照亮观众。整个Gemini 2.5家族都是升级,而Pro Deep Thinker Model当前都在列表中。新的Imagen 4生成了超级现实的细节,而VEO 3首次意识到音频和视频。当Google采取行动时,它将成为国王。刚才,在Google I/O 2025会议上,Pichai出现在图片中,显示了其所有旗舰车型。一年的跨度可以描述为不停止。 At this time, the Gemini 2.5 began with three consecutive updates late night: · Gemini 2.5 Pro (before): Recalls ranked again, Elo scored 1448 points, first of all categories, crushing O3, native text sA Generation of Audio · Gemini 2.5 Pro (Deep Thinking): Gained Mathematics Rank, Coding, Multimodal Rankings, · Gemini 2.5 Flash (New): Second rankings in Gemini 2.5 Pro,Elo得分为1424,而高度预期的Imagen 4和VEO 3也在舞台上。 Imagen 4的原始图片的细节令人惊叹,速度更快10倍; VEO 3首次支持本地音频输出,开设了新的音频和视频融合期。 VEO 3现实地产生了成人和海洋声音在背景中的声音。此外,在会议上显示了新的Gemini文本爆炸模型,AI搜索AI模式和新的创意流平台... Google推出了历史上最昂贵的订阅服务-Google AI Ultra,高达250美元(比Chatgpt Pro高50美元)。可以将其称为VIP,无限制地访问最新型号。 Pro每月$ 20。打开后,它可以同时使用Gemini 2.5 Pro,VEO 2和NotebookLM。 Google将获得两个新硬件的意外之处是:Project Mohan耳机和XR眼镜,由Gemini支持,并将更改空间计算。 2小时的新闻发布会和双子座M在整个过程中,诱导了95次和AI 92次。 GEMINI 2.5思维版本的新的Deep版本已更新为Gemini 2.5,这绝对是整个会议的重点。 Demis Hassabis出现时感到非常兴奋:“ AI打开了一个惊人的新未来。” Gemini 2.5 Pro到达了顶部,其编码功能被挤压了。三月份首次亮相后,Gemini 2.5 Pro成为Google所看到的旗舰店最明智的模型。两周前,在GEMINI 2.5 Proviene版本的预览中的第一次更新之后,它领导了Lmarena排名。其中,在WebDev竞技场排名中得分1415分,而每月30分增加了142分。 在会议上,AI Stuido地区的女主人显示,您只需要上传手绘草稿即可提出页面效应,与在几十秒内描述需求完全相同。例如,形成了可旋转的3D图片墙。上图描述ibes此页面的基本结构,包括总是面对观察者的图片,可以扩展和减少。我们在I/O会议上使用了相同的命令,只花了几秒钟才能实现3D的3D页面几乎相同的效果作为演示。现在,每个人都可以体验新的Gemini 2.5 Prowith AI编码智能Jules平台,提示将帮助您处理任何任务。此外,在100万个令牌上下文的情况下,2.5 Pro领导着漫长的上下文和视频理解功能。 Gemini 2.5 Flash已完全升级,此时节省了30%的Gemini 2.5 Flash,以更快的生成速度和更低的成本进行了完全升级。 LMARENA得分为1424,仅次于2.5 Pro。 2.5通过识别,多模式,代码和长上下文的主要基准,进一步提高了闪存性能。在审查过程中,使用的令牌减少了20%-30%。两个迭代模型支持更多新功能:·nAtive Audio输出就像本地音频对话,2.5 Flash,最新的2.5 Pro的文本到语音具有很高的表现力,并且可以获得非常微妙的细节,例如Whispers。它支持24多种语言并无缝打开,现在可以在Gemini API中使用。以下视频来自Google Blackboard·预算思维2.5 Pro将支持预算思维,从而使答案更安全,更好。任何人都可以在/i -of中,并牢记固定预算的模型。深思熟虑在多模式数学编码中占主导地位。此时,双子座2.5系列带给了新成员-2.5 Pro(深思熟虑)。它使用了一项全新的技术,可以在响应之前考虑许多假设。 2.5 Pro Deep Edition认为SOTA会刷新数学,编码和多模式列表。具体来说,在2025年,USAMO数学奥林匹克运动会(最困难的Bencmath的Hmark之一),我们得分40.4%,比2.5 Pro高10%以上。在Livecodebench中,他克服了E竞争水平的问题出现了,分数下降,得分的80.4%。另外,在多模式推理MMMU中达到了84.0%。双子座扩散:新的文本服装模型此外,Google还带来了文本郊游模型的新爆炸,使该模型在处理编辑任务方面更好。与直接预测文本不同,它通过踩噪声来生成输出。该方法提供了双子座的爆炸,可以快速重复和优化编程和数学领域中留下的解决方案。 双子座的输出每秒超过1,000个令牌,其性能比Gemini 2.0闪存闪光灯快5倍。以示例为例。一眼一只眼睛,您错过了理解问题的过程。在更新双子座系列模型之后,Hassabis重新审视了Google在过去十年中当前AI时代基础的技术点。从转纹鞋到Alphago,Alpha Zero等。,Google将继续在AGI中创造下一个重大成功。双子座已成为当今最好的多模式基本模型,并将继续扩大其未来能力,并最终成为“世界模型”。哈萨比斯说,这是我一直喜欢的东西,AI系统要求世界模型有效地工作。双子座机器人技术是世界模型,也是进入现实世界的载体。此外,将双子座作为世界模型的另一个关键将真正帮助人类的生活。这也是Google Project Astra的最终视图。在现场示威期间,AI的助手指导护士的整个级别如何组装自行车,甚至打断会影响它。以下视频来自Google Blackboard。 Google还取得了加速科学发现的骄傲成就,包括Alphaevolve,Alphafold,Aime和同构实验室。在最新情况下,Google Astra加入了IRA,以帮助百叶窗变得更加自由。成像人4 + VEO 3生成了最终的演变,该年度开发人员会议没有AI映像模型和AI视频模型的更新。 Imagen 4:超级现实和原始图像,2K拼写的完美质量需要半年的时间,并且AI的图像生成模型终于在Imagen 4中迭代。就细节性能而言,Imagen 4可以产生复杂的织物,滴水,甚至具有现实的动物,以使人们的下巴感到惊讶。此外,该分辨率最多可以达到2K。此外,Imagen 4改进了其拼写和布局,进行了问候,海报和漫画。就发电速度而言,Imagen 4也是最终的 - 比上一代成像3。WEO3:本地音频和视频集成,BGM对话,同时获得Google AI Video Model Veo 3的对话,这也使出人意料的首次亮相了。用新闻发布会的老板的话说“我们进入了一个新的创作期,将音频和视频结合在一起。” VEO 3不仅超过了生产质量的VEO 2,而且还可以首次使用音频制作视频。无论是城市街道上的噪音,鸟类在公园里唱歌的声音,甚至是人物之间的对话,都可以单击。动画片。已经在AI的电影制作工具上启动了一个新的创意,流动,流动的平台。它包括VEO,Imagen,Gemini的最新模型,以创建电影剪辑,场景和故事无缝。自然对话描述了镜头,流程可以编织织物 - 杰出的场景。 AI模式 +深搜索AI查找新时代启动Google启动AI模式搜索功能,打开新的Google搜索期! AI模式深度包括AI搜索,Google开发了一个以GEMINI 2.5为重点的模型。 AI模式功能强大 - 全部。与过去的“传统搜索”相比,AI模式将自动计划显示搜索的形式结果基于响应,包括文本,视频甚至地图。可以完美地显示AI模式。 AI模式当前正在对Ingoogle搜索级别菜单进行排名,该菜单显示了Google的重要性附加到AI模式。当前,此功能仅支持说英语的区域,还应使用聊天语言。您可以提出一个非常复杂的问题,例如:在本赛季和上个赛季(最新的棒球棒游戏)显示受欢迎的玩家的击球和基本速率,例如:显示受欢迎玩家的击球和基本速度。这个问题涉及定位信息和计算的可能性。 AI模式巧妙地使用表和图表来回答。 在Google Lens会议上,还提到了Google Lens,使用AI的功能来帮助查找不同的图像和信息。 Google镜头可以装箱页面上的任何信息,并且答案将在选择后自动启动。智能购物Pichai目前与Ultraman相同。前,Openai刚刚启动了自己的购物功能,这次Google还没有准备好超越。通过上传自己的个人照片,Google可以自动向您穿衣服,从而使您可以直观地看到衣服对身体的影响。同时,代理商还可以自动下订单并自动付款,而无需人工操作。在接下来的几个月中,将完全推出智能机构的视觉购物和自动结帐。 Google Deepmind的双子座应用程序副总裁Josh Woodward来到舞台上介绍了未来双子座应用程序的三个关键功能。个人:Google提出了个人上下文的概念,也就是说,您在Google,聊天,电子邮件,日历和行程中拥有的所有内容都是您的个人“上下文”。在这些个人背景下,AI将更好地了解您并修复所有内容。活跃:双子座应用程序将是更强大的启发式方法通过相似方法帮助您了解物理学的知识。功能强大:双子座应用中最强的两个工具当前是:深入研究和其他画布。您可以上传自己的文件,让Gemini应用程序在深入分析中有助于帮助。在画布中,您可以完美地联系Gemini,解决难题,制作博客,甚至进行画布环境的编程。 XR的新耳机和眼镜进入了Apple Meta的战场。最后,Google惊讶于Ilunsad Android XR的两个新硬件。首先,它与三星合作,以计算由苹果推出的Mohan耳机显示器项目,该项目预计将在今年内发布。然后,有一些XR眼镜是对元雷班的基准测试。事不宜迟,只显示了演示。参考:https://io.google/2025/return到Sohu查看更多