拳打OpenAI,脚踢DeepSeek,“最强”推理模型Gemini 2.5来了
创始人
2025-03-26 11:40:50
0

来了,Google 正式推出了旗下新一代大语言模型 Gemini 2.5,作为谷歌迄今为止“最智能的模型”,它在对比 OpenAI、Anthropic、xAI、DeepSeek 旗下的模型时,在推理、数学、科学任务中遥遥领先。

不过 Google 也表示,Gemini 2.5 Pro 对比 OpenAI 的 o1-pro 还是有些距离。

另外,Gemini 2.5 并非“图像处理外挂模型”,而是统一架构共享注意力机制,实现图-文-音-码同源协同处理。

Gemini 2.5 Pro 作为一个全新的思考型模型,大幅提升了逻辑推理、编码生成、复杂任务处理能力,目前支持 100 万tokens 上下文识别,未来还将扩展至 200 万tokens,这让他在生成报告时的表现只能用惊艳来形容。

Gemini 2.5 现已通过 Google AI Studio 和 Gemini app 向 Gemini Advanced 订阅者开放试用,但首发版本还是有一些局限,比如无法联网,不支持 Deep Research 和 Canvas 工具,不过这也只是 Gemini 2.5 的第一个版本,后续肯定会有更多版本发布。而且 Gemini 2.5 的各项功能将逐步集成到 Google 生态中,比如搜索、Gmail、Docs 等,往后会逐渐公布定价细节。

另一边,OpenAI 也为 ChatGPT Plus、Pro 用户推送了图像生成模型,内置在 GPT-4o 中,支持多论对话修改编辑图像,上下文理解能力也更强,你可以让 GPT-4o 保留帽子或者服饰修改其他部分,每个物品的属性、关系都可以被分别控制。

比如这张图,就是要求创建两个 20 岁左右的女巫,阅读路标的照片级真实感图像(Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign.)。

并在上下文中修改了路牌上的时间、注释,女巫卷起魔毯、微倾,街边汽车、路标、女巫的位置等。

多模态、推理、上下文理解,不论是 Google 还是 OpenAI,都用强大的性能和开放的体验策略,带给了用户更多想象力,随着更多用户体验,相信还能看到新模型的更多潜力。

相关内容

热门资讯

2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...