拳打OpenAI,脚踢DeepSeek,“最强”推理模型Gemini 2.5来了
创始人
2025-03-26 11:40:50
0

来了,Google 正式推出了旗下新一代大语言模型 Gemini 2.5,作为谷歌迄今为止“最智能的模型”,它在对比 OpenAI、Anthropic、xAI、DeepSeek 旗下的模型时,在推理、数学、科学任务中遥遥领先。

不过 Google 也表示,Gemini 2.5 Pro 对比 OpenAI 的 o1-pro 还是有些距离。

另外,Gemini 2.5 并非“图像处理外挂模型”,而是统一架构共享注意力机制,实现图-文-音-码同源协同处理。

Gemini 2.5 Pro 作为一个全新的思考型模型,大幅提升了逻辑推理、编码生成、复杂任务处理能力,目前支持 100 万tokens 上下文识别,未来还将扩展至 200 万tokens,这让他在生成报告时的表现只能用惊艳来形容。

Gemini 2.5 现已通过 Google AI Studio 和 Gemini app 向 Gemini Advanced 订阅者开放试用,但首发版本还是有一些局限,比如无法联网,不支持 Deep Research 和 Canvas 工具,不过这也只是 Gemini 2.5 的第一个版本,后续肯定会有更多版本发布。而且 Gemini 2.5 的各项功能将逐步集成到 Google 生态中,比如搜索、Gmail、Docs 等,往后会逐渐公布定价细节。

另一边,OpenAI 也为 ChatGPT Plus、Pro 用户推送了图像生成模型,内置在 GPT-4o 中,支持多论对话修改编辑图像,上下文理解能力也更强,你可以让 GPT-4o 保留帽子或者服饰修改其他部分,每个物品的属性、关系都可以被分别控制。

比如这张图,就是要求创建两个 20 岁左右的女巫,阅读路标的照片级真实感图像(Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign.)。

并在上下文中修改了路牌上的时间、注释,女巫卷起魔毯、微倾,街边汽车、路标、女巫的位置等。

多模态、推理、上下文理解,不论是 Google 还是 OpenAI,都用强大的性能和开放的体验策略,带给了用户更多想象力,随着更多用户体验,相信还能看到新模型的更多潜力。

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
舒福德智能床S300 Pro面... 8月13日,以“一键入眠 世界领先”为主题的舒福德智能床新品发布会在浙江嘉兴举行。中国睡谷的首次对外...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
小米怎么去除抖音水印保存?分享... 随着抖音的普及,越来越多的人喜欢在抖音上分享和观看短视频。当我们想要保存一些喜欢的视频时,往往会被视...
小米14T Pro海外定档9月... 【ITBEAR】9月23日消息,小米今日在X平台上宣布,旗下新款手机小米14T Pro定于9月26日...
邓宏魁、张涛、李亚栋、孙斌勇获... 出品 | 搜狐科技 作者 | 周锦童 8月16日上午10时,2024未来科学大奖新闻发布会在北京、香...
如何规划小红书矩阵号内容并一键... 小红书矩阵号内容规划与抖音多账户同步攻略 在当前社交媒体时代,内容营销已成为品牌推广和个人IP打造的...