首页 > 智慧科技 > 智慧科技 > 谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4

谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4

发布时间:2025-08-04 17:13:20 来源: 18638159832

8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。

这是最近在今年国际数学奥林匹克(IMO)上“拿金牌”的模型的变体。近期高级版Gemini Deep Think完美解答了IMO 6道题目中的5道,总分35分(满分42分),达到金牌水平。

该模型需要几个小时才能推理出复杂的数学问题。新发布的版本在日常使用中速度更快、更易用,根据内部评估,在2025年IMO基准测试中仍达到铜牌水平。

谷歌在今年5月的I/O开发者大会上首次预览了Gemini 2.5 Deep Think。新版本进行了“重大改进”。在具有挑战性的编程、科学、知识、推理基准测试中,与OpenAI o3、Grok 4等其他不使用工具的模型相比,Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam均取得最佳性能。

苹果华人AI大牛被挖走,为同济校友!硅谷抢人大战升级,薪酬开到10亿刀

Gemini app中的Deep Think模型,使用思考技巧来提供更详细、更有创意和更周到的回答,甚至可以帮助数学家来测试数学猜想,还能提高Web开发任务的美观性。

苹果华人AI大牛被挖走,为同济校友!硅谷抢人大战升级,薪酬开到10亿刀

Deep Think支持文本、图像、音频、视频等输入和1M tokens上下文窗口,输出长度为192K tokens。

其工作原理是利用谷歌的并行思维技术,能同时生成多个想法,并同时进行思考,甚至随着时间的推移不断修改或整合不同的想法,最终得出最佳答案。

此外,通过延长推理时间或“思考时间”,谷歌给了Gemini更多的时间来探索不同的假设,并为复杂问题找到创造性的解决方案。

谷歌还开发了新颖的强化学习技术,鼓励模型利用这些扩展的推理路径,从而使Deep Think随时间推移成为更好、更直观的问题解决者。

Deep Think可以帮助人们解决需要创造力、战略规划和逐步改进的问题,例如:

迭代开发和设计:在需要逐块构建复杂事物的任务上的表现出色,比如可以提高网络开发任务的美学和功能。

科学和数学发现:可推理出高度复杂的问题,通过复杂的科学文献帮助制定和探索数学猜想或推理,可能加速发现之路。

算法开发和代码:在棘手的编码问题上特别出色,其中问题制定和仔细考虑权衡和时间复杂性是最重要的。

目前仅有最高级别的Google AI Ultra订阅者可选用“Deep Think”,每月订阅费为249.99美元(约合人民币1803元)。

Deep Think自动与代码执行和谷歌搜索等工具配合使用,并能产生更长的响应。

同时,达到IMO金牌水平的Deep Think模型将进一步测试,并向一小部分数学家和学者分享,用于辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。

谷歌还正在努力在未来几周内通过Gemini API向一组受信任的测试人员发布带和不带工具的Deep Think,以更好地了解其对开发者和企业用例的可用性。

智慧科技更多>>

捡漏价12.12万!过户2次理想ONE 增程式中大型SUV 8万元落地,要省钱更要省心!这几款大品牌代步车,可以闭眼冲 智己LS6劲敌!广汽昊铂S600预售,权益价18.89万起,标配激光雷达 硬派越野“高手过招” 5款新车来袭 新款坦克300 V6领衔 当奥迪不靠品牌靠实力——奥迪E7X 现代汽车“梦想之屋”第97站暖心落地辽宁阜新 以爱奔赴·全新腾势Z9GT&D9对比试驾会济南站圆满落幕 大五座SUV价值旗舰,乐道L80上市24.28万起 比亚迪2026款海鸥正式发布上市,共推出4款车型,售价区间为6.99万元-8.59万元 租电价15.68万元起!乐道L80上市:大五座“爆品”稳了? 一汽悦意08首台量产车下线,5月底正式开启预售 现代雅尊中期改款信息曝光,车长增加至5050mm,换装17英寸中控屏 RAV4荣放要推皮卡?丰田北美CEO:是个机会! 独家专访 | 丰田章男在上海放了一座“沟通之桥” 当保时捷开始说“荣幸又无奈”,模仿者真的赢了吗? 深蓝汽车6大明星产品亮相华中国际车展,每一款都有惊喜好礼 东风风神登陆2026华中车展,持续拓展家庭出行边界 艾尼氪V设计“断代”,现代汽车新能源品牌“看不懂” 大众ID.ERA 5S来了!综合续航超2000km,有城区智驾,售多少大卖? 华境S正式上市:标配华为乾崑全家桶!超级置换价14.98万元起 腾势Z9 S续航申报信息:轴距超3米,配102kWh电池,三电机版本 传统与新贵的分水岭之间,奥迪E7X为豪华纯电定了新基调? 全系宁德时代+电动尾翼,吉利银河C级纯电轿跑“TT”申报图曝光 8系SUV厮杀白热化,真正的比拼早已不在表面 杰兰路调研报告出炉,问界售后服务口碑超越传统豪华品牌 比亚迪2026款海鸥6.99万起,增配不加价首搭激光雷达 埃安N60长沙首批车主交付仪式秒变现场Live 以前焦虑买插混,现在买插混更焦虑!都怪理想、比亚迪? 想买SUV的别急 5月还有5款重磅SUV新车来袭 方程豹豹8闪充版领衔 东方风起 智领未来 看东风汽车如何开启智慧出行新纪元