如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

发布日期：2025-06-25 02:10:10 浏览次数：0次

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 华为自研的仓颉编程语言将于 7 月 30 日开源，这款语言将如何影响未来的开发趋势？下一篇 : 2025年现在开发php项目选择lar***el框架好还是thinkphp框架好？

热点新闻

有没有用过GOOVIS的？

养乌龟是什么体会？

为什么 macOS 上国产软件不流氓？

手机的运行内存真的有必要上16GB吗？

你们都用 Flutter 开发了什么 App？

超小团队选择Django还是Flask？

为什么很多知乎的回答推崇日本式的市区、市郊通勤铁路？

为什么 php 可以做到 7 毫秒以内响应，而 .net 做不到？

苹果公司做过哪些鲜为人知的努力？

有哪些事，是社会底层人认识不到的?

联系我们

电话：

座机：

邮箱：

地址：