硬核观察 #1089 ChatGPT 的数学成绩更差了

·

2023年8月10日

·

·

2,452 次阅读

ChatGPT 的数学成绩更差了

研究人员给聊天机器人布置了一项基本任务：识别某个数字是否是质数。这种数学问题对人来说很复杂，但对电脑来说却很简单。研究人员向 ChatGPT 输送了 1000 个不同的数字。三月份，GPT-4 能正确识别 84% 的数字是否为质数。（坦率地说，对于一台计算机来说，这样的表现非常一般。）到了六月份，它的成功率下降到了 51%。在 8 项不同的任务中，GPT-4 有 6 项变得更糟。这种退化是人工智能开发人员所熟知的漂移现象的一个例子，即试图改进极其复杂的人工智能模型的一部分，却使模型的其他部分表现更差。

消息来源：华尔街日报

老王点评：GPT 这种人工智能的“思考”方式和我们人类是不同的，或许以后人工智能变聪明的方式是让它自己调整自己。

中国论文数高居第一背后可能的原因

日本文部科学省发布的最新排名显示，中国发表论文数再次高居第一，连续两年保持“三冠王”地位。中国的论文总数的全球份额为 24.6%，与第 2 位的美国相比高出 8.5 个百分点。引用数排名前 10% 的“受关注论文”的份额为 28.9%，排名前 1% 的“顶尖论文”的份额为 29.3%，均拉大了与美国的差距。有观点指出，中国的排名上升是因为本国研究人员相互引用了彼此的论文。这一比例美国为 29%，日本为 19%，而中国达到了 61%。值得注意的是，中国论文在英国《自然》和美国《科学》的论文数占比，中国仅为近 2 成，仍远低于美国的约 7 成，排名在英国和德国之后。

消息来源：日经社

老王点评：要客观认识中国在科技方面的进步。

CNET 删除旧文以改进搜索排名

科技新闻网站 CNET 从 7 月开始删除了数千篇文章，它在内部备忘录中称，此举以向谷歌展示其内容 “新鲜、相关，值得在搜索结果中排名高于竞争对手”。CNET 称，“在理想的情况下，我们会将所有内容永久保留在网站上。不幸的是，我们受到了现代互联网的惩罚”。CNET 表示，他们会根据“页面浏览量、反向链接以及自上次更新时间等”来删除“没有为有意义的受众提供服务”的页面。但谷歌建议不要采用这种做法，表示不会因为删除过时的文章而提升整个网站的印象。

消息来源：Gizmodo

老王点评：虽然谷歌是这样说的，但是 CNET 这样做想必是有数据支撑的。无论如何，删除旧页面才能提升网站排名，我认为事情本不应该是这样的。

最后修改于：

2024年2月16日

2 条回复

来自江苏无锡的 Firefox 107.0|Ubuntu 用户

数学只有对与错，AI训练时这部分要求不严格，结果就悲剧了。

来自无锡

2023年8月11日

回复
来自北京的 Firefox 116.0|GNU/Linux 用户

数学这块应该还是要靠code interpreter这类执行代码的插件解决。

来自北京

2023年8月11日

回复

发表回复取消回复