硬核观察 #1089 ChatGPT 的数学成绩更差了

硬核老王 的头像

·

·

·

2,063 次阅读

ChatGPT 的数学成绩更差了

研究人员给聊天机器人布置了一项基本任务:识别某个数字是否是质数。这种数学问题对人来说很复杂,但对电脑来说却很简单。研究人员向 ChatGPT 输送了 1000 个不同的数字。三月份,GPT-4 能正确识别 84% 的数字是否为质数。(坦率地说,对于一台计算机来说,这样的表现非常一般。)到了六月份,它的成功率下降到了 51%。在 8 项不同的任务中,GPT-4 有 6 项变得更糟。这种退化是人工智能开发人员所熟知的漂移现象的一个例子,即试图改进极其复杂的人工智能模型的一部分,却使模型的其他部分表现更差。

消息来源:华尔街日报

老王点评:GPT 这种人工智能的“思考”方式和我们人类是不同的,或许以后人工智能变聪明的方式是让它自己调整自己。

中国论文数高居第一背后可能的原因

日本文部科学省发布的最新排名显示,中国发表论文数再次高居第一,连续两年保持“三冠王”地位。中国的论文总数的全球份额为 24.6%,与第 2 位的美国相比高出 8.5 个百分点。引用数排名前 10% 的“受关注论文”的份额为 28.9%,排名前 1% 的“顶尖论文”的份额为 29.3%,均拉大了与美国的差距。有观点指出,中国的排名上升是因为本国研究人员相互引用了彼此的论文。这一比例美国为 29%,日本为 19%,而中国达到了 61%。值得注意的是,中国论文在英国《自然》和美国《科学》的论文数占比,中国仅为近 2 成,仍远低于美国的约 7 成,排名在英国和德国之后。

消息来源:日经社

老王点评:要客观认识中国在科技方面的进步。

CNET 删除旧文以改进搜索排名

科技新闻网站 CNET 从 7 月开始删除了数千篇文章,它在内部备忘录中称,此举以向谷歌展示其内容 “新鲜、相关,值得在搜索结果中排名高于竞争对手”。CNET 称,“在理想的情况下,我们会将所有内容永久保留在网站上。不幸的是,我们受到了现代互联网的惩罚”。CNET 表示,他们会根据“页面浏览量、反向链接以及自上次更新时间等”来删除“没有为有意义的受众提供服务”的页面。但谷歌建议不要采用这种做法,表示不会因为删除过时的文章而提升整个网站的印象。

消息来源:Gizmodo

老王点评:虽然谷歌是这样说的,但是 CNET 这样做想必是有数据支撑的。无论如何,删除旧页面才能提升网站排名,我认为事情本不应该是这样的。

2 条回复

  1. 来自江苏无锡的 Firefox 107.0|Ubuntu 用户 的头像
    来自江苏无锡的 Firefox 107.0|Ubuntu 用户

    数学只有对与错,AI训练时这部分要求不严格,结果就悲剧了。

    来自无锡
  2. 来自北京的 Firefox 116.0|GNU/Linux 用户 的头像
    来自北京的 Firefox 116.0|GNU/Linux 用户

    数学这块应该还是要靠code interpreter这类执行代码的插件解决。

    来自北京

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注