硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误

研究称 AI 的涌现能力来自于评估模式的错误

GPT-3 等大语言模型（LLM）随着规模的扩大而表现出意想不到的 “涌现” 能力。然而，有研究人员认为，这是测量错误的后果，而不是奇迹般的能力。他们认为，LLM 是概率模型，它们并不像有些人认为的那样拥有任何一种有知觉的智能。该团队观察到，大多数（92%）检测到的意外行为是在通过 BIG-Bench 评估的任务中发现的。其中一项测试是精确字符串匹配，它检查一个模型的输出，看它是否与一个特定的字符串完全匹配，而不对几乎正确的答案给予任何权重。当较小的模型对一个问题的回答可能非常接近正确，但由于它是使用二进制的精确字符串匹配来评估的，它将被标记为错误。研究人员强调，他们并没有排除 LLM 中出现 “涌现” 行为的可能性；他们只是说，以前关于出现 “涌现” 行为的说法看起来像是考虑不周的衡量标准。

消息来源：The Register

老王点评：也许不是突然出现的能力，而是逐渐提升的能力。但是目前的 AI 给人的感觉是突然变得很聪明，这中间确实给人一种跨越式的感觉。我倾向于认为是量变导致了质变的看法。

苹果公司注册 xrOS 商标

苹果公司已经在新西兰注册了 “xrOS” 的字样，这是该公司第一次间接透露其即将推出的头戴设备的操作系统名称。xrOS 是指 “扩展现实”，代表了该头戴设备将支持的增强和虚拟现实功能。在开发过程中，苹果曾在内部将该软件称为 “Reality OS” 或 “rOS”。xrOS 将有一个苹果用户会感到熟悉的类似于 iOS 的界面。

消息来源：Mac Rumors

老王点评：就 AR、VR、XR 等方面，我还是看好苹果公司的发展。不过，我觉得可能还需要一段时间，尤其是目前苹果在 AI 方面的落后可能会拖慢这一进程。

只需 15 分钟训练，iPhone 将能用你的声音说话

苹果公司今天预览了为认知、视觉、听觉和行动无障碍而设计的一组新功能，其中包括为可能失去说话能力的人设计的新的个人语音功能，允许他们创造 “听起来像他们的合成语音” 与朋友或家人交谈。用户可以通过在 iPhone 或 iPad 上大声朗读一组文字提示来创建个人语音，总共录制 15 分钟的音频。用户可以输入他们想说的话，然后用他们的个人语音读给他们想交谈的人。

消息来源：The Verge

老王点评：上面刚刚说过苹果在 AI 方面的落后，这一条其实正好印证了，因为做到这一点目前并不稀奇。

最后修改于：

2024年2月16日

研究称 AI 的涌现能力来自于评估模式的错误

苹果公司注册 xrOS 商标

只需 15 分钟训练，iPhone 将能用你的声音说话

发表回复 取消回复

发表回复取消回复