标签图灵测试下的文章

1 Chrome 还有打击广告拦截器的下一个武器

为了打击浏览器上的广告拦截器，Chrome 不但计划在 2024 年 6 月推出限制广告拦截的 Manifest V3 扩展平台，而且还会限制扩展更新过滤规则的方式，以延迟扩展开发者快速响应变化的能力。YouTube 可以立即更换广告投放系统，但一旦 Manifest V3 成为强制规定，扩展开发者就无法立即做出响应。如今，广告拦截器和隐私应用可以自行更新过滤列表，通常使用的是巨大的开源社区的列表。Manifest V3 将通过限制谷歌所说的 “远程托管代码” 来阻止这种情况。所有更新，即使是像过滤列表这样的良性更新，都需要通过 Chrome 商店进行全面的扩展更新。这些更新都需要经过 Chrome 网上应用商店的审核过程，而这将带来很大的时间延迟。

消息来源：Ars Technica

老王点评：对谷歌的反垄断审查更严厉些吧。

2 Java 尝试使用多线程的新方法

在 Java 21 的预览版本中，Java 尝试了多线程的新方法：结构化并发。该方法允许开发者使用结构化编程语法来使用多个线程。从本质上讲，它提供了一种使用熟悉的程序流程和结构编写并发软件的方法。这样，开发人员就可以专注于手头的业务，而不是线程的协调。虚拟线程现已成为 Java 的一项正式功能，它为廉价生成线程以获得并发性能提供了可能。结构化并发为此提供了简单的语法。因此，Java 现在拥有了一个独特的、高度优化的、易于理解的线程系统。

消息来源：Info World

老王点评：这是一个很好的消息，值得关注。

3 研究称 GPT-4 没有通过图灵测试

在一篇题为《GPT-4 通过图灵测试了吗？》的预印本研究论文中，研究人员将 GPT-4 人工智能语言模型与人类参与者、GPT-3.5 和 ELIZA 进行了对比。其中，ELIZA 是一个上世纪 60 年代开发的基于规则的对话程序。研究人员建立了一个名为 turingtest.live 的网站，他们在该网站上通过互联网举办了一场双人图灵测试。通过该网站，人类审讯者与代表其他人类或人工智能模型的各种 “人工智能证人” 进行互动。令人惊讶的是，ELIZA 在研究中得分相对较高，成功率达到 27%，超过了 GPT-3.5 的 14% 成功率。GPT-4 的成功率为 41%，但就连 GPT-4 也不符合图灵测试的成功标准，既没有达到 50% 的成功率，也没有超过人类参与者的成功率。

消息来源：Ars Technica

老王点评：虽然这个结果令人吃惊，但是我倾向于研究方法有误，比如没有很好地设计符合 GPT 方式的提示语。

硬核观察 #1039 DeepMind 联合创始人提出新图灵测试

DeepMind 联合创始人提出新图灵测试

阿兰·图灵在 1950 年代提出了最早的对 AI 的测试，人类评估者判断他们是在和人类还是与 AI 说话。如果 AI 能冒充人类，那么它就通过了图灵测试。DeepMind 联合创始人 Mustafa Suleyman 在其新书中否定了传统的图灵测试，因为“它没有告诉我们系统能做什么或理解什么，是否建立了复杂的内心独白，或能在抽象的时间范围内进行规划”。他提出了新的图灵测试，“让 AI 将 10 万美元的种子基金变成 100 万美元，以此衡量 AI 是否具有类人的智能”。AI 需要研究一个电商方案，制定产品计划，找到制造商和销售商品。他预测 AI 将在两年内实现这一目标：“我们不只关心机器能说什么，我们还关心它能做什么。”

消息来源：Business Insider

老王点评：之前我们在 #1036 报道过，AI 撰写的商业计划书获得了更多投资人的青睐，我就谈到或许以后可以直接投资 AI 管理运营的企业。现在看起来，这个日子不会太远。不过，要是 AI 都会自己赚钱了，可以自己养自己了，还要人类干啥？

OpenAI 准备建立 AI 应用商店

据透露，OpenAI 正在考虑推出一个应用市场，客户可以将他们根据自己的需要定制的人工智能模型出售给其他企业。例如，可以发现在线零售交易中的金融欺诈，或回答有关特定市场的最新信息的模型。目前还不清楚 OpenAI 是否会对这些销售收取佣金，或者以其他方式从市场上获得收入。

消息来源：The Information

老王点评：有苹果应用商店的成功在前，这真是一个聪明的主意。不过我更倾向于将来会有 AI 自己使用的一种交易机制，AI 们可以在其中交易训练数据、模型权重和特定的模型等，并通过买来或学到的“技能”换取更多的交易机会。

微软计划淘汰原生的邮件和日历应用引来批评

微软打算关闭其时常被人诟病的邮件和日历应用程序，将其功能放到新的 Windows 版 Outlook 中。然而，尽管多年来用户对这些应用程序提出了一些批评，但对上述决定有一些强烈的负面反应。有用户评论，“看到微软为 Windows 开发网络应用，却为安卓、iOS 和 MacOS 打造高质量的原生应用，这有点搞笑，但也很悲哀。”用户认为淘汰邮件和日历的决定是对 WinUI 原生工具包的信心丧失，“如果你不能将 UWP 应用程序移植到本地工具包，这基本上就是承认没有人应该建立原生 Windows 应用程序。甚至微软也不使用他们自己的工具包。”

消息来源：The Register

老王点评：虽然邮件和日历应用有点鸡肋，但是连微软都不在自己的 Windows 上开发原生的应用，而用网络应用敷衍——这恐怕不完全是因为网络应用更流行，也是原生应用走衰的趋势吧。