标签 AI 下的文章

OpenAI 发布检测 AI 生成文本的工具

ChatGPT 的创造者 OpenAI 今天发布了一个免费的基于网络的工具,旨在帮助弄清某块文本是由人类还是机器写的。OpenAI 警告说,该工具并不完美,可能会有“误判和漏判”,不应该单独依靠新工具来确定文件的作者身份。它在大于 1000 字的文本样本和英语中效果最好,但它还不能区分人类和人工智能编写的计算机代码。

消息来源:Axios
老王点评:以子之矛,攻子之盾。我敢说,这个工具肯定会利用来改善 AI 的输出,使之更不容易识别出来。

万维网联盟以公益性非营利组织重启

万维网联盟(W3C)是 Web 发明人蒂姆·伯纳斯-李创立于 1994 年的行业组织,它为互联网制定了包括 HTML 和 CSS 等近 500 个开放标准,整个 Web 世界都是在此基础上发展起来的。W3C 的标准可以被任何人使用,而且由于 W3C 专利政策免收版税,所以不需要任何费用。2023 年伊始,W3C 联盟成立了一个新的符合美国 501(c)(3) 的公益性非营利组织。虽然蒂姆爵士已经逐渐退出了大多数 W3C 的决策,但在 W3C 董事会中为他保留了一个永久席位。

消息来源:W3C
老王点评:W3C 确实很有功绩,成为非营利组织后应该可以发挥更大的作用。

谷歌决定在 2024 年禁止第三方 Cookie

尽管存在争议和来自政府的审查,但这家广告公司仍打算继续推进其基于兴趣的广告主题 API。谷歌在报告中说,“在 2024 年第三季度,Chrome 浏览器将在两个月内逐步取消对第三方 Cookie 的支持。”此前,谷歌最早曾打算在 2022 年底前废弃对第三方 Cookie 的支持。为了取代第三方 Cookie,谷歌早在 2019 年就宣布了“隐私沙盒”技术,并正在开发一系列取代性技术,如主题 API、FLEDGE API、归属报告 API、私有状态令牌 API、第一方集 API 等等。谷歌坚持认为其广告技术工具可以在支持开放网络的同时促进隐私。

消息来源:The Register
老王点评:或许一部分初衷是好的,但是打击对手的心思怕也是有的,大部分数字广告商都还必须依赖第三方 Cookie。

OpenAI 雇佣上千人改进 AI 的编程能力

OpenAI 过去半年招募了大约一千名远程工作的合同工,其中四成是程序员,他们的工作是为 OpenAI 的模型创建数据学习软件工程。一位完成 OpenAI 五小时无偿编程测试的开发者说,他被要求完成两部分组成的任务:首先是给予一个编程问题,要求用书面英语解释他会如何处理。然后要求他提供解决方案。如果他发现错误,OpenAI 会让他详细描述错误,以及如何修复。

消息来源:Slashdot
老王点评:这是真·“人工”训练的智能。

Yandex 的搜索引擎使用了 1922 个排名因子

Yandex 搜索引擎的源代码最近被前雇员泄露。根据分析,它的搜索排名算法使用了 1922 个排名因子。即便 Yandex 不是谷歌,但 Yandex 和谷歌的排名因子肯定有很多相似之处。Yandex 的排名因子包括 PageRank 和链接相关因子、文本相关性、内容年龄和新鲜度,终端用户行为信号、主机可靠性、维基百科等网站高优先度,等等。

消息来源:Solidot
老王点评:这种靠排名因子来列出搜索结果的做法,现在和 ChatGPT 等 AI 相比,感觉太机械、太手工、太落后了。

GIMP 3.0.0 有望在年内发布

开源图像编辑软件项目 GIMP 公布了 2022 年年度报告。2022 年 GIMP 项目发布了一个稳定版本 2.10.32,3 个开发版本 2.99.10、2.99.12 和 2.99.14;有 87 位贡献者参与了项目,其中包括 35 位开发者,核心开发者 7 位;Wayland 支持有所改善;GTK+3 移植接近完成。项目团队称,计划是在 2023 年发布 GIMP 3.0.0,至少会发布一个 RC 版本。

消息来源:GIMP
老王点评:不知道 2.99 最终能达到什么子版本,但是 3.0 已经等了太久了,以至于没啥激情了。

Twitter 修改开发者协议明确禁止第三方客户端

前几天,我们 报道(#882) 过,在没有告知的情况下,众多第三方 Twitter 客户端由于 API 访问受限而不能使用。现在 Twitter 给出了一个解释,“Twitter 正在执行其长期的 API 规则,这可能导致一些应用程序无法工作”。在其 API 规则中添加了一条新的规则,限制开发者“使用或访问授权材料去创建或尝试创建 Twitter 应用的替代或类似的服务或产品”。这意味着 Twitter 明确禁止了开发者开发第三方客户端。

消息来源:The Register
老王点评:我想说 Twitter “醒悟”的太晚了,凭啥让第三方客户端挣钱啊,瞧瞧它的某个山寨品早就干掉第三方客户端了。

因软件故障,7000 盏灯连续亮了 17 个月

美国麻省的一所高中十多年前安装了一种软件控制的照明控制系统,但在 2021 年该软件出现了故障,以至于所有的灯都无法关闭,这 7000 盏灯 24 小时点亮,一直亮了 17 个月。但是由于年代久远,安装该照明系统的公司也几经易手,已经没有修复该系统专有软件了。而更换整个照明系统需要替换大量硬件,一时也无法开展。

消息来源:ARS Technica
老王点评:一方面,软件的淘汰速度要比我们想象的要快,另外一方面,“古老”的电气开关看起来比软件更可靠。

用 AI 检测 AI 撰写的文字

一家从事反剽窃服务的公司正在开发一种新的工具,以检测 ChatGPT 等 AI 工具生成的文字。他们发现 AI 写作中有明显的模式,“人类并不倾向于在高概率的地方持续使用高概率的词,但 GPT-3 会这样做”。他们的检测器基于与 GPT-3 相同的架构,并将其描述为该 GPT-3 的微型版本。“它所做的是以与 GPT-3 阅读语言完全相同的方式阅读语言,但它不是吐出更多的语言。”而是显示一篇文章中似乎有多少是 AI 写的。他们认为该工具可以保护学术诚信。

消息来源:The Register
老王点评:AI 的进步我们只能顺应,而无法逆转。一方面我们要利用 AI 来替我们完成大量初级、重复的工作,另外一方面也可以利用 AI 来防止 AI 用在不当的地方。

谷歌请回创始人帮助谷歌以打赢 AI 之战

上个月,谷歌的创始人拉里·佩奇和谢尔盖·布林与该公司高管举行了几次会议,以应对 ChatGPT 对该公司的搜索业务的挑战。对谷歌来说,ChatGPT 看起来似乎可以提供一种在互联网上搜索信息的新方法。这两位创始人自从 2019 年离开谷歌的日常工作后,就没有在该公司呆过多少时间,他们审查了谷歌的人工智能产品战略,批准了将更多聊天机器人功能纳入谷歌搜索引擎的计划并提出了想法。

消息来源:《纽约时报》
老王点评:当年靠着搜索变成了一家独大,如今却有可能被 AI 掀翻。

苹果开源了 40 年的 Lisa 操作系统

作为苹果 Lisa 电脑发布四十周年庆典的一部分,苹果通过计算机历史博物馆公开了 Lisa OS 3.1 操作系统的源代码,它采用了苹果学术许可证协议,包括 26MB 源代码,超过 1300 个源文件。苹果 Lisa 发布于 1983 年 1 月 19 日,其名字来自于乔布斯的女儿。它是一款基于鼠标 GUI 的商用计算机,但由于太过昂贵而在商业上失败,苹果于 1985 年终止了该项目。但它为之后的 Macintosh 奠定了基础。

消息来源:计算机历史博物馆
老王点评:欢迎苹果公司将古老的操作系统“文物”放入博物馆。

美科技公司反对对科技算法提起诉讼

在美国最高法院关于 YouTube 算法的一个关键案件中,众多企业、互联网用户、学者甚至人权专家为大科技公司的责任盾牌辩护,他们认为,如果将人工智能驱动的推荐引擎排除在联邦法律保护之外,会对开放的互联网造成全面的改变。他们表示美国联邦法律《通信礼仪法》第 230 条对网络的基本功能至关重要,该法条被用来保护所有网站使其免受第三方内容的诉讼。他们认为,允许对科技行业算法提起诉讼的裁决,可能会甚至导致未来对非算法形式的推荐提起诉讼,并可能对个别互联网用户提起有针对性的诉讼。

消息来源:CNN
老王点评:算法有罪吗?有意的算法作恶应该被惩处吗?无意的算法错误应该被惩罚吗?黑盒式的 AI 决策的责任该由谁承担?这个信息时代打破了很多既有认知。

回音

  • 受到批评后,CNET 暂停 了用 AI 辅助(#883) 撰写文章,并辩称,“我们不是秘密的做,而是悄悄的做。”

BussFeed 用 AI 报道《CNET 用 AI 撰写文章》

科技新闻网站 CNET 被发现自去年 11 月以来,用 AI 撰写了 75 篇与个人财务有关的文章,但这些文章并没有申明使用 AI 撰写。CNET 回应 称,虽然 AI 撰写了这些文章内容和收集了素材,但发表的每一篇文章都经过了具有相关专业知识的编辑的审查、事实核查和编辑。CNET 随后注明了这些文章由 AI 撰写。他们称正在做其最擅长的事情:测试一项新技术,以便能够将炒作与现实分开。有趣的是,BussFeed 在报道此事时,也使用 ChatGPT 来撰写了整篇报道,但经过编辑审核后,“不得不重写了几次提示,以使其不再插入事实错误”。

消息来源:BuzzFeed News
老王点评:将来,AI 辅助写作可能会接管写作中的大部分工作。

Linux 准备禁用微软的 RNDIS 协议的驱动程序

RNDIS 是通过 USB 提供虚拟以太网功能的专有协议,但除了 Windows 之外,几乎没有得到支持。由于安全问题,Linux 内核正在准备将 RNDIS 内核驱动程序移到 Kconfig “损坏” 选项里,一旦被标记为 “损坏” 一段时间,这些驱动将可能最终从上游源码树中删除。内核维护者 Greg 表示 “因为该协议不可能做到安全,所以禁用所有 RNDIS 驱动,以防止任何人再使用它们”。

消息来源:Phoronix
老王点评:按 Linux 的风格,这么不安全的协议是怎么进入内核的?

前十名痴迷智能手机的国家中,有七个在亚洲

Data.ai 对 2022 年移动互联网的最新研究报告披露,亚洲国家是移动生态系统的主要推动者。在前十名痴迷智能手机的国家中,有七个在亚洲。印尼人以每天平均 5.7 小时的时间名列在手机上花费时间最多的榜首。中国人排在第 18 位,平均每天花费 3.6 小时。但中国人在下载量和消费者在应用程序上的花费方面排名第一,中国人共下载了 1110 亿个应用程序,花费了约 580 亿美元。

消息来源:The Register
老王点评:这份报告里面还有很多有趣的数据,值得一看。

GPT-4 将有 100 万亿参数,与人类大脑神经元数量相当!

OpenAI 发布于 2020 年的 GPT-3 有 1750 亿个参数。根据传闻,即将在 2023 年初发布的 GPT-4 的参数约为 100 万亿。如果将参数比作人类的神经元,这一数量的参数大致相当于人类大脑中存在的神经元连接的数量,而人类实际上并没有使用我们大脑的全部容量。按照 GPT-3 对其前代产品的进步,GPT-4 将在能力、范围和潜力方面与我们目前的 GPT-3 版本的 ChatGPT 相比,可能拥有一个质的飞跃。

消息来源:Impakter
老王点评:我已经无法用想象力来想象 AI 能做到什么了,希望打开的不是潘多拉魔盒吧。

美联邦机构 1/5 的密码在安全审计中被破解

美国内政部最近的一次的安全审计发现,在测试的近 9 万个加密哈希值中,只用了 90 分钟就破解了 16% 的密码,最后有 21% 的账户密码被破解。这些被破解的密码涉及 28 个高价值资产中的 25 个,占比近 90%。破解这些密码只使用了一台价值 15000 美元的设备。值得注意的是,被破解的绝大多数密码都符合密码复杂性要求,该要求规定密码必须至少有 12 个字符,并且至少包含大写、小写、数字和特殊字符等四种字符类型中的三种。

消息来源:Ars Technica
老王点评:传统的“强密码”理论已经不合时宜。多个无关联的单词组成的长密码会更安全一些,最好是使用密码管理器生成随机密码,以及辅助使用多因子认证。

美国原住民要求阿帕奇基金会改名

美国的一个民间组织呼吁 阿帕奇软件基金会 Apache Software Foundation (ASF)改名,以尊重美国原住民,并遵守其自身的行为准则。他们指责 ASF 出于品牌推广的目的盗用原住民文化。该团体对他们所说的阿帕奇部落只存在于过去的历史背景中的说法提出异议。ASF 表示已经知晓此事,但“变化需要时间与成员、董事会和我们的法律团队进行仔细权衡。我们的成员正在探索其他解决方法。”

消息来源:The Register
老王点评:我觉得,要是没有 ASF,可能很多人都不知道阿帕奇部落,我不觉得这是恶意滥用。而且,据我所知,Apache 起名的部分灵感来自于对 NCSA 服务器的修补版。