标签 AI 下的文章

硬核观察 #1070 社区批评 Meta 滥用“开源”来称呼其新大语言模型

硬核老王发布于 2023-07-23
另请参阅: 硬核观察,开源, 超算, AI
3 条评论

社区批评 Meta 滥用“开源”来称呼其新大语言模型

Meta AI 宣称：“Llama 2 是我们的下一代开源 LLM，可用于研究和商业用途”。但事实上 Llama 2 并没有使用 OSI（开源计划）批准的许可证，也不符合 OSD（开源定义）。其社区协议禁止使用 Llama 2 训练其他语言模型；如果在月活用户超过 7 亿的应用程序或服务中使用该技术，比如那些大公司，则需要获得 Meta 的特殊许可。对于程序员来说，可能是否“开源”并不要紧，他们能够用它来搭建和研究就够了。对于 Meta 高层来说，“开源”被他们当成了一个营销用语，但是这显然会让人对“开源”一词产生混淆。

消息来源：The Register

老王点评：我不觉得 Meta 不知道什么是“开源”，但是这种草率编写的许可协议，显然代表了 Meta 既想借开源的模式打狼，又担心开源反而赔了孩子。这种首鼠两端的想法最后不会有好结果。

人工智能公司承诺将为人工智能生成内容打上水印

OpenAI、Alphabet、Meta、亚马逊和微软等七家主要的美国人工智能公司，承诺开发一个系统来 “标记” 文本、图像、音频、视频等所有形式的人工智能生成的内容，这样用户就能知道什么时候使用了这项技术。这种以技术方式嵌入内容的水印，会让用户更容易发现深度伪造的图像或音频。他们还承诺在发布新的人工智能系统前进行彻底地测试，并分享诸如如何降低风险等信息。

消息来源：路透社

老王点评：这真的能做到到么？或者说，这种水印能被其它人工智能系统去掉吧。更不要说还有开源的人工智能系统。

Cerebras 推出人工智能超级计算机网络

Cerebras 公司推出了 Condor Galaxy 项目，这是一个由九台相互连接的超级计算机组成的网络，专为人工智能模型训练而设计，总性能达到 36 FP16 ExaFLOP。其中第一台超级计算机 CG-1 是由 64 台 Cerebras CS-2 系统整合而成，有 5400 万个内核，能够为人工智能训练提供 4 ExaFLOP 的算力。它支持多达 6000 亿个参数的模型，其配置可扩展至支持多达 100 万亿个参数。其它几台将陆续建设。该公司 CEO 称，“许多云计算公司都宣布了耗资数十亿美元建造的大规模 GPU 集群，但这些集群却极难使用。将一个模型分布到数千个微小的 GPU 上，需要数十名具有罕见专业知识的人员花费数月的时间。CG-1 消除了这一挑战。建立一个生成式人工智能模型只需要几分钟，而不是几个月，而且一个人就能完成。”

消息来源：Anand Tech

老王点评：算力不是问题，将来的人工智能系统才是问题。这样大量训练出来的人工智能系统，真的能按照人们最善良的愿望去发展吗？

硬核观察 #1068 现存最古老的发行版 Slackware 已经 30 岁了

硬核老王发布于 2023-07-21
另请参阅: 硬核观察,黑客, Slackware, AI
1 条评论

现存最古老的发行版 Slackware 已经 30 岁了

本周，Slackware Linux 项目庆祝其成立 30 周年。Slackware 1.0 版本于 1993 年 7 月 16 日发布，它是目前仍在积极维护和开发的最古老的 Linux 发行版，虽然它不是第一个 Linux 发行版。最让人敬佩的是，其创始人至今仍在维护该项目。他说，“这真的是一段非凡的旅程，我在 1993 年开始时根本无法预料。”当前版本 Slackware 15 于 2021 年进入测试阶段，并于去年初发布。顺便说一句，MCC Interim Linux 可以说是第一个发行版，它的第一个候选版本 0.97 在 1991 年内核发布几个月后就出现了。Debian 比 Slackware 稍微年轻一点，是在 Slackware 发布两个月后发布的。

消息来源：The Register

老王点评：Slackware 是我用过的第一个 Linux 发行版，那应该是 1997 年或 1998 年。而我那时最喜欢的发行版是 Mandrake。

黑客之王凯文·米特尼克去世

凯文·米特尼克 Kevin Mitnick ，曾被称为 “世界头号通缉黑客”，于上周日去世，享年 59 岁。他曾因侵入和篡改公司计算机网络而入狱服刑，2000 年获释后开始了新的职业生涯，担任安全顾问、作家和公共演讲人。他最为人熟知的是 20 世纪 90 年代的疯狂犯罪，当时他从美国各地的电脑中窃取了成千上万的数据文件和信用卡号码。他利用自己的技能进入美国的电话和手机网络，破坏政府、企业和大学的计算机系统。1995 年，经过长达两年多的追捕，他被美国联邦调查局抓获。

消息来源：Engadget

老王点评：这是一个传奇，虽然是那种以破坏为目的的“黑客”，但依然是传奇的一生。

苹果正在开发自己的人工智能大模型

据报道，苹果正在开发自己的大语言模型以及类似 ChatGPT 的 AI 工具。苹果的大模型代号 “Ajax”，苹果还创建了一个聊天机器人服务，一些工程师称之为 “Apple GPT”。苹果有多个团队在 AI 项目上展开合作，它已成为苹果的一大重要工作。苹果员工表示这项工作基本上是对 Bard、ChatGPT 的复制，并不包含任何新功能或新技术。苹果正在积极改进模型，但目前没有向消费者发布的计划。

消息来源：彭博社

老王点评：苹果在这一点上已经大大落后，不知道什么时候它的 Siri 才可以变聪明。

硬核观察 #1067 Meta 发布新大语言模型，可免费商用，采用特别的“开源”方式

硬核老王发布于 2023-07-20
另请参阅: 硬核观察,物联网, AI
评论

Meta 发布新大语言模型，可免费商用，采用特别的“开源”方式

Meta 周二发布了 Llama 2：这是一套经过预训练和微调的基于文本的人工智能模型，有三种不同的规模，分别包含 70 亿、130 亿和 700 亿个参数。与之前的 LLaMA 模型不同的是，任何人都可以申请下载 Llama 2，开发人员可以用它来构建商业产品或服务，以及开展有趣的项目。Meta 表示，不会对访问或使用其开发的模型收费，而是通过向其他公司开放该技术，如与微软和亚马逊合作，在 Azure 和 AWS 上提供该模型。值得注意的是，Llama 2 采用了专门的许可证，有一些独特的限制，因此不符合“开源”的定义。除了常见的免责声明外，开发人员不能利用其输出结果来改进其他类型的大型语言模型。以及，如果将 Llama 2 用于支持那些拥有超过 7 亿月活跃用户的应用程序的大公司，必须申请使用 Meta 技术的特殊许可。

消息来源：The Register

老王点评：虽然不是规范定义的“开源”软件，但至少是开放的。值得注意但是，从 LLaMA 到 Llama 2，Meta 都采用了非同寻常的“开源”方式，这或许是 Meta 既想利用开源的优势，又有一些不确定的担忧。也许人工智能领域需要一种独特的开放许可证。

美国启动物联网安全标签计划

该计划的正式名称为《美国网络信任标识》，旨在帮助美国人确保他们购买的互联网连接设备具有强大的网络安全保护措施，可防范网络攻击。长期以来，物联网一直被认为是网络安全的薄弱环节。符合该标准的设备将要求具有唯一且强大的默认密码、保护存储和传输的数据、提供定期的安全更新以及具备事故检测能力等。

消息来源：Tech Crunch

老王点评：越来越多的物联网设备，其实是埋在信息社会底层的空洞，你不知道它什么时候就会导致塌陷。

印度大部分外包程序员将在两年内因人工智能而消失

Stability AI 公司的 CEO 表示，印度的大多数外包程序员将在未来一两年内失业。不过他认为，在法国等受《劳动法》保护较强的国家受到这种影响的可能性较小。他重申了他之前的说法，五年后将 “不再有程序员”，不过，他也说明，他指的是传统意义上的程序员。他说，“当你把编程这件事从错误测试、单元测试到构思进行解构时，人工智能可以做到这一点，而且做得更好。但这不是自动完成的，而是人工智能‘辅助驾驶’完成的。”

消息来源：CNBC

老王点评：其实也不用特别慌，就像计算器、计算机出现，并没有让原来的财务和文员失业一样，只是如果你掌握不了新工具，那这种“古典程序员”被淘汰也是自然的。

硬核观察 #1066 Wayland 正在成为 Linux 图形用户界面的首选方式

硬核老王发布于 2023-07-19
另请参阅: 硬核观察,Wayland, WordPress, AI
4 条评论

Wayland 正在成为 Linux 图形用户界面的首选方式

越来越多的证据表明，Wayland 显示服务器可能很快就会取代 X11，成为 Linux 上最常用的 GUI 方式。比如，为苹果芯片 Mac 开发 Linux 的团队表示，他们没有足够的人力来开发 X.org 支持。被许多 Linux 应用程序和桌面使用的 Gtk 工具包的开发者说，下一个版本可能会放弃对 X11 的支持。Budgie 桌面的下一个版本将只支持 Wayland。KDE 6 会话默认使用 Wayland。甚至还有人尝试让 Wayland 在 OpenBSD 上运行，而它已经可以在 FreeBSD 上使用了。

消息来源：The Register

老王点评：再想想 X.org 多少年没有实际开发在进行了，连董事会选举都差点凑不够人。所以，是时候全面转向 Wayland 了。当然，Wayland 自己还有一些问题需要解决。

安装量超百万的 WordPress 安全插件明文记录密码

All-In-One Security（AIOS）是一款安装量超过了百万的增强 WordPress 安全性的插件，在其 5 月发布的 v5.1.9 中引入了一个错误，用户登录使用 AIOS 的网站后会以明文方式记录其密码，并将其存储在管理员可访问数据库中。上周释出的 v5.2.0 修复了该问题，并从数据库里删除了相关数据。在公告中，他们还给出了一些安全建议，其中包括已被认为是糟糕的安全实践“定期修改密码”——因为这会事实上迫使用户使用弱密码。微软认为这种做法 “古老而过时”。

消息来源：Ars Technica

老王点评：无论如何，不用明文存储密码都是最起码的安全常识。从这一点和该插件开发方给出的安全建议看，他们或许并没有真正的安全意识。

网站建设公司提供创建整个网站的人工智能工具

Wix 是网站建设领域的老牌公司。该公司发布的新人工智能网站生成工具可以让 Wix 用户描述他们的意图，并生成一个包含主页、内页、文本和图片的网站，并可以包括活动、预订等特定业务板块。在一个类似聊天机器人的界面中，该工具会询问一系列有关网站和业务性质的问题，并尝试将其转化为定制的网站模板。Wix 认为客户不会特别在意花时间定制网站外观的方方面面。

消息来源：Tech Crunch

老王点评：很多年前，开发一个网站是一件艰巨的工作，而现在，通过新的工具，开发一个网站可能就像快餐一样简单。

硬核观察 #1065 开源硬件公司正在向封闭转变

硬核老王发布于 2023-07-18
另请参阅: 硬核观察,开源硬件, AI
1 条评论

开源硬件公司正在向封闭转变

在过去 15 年里，创新型电子公司设计并发布了数以千计的开源硬件设计，创造了一个蓬勃发展的产业。他们还集体创作并签署了《开源硬件定义》，为这些产品给出了明确的定义和标准。然而，最近一些开源硬件公司要么封闭源代码，要么推迟发布源代码，要么要求签订 NDA 才能获得“开源”的硬件及其软件。去年悄悄完成 3200 万美元融资的开源硬件公司 Arduino 修改了自己的开源承诺，删除了 “所有 Arduino 板都是完全开源的，……软件也是开源的……” 的话语。SparkFun 采用了闭源固件，需要 NDA 才能查看其代码，并申请撤销其销售的一款产品的开源硬件认证。开源 3D 打印公司 Prusa 以开源名义销售的产品，由于担忧“克隆品”而一直没有发布相应的源代码，并指责中国制造商利用其设计和源代码制造专有的闭源产品，还对从他们的开源代码中获取的设计和算法申请专利。

消息来源：Adafruit

老王点评：无论是开源软件，还是开源硬件，资本一旦涉入，开源的味道就会变化。很多靠开源起家的公司，最后背离开源，或许无奈，或许是主动选择。开源的理念，可能他们自己也不一定真心相信。

人工智能检测器认为《美国宪法》是由人工智能编写的

尽管依靠人工智能工具来检测人工智能生成的作文很有诱惑力，但迄今为止的证据表明，这些工具并不可靠。由于存在假阳性，GPTZero、ZeroGPT 和 OpenAI 自己的文本分类器等人工智能写作检测器无法检测由 ChatGPT 等大型语言模型组成的文本。如果你将美国最重要的法律文件《美国宪法》输入这种检测工具中，它会告诉你该文件几乎肯定是由人工智能撰写的。同样的情况也发生在《圣经》选段中。

消息来源：Ars Technica

老王点评：简单来说，这些人工智能的模型就是基于这些成例的文本训练而成的，自然无法区别这些事实上由人撰写的文件，而认为这些文本和人工智能生成的非常相近。这篇来源详细介绍了更多细节，感兴趣的话可以看看。

出现用于网络犯罪的人工智能 WormGPT

以 OpenAI 聊天机器人 ChatGPT 为代表的生成式 AI 能生成类似人类的文本，网络罪犯可利用它自动创建高度可信的钓鱼邮件，对收件人高度定制，增加攻击的成功率。网络罪犯甚至创建了专门用于恶意目的的工具 WormGPT。WormGPT 是基于 2021 年开发的大模型 GPTJ，它的功能包括无限字符支持、聊天记忆保留和代码格式化等。开发者声称 WormGPT 使用了恶意程序相关的数据进行训练。

消息来源：Slash Next

老王点评：要是什么地方对新技术的利用最积极，那要数这些可以用来牟利的非法领域了。

硬核观察 #1064 CentOS 项目发出一篇奇怪的博文

硬核老王发布于 2023-07-17
另请参阅: 硬核观察,CentOS, AI, 恶意程序
3 条评论

CentOS 项目发出一篇奇怪的博文

最近，在红帽限制其 RHEL 源代码的访问之后，整个社区围绕这件事发生了很多事情。周五，CentOS 项目董事会发出了一篇模糊不清的简短博文，文中称，“发展社区并让人们更容易做出贡献是成功的关键因素。我们对与 CentOS 项目合作的兴趣感到兴奋。”并说他们今年以来一直在制定一套指导方针，“以帮助定义 CentOS 及其交付成果的成功含义”，还表达了对新贡献者的欢迎。除了这篇模糊不清的博文外，未见到进一步的明确信息。

消息来源：CentOS

老王点评：CentOS 项目还活着？要不是这篇博文，我以为他们已经不存在了呢。这算是对社区的抗议的反击吗？

利用微软证书签发的恶意驱动多达数千个

微软本周早些时候警告称，Windows 硬件开发者计划认证的一些驱动程序正在被恶意利用。为了应对恶意驱动程序的威胁，从 Windows Vista 64 位开始，微软开始要求内核模式驱动程序使用经过验证的证书颁发机构颁发的证书进行数字签名。不过，也有例外情况，使用过期证书或 2015 年 7 月 29 日之前签发的证书签署的驱动程序，也被认为是合法的驱动。已经有多种利用这一漏洞的开源工具出现。思科称，他们观察到多个威胁行为者利用这一政策漏洞部署了数千个恶意签名驱动程序。作为回应，微软阻止了所有这些证书。

消息来源：E-Security Planet

老王点评：为了照顾临时性的特例，而开的一个“后门”，终究会引来更多麻烦。

印度开发商解雇 90% 的技术支持团队，将工作外包给人工智能

一家印度软件开发商初创公司难以负担其客户支持团队的费用，于是将其外包给一个人工智能聊天机器人，后者显然更高效、更便宜。他们反映，改用机器人服务后，首次响应时间从 1 分 44 秒降至 0 秒。解决时间也急剧下降，从人工服务时的 2 小时 13 分钟下降到人工智能服务时的 3 分 12 秒。总体客户支持成本下降了约 85%。

消息来源：The Register

老王点评：尽管印度一直被视为廉价 IT 人才的来源，也是很多公司的全球客户支持中心，但是看起来，人工智能更便宜、更好用。