分类 硬核观察 下的文章

大模型“深吸一口气”后会更聪明

DeepMind 的研究人员开发了一种技术,可以通过使用人工智能模型来改进提示词,以提高其它人工智能语言模型的数学能力。利用这种被称作“通过提示进行优化(OPRO)”的技术,他们发现,使用“深吸一口气,一步步解决问题”的提示词,能大幅提升数学测试得分。对 PaLM 2 使用该提示,它在小学数学应用题数据集 GSM8K 中的正确率达到了 80.2%,而不使用该提示正确率只有 34%。为什么这能奏效呢?大模型显然不会呼吸,也不像人类那样思考和推理。它所做的“推理”都源自从书籍和互联网上抓取的短语数据集。这些内容中往往在“深呼吸”,“一步步思考”等短语后跟着更合理的推理方案。这些短语可能有助于大模型产生更好的答案。

消息来源:Ars Technica
老王点评:要想让人工智能像人类一样思考,就得把它当成人类一样对待。

亚马逊将为 Alexa 添加人工智能

亚马逊展示了由其全新的 Alexa 大语言模型驱动的全新 Alexa 语音助手。这款全新的 Alexa 可以理解对话短语并做出适当的回应,更有效地解释上下文,并通过一个命令完成多个请求。他们表示,Alexa LLM “是一个真正可通用的大型语言模型,针对 Alexa 的用例进行了优化;它与 Bard 或 ChatGPT 或任何这些东西都不同”。想参加测试的美国用户,可以对 Echo 设备 说“Alexa,我们聊聊吧”,就有可能被加到预览测试名单中。

消息来源:The Verge
老王点评:语音助手是最应该有人工智能的设备,而之前它们只是简单的问答机和搜索引擎而已。

统一加速基金会成立,英伟达缺席

Linux 基金会本周宣布成立统一加速(UXL)基金会。该组织的使命是提供 “一个开放标准的加速器编程模型,简化高性能、跨平台应用程序的开发”。该基金会的创始成员包括 Arm、富士通、谷歌云、英特尔、高通、三星等公司。但英伟达公司缺席,英伟达提供了自己的 CUDA 编程模型,用于使用其 GPU。这个新的基金会的核心是 oneAPI 计划的演进,其目的也是创建一个新的编程模型,使开发人员更容易支持各种加速器,无论它们是 GPU、FPGA 还是其他专用加速器。

消息来源:Tech Crunch
老王点评:那就看看自己玩还是大家玩,那个更好玩。

回音

  • 之前,由于不满 HashiCorp 修改 Terraform 的许可证,社区创建了 OpenTF 分支。在 HashiCorp 大为不满,向许多支持的公司发送了“停止侵权”的通告后,为了避免商标侵权,OpenTF 改名为 OpenTofu —— 开源豆腐。他们有意选择了一个幽默的名字。

二季度英伟达 H100 GPU 出货超过 900 吨

据报告,二季度有 30 多万台 H100 GPU 进入了服务器制造商的装配线,按每台 GPU 连同散热器的重量约为 3 千克,约计 900 吨!此外,为人工智能处理工作配备 8 个 GPU 的服务器推高了服务器平均价格,涨幅超过了 30%。据预测,8 个 GPU 的服务器的持续部署将导致服务器市场收入在 2024 年上半年同比增长 51%,预计将有一百万个 H100 GPU 进入服务器。

消息来源:The Register
老王点评:我从来不知道芯片也可以按吨来计算,这一比喻令人直观地感受到现在 GPU 芯片有多火。

MariaDB 公司或被风投收购

MariaDB 公司于 2022 年 12 月进行了首次公开募股(IPO),获得了 1.04 亿美元的资金。今年 3 月,MariaDB 公司表示,预计通过数据库订阅和服务筹集的资金将不足以满足其预计的营运资金和运营需求,“正在寻求额外的资金,以满足 2023 年 9 月 30 日之后的预计营运资金、运营和债务偿还需求”。7 月,纽约证券交易所通知 MariaDB,该公司在 30 天内股价跌破 1 美元,不符合其上市手册的规定,面临退市风险。风险投资公司 Runa Capital 提出收购 MariaDB 已发行普通股的 100% 的非承诺要约。

消息来源:The Register
老王点评:开源软件公司不好干啊,可能不上市还更好一些。

AI 编程助手有时候会替你填上别人的密钥

不小心的开发人员可能会在代码库中硬编码证书,甚至提交到 GitHub 等公共源代码托管服务。研究人员对 GitHub Copilot 和亚马逊 CodeWhisper 等 AI 编程助手生成的代码中是否会出现泄露的 API 密钥进行了研究。他们让 AI 补完代码中空白的密钥值,研究发现,这些 AI 编程助手给出的密钥中,Copilot 有 3.6%,CodeWhisperer 有 5.4% 都是 GitHub 上的有效硬编码凭据。

消息来源:The Register
老王点评:也就是说你泄露的密钥,不仅仅能在 GitHub 上搜到,而且会被 AI 编程助手告诉别人。

SaaS 公司退云节省了 100 万美元

SaaS 项目管理公司 37 Signals 的 CTO 此前表示,他的公司每年在云计算上花费 320 万美元,其中大部分花在 AWS 上。由于高昂的云服务费用,该公司推动了云遣返计划,花费了 60 万美元购买了 8 台大型服务器,每台服务器包含 256 个虚拟 CPU,并将它们托管。该公司 CTO 称,“我们的云计算支出已经下降了 60%,从每月约 18 万美元降至不到 8 万美元。”他补充说:“按年增长率计算,这相当于节省了 100 万美元,而且我们将在 9 月份再次大幅降低成本。”此外,该公司的运维团队的规模在此期间保持不变。

消息来源:The Register
老王点评:云计算并不仅仅是节省成本的。

英伟达显卡的开源 Nouveau 驱动维护者辞职

Nouveau 刚刚发布了一个大型补丁系列,使 Nouveau 内核驱动程序能够使用英伟达的 GSP 来改进对 RTX 20/30 系列硬件的支持,并最终在 RTX 40 GPU 上实现加速图形支持。几个小时之后,它的核心维护者辞职了。长期以来,红帽公司的 Ben Skeggs 一直是 Nouveau DRM 内核驱动程序的主要维护者,在很大程度上一直领导着 Nouveau 内核驱动程序部分。他发布消息称,“我已经辞去了在红帽的职务,并将退出 Nouveau 开发”。

消息来源:Phoronix
老王点评:虽然红帽在努力地封闭 RHEL 源代码,并且说了一些不中听的话。但无论如何,红帽养活了很多开源开发者,一旦他们离开了红帽,其贡献也很有可能就戛然而止。

微软发布了 WSL 2 的 2.0.0 版本

这是 Windows Subsystem for Linux 的一次重大更新,以 WSL v2.0.0 的形式发布在 GitHub 上。不要把它与 WSL 2 混淆,它实际上是 WSL 2 的 2.0.0 版(上一个版本是 1.3.17)。这个版本有许多更新,WSL 软件包中的所有二进制文件现在都已正确签名,WSL 内核已针对 Linux 5.15.123 进行了更新,WSLg 1.0.57 捆绑了最新的图形/用户界面支持。此外,还包括一些实验性功能,比如,可以减少 WSL 虚拟机回收缓存内存时的内存使用、可以改变 DNS 请求的解析方式、可以将 Windows 的防火墙规则应用到 WSL、自动使用 Windows 的网络代理信息等。

消息来源:Phoronix
老王点评:微软真是不遗余力地将 Linux 中的好东西都收罗到它的 Windows 中啊。

回音

  • Unity 在 讨论 新的政策,预计将对收费设定上限,对达到门槛的安装量不会追溯,对安装量的跟踪改为由客户自行报告。

有一个软件用了 32 年版本号才变成 6.6

2023 年 9 月 17 日,Linus Torvalds 发布了 Linux 6.6-rc2,他写道,“我认为,6.6-rc2 最值得注意的一点是,它距 0.01 版本发布整整 32 年。如果你是计算机专业人士,这就是一个整数。”不过,除了这个日期之外,这个版本没有什么特别的,“到处都有随机修复,但没有一个看起来特别奇怪”。

消息来源:Phoronix
老王点评:之前我曾经觉得 Linux 内核的版本号变得太快了,但要是放到 32 年这个跨度上来说,倒也不算快,虽然近些年快的有点晕车。

看起来 ChatGPT 不会抢走你的编程工作

《连线》发布了一篇评论文章说,在功能开发受阻的情况下,解雇工程师并投入人工智能很可能会导致灾难,随后很快就会重新雇佣这些工程师。更合理的做法是,大型语言模型可以取代工程设计中的一些枯燥工作。如果提示词正确,它们可以提供自动完成建议或数据排序方法。计算的历史已经证明,试图减少开发人员的存在或简化他们的角色,最终只会增加工作的复杂性,使这些工作人员变得更加必要。如果说 ChatGPT 能够消除编码工作的枯燥乏味的话,那就像编译器终结了二进制工作的繁琐一样,它能让开发人员更轻松地专注于构建其作品的实际架构。

消息来源:连线
老王点评:每一个新的技术进步都淘汰了一些不能跟上的人,并创造了更多新的工作机会。

AI 专家认为构建出真正反映人类集体自我的 AI 是可能的

DeepMind 联合创始人 Mustafa Suleyman 在 2022 年创办了 AI 公司 Inflection, 获得了 15 亿美元的投资。他认为构建出真正反映人类集体自我的 AI 是可能的,能代表人类做出更好的权衡、更一致且更公平。他长期以来一直坚信对话是未来的界面,你将与 AI 进行交流,而不是点击按钮和打字。他认为 AI 的第一阶段是分类,深度学习表明可以训练计算机对不同类型的输入数据分类;第二阶段是生成式 AI,即当前大热的 ChatGPT 之类的 AI;第三阶段是交互式 AI:机器人可以通过调用其他软件和其他人来完成你为它们设定的任务。

消息来源:Technology Review
老王点评:虽然结合上一条看起来人类总会有事情做,但是可能最终的结果就是被 AI 养起来,干一些很轻松而 AI 干不了的事情。

回音

  • Unity 道歉,并承诺修改之前公布的定价政策。之前,由于受到死亡威胁,Unity 甚至关闭了两处办公室。

中国超算海洋之光的性能已达 1.5E

美国计算机协会(ACM)发布消息称,由中国科学家投稿的《涡轮机械流动的精确计算》论文入围 2023 年戈登·贝尔奖,该奖项被誉为“超级计算应用领域的诺贝尔奖”。这篇论文将于 11 月份的 SC23 会议之前正式发布,是基于 1.5 ExaFlops(百亿亿次)超级计算机“神威·海洋之光”完成的,它是“神威·太湖之光”升级版。据该论文,海洋之光拥有超过 10 万个定制的 SW26010 Pro 处理器节点,分布在 105 个机柜中,其理论峰值性能为 1.5 E。据预测,如果将该超级计算机规模扩大到 120 个机柜,在 FP64 精度下的峰值将达到 1.72 E,这将超过美国橡树岭国家实验室的 1.68 E 的 Frontier 超算。而在 160 个机柜的条件下,FP64 峰值性能将接近 2.3 E,将有望击败已经安装完成的美国能源部阿贡国家实验室的 Aurora 超算。

消息来源:Next Platform
老王点评:我们只是懒得参加 TOP500 排名而已。

内核级 SMB 服务器 Ksmbd 进入稳定状态

在 Linux 内核 6.6 候选发布版中,包含了一个 Ksmbd 稳定版,它是三星开发的内核级服务器,通过 SMB 协议提供文件和打印机的网络共享服务。Linux 一直以来都在使用用户空间的 Samba 解决方案,但由于性能、内存占用和复杂度等问题并不理想。Ksmbd 是与 Samba 项目合作开发的,其目标是成为比 Samba 性能更强、重点更突出的解决方案。现在它经过了大量的安全测试,被认为达到了稳定状态,计划进入 Linux 内核 6.6。

消息来源:The Register
老王点评:虽然说是已经达到了稳定状态,但是我对 SMB 服务进入内核空间总觉得不太放心。

人工智能生成的艺术“通过”图灵测试

有人在网上发布了一些使用人工智能生成的图片,用螺旋或棋盘纹理展示了中世纪村庄。这些图片因其非凡的几何特质迅速在社交媒体上获得广泛赞誉。它们是使用稳定扩散和控制网引导技术创建的。之前也有人采用相同的技术来创建图片式的二维码。Y-Combinator 联合创始人 Paul Graham 甚至将之比喻为:“对我来说,这是人工智能生成的艺术通过图灵测试的时刻。”

消息来源:Ars Technica
老王点评:虽然是夸张的说法,但是人工智能生成的图片已经开始超过简单的模仿了。

GCC 准备引入一“键”安全加固选项

已有各种加固选项来提高生成的二进制文件的安全性,但可能并非所有项目都在使用这些选项,原因可能是不了解它们,也可能是软件没有得到积极的维护。经过讨论,GNU 编译器集合(GCC)正准备添加一个 -fhardened 编译器选项,该选项将启用各种加固功能,以提高生成的二进制文件的安全性/稳健性。该加固选项认为合理的选项不能影响应用程序二进制接口(ABI),不能导致 “严重” 的性能问题,也不能导致新的构建错误。如果不出意外,这个选项补丁将很快被合并到明年初发布的 GCC 14.1 稳定版中。

消息来源:Phoronix
老王点评:这样的一键选项很有必要,甚至我认为将来可能会成为默认值。

红帽正在研究延迟模块签名验证以加快 Linux 启动时间

红帽工程师提交了一组补丁,在启用模块签名检查功能时,可以延迟对这些签名的检查,内核会等待用户空间的通信,然后再开始检查。因此,可以在不影响系统安全的情况下显著提高启动速度。该功能引入了一个新的启动时内核参数,允许用户请求这种延迟。在某些情况下,启动速度变得至关重要。而有时候安全检查是多余的,因为在此过程中已经对内核和 initrd 镜像执行了加密检查,可以合理地认为其内容也是安全的。

消息来源:Phoronix
老王点评:这是安全和效率的合理折中。

Meta 的 VR 世界虚拟化身终于有腿了

此前,Meta 公司的《地平线世界》的虚拟化身因为只有上半身而受到广泛嘲笑。不过现在它终于有了虚拟腿。如果你启动《地平线世界》并在菜单空间中照镜子,你就会看到自己化身的全身,而且当你进入一个世界时,其他人也会看到。但是你自己低头时还是看不到你的腿。不过,目前还没有一款 VR 系统内置腿部追踪功能,因此虚拟腿部与真实腿部的实际动作并不一致。

消息来源:Upload VR
老王点评:我觉得目前的 VR 还处于比较可笑、原始的阶段,需要等待基础设施的进一步发展才会真正形成。