分类 硬核观察 下的文章

“特性和错误多到无法列出” 的新文件系统准备进入内核主线

Bcachefs 是一个写时复制(CoW)的文件系统,其源自于 Linux 内核的块缓存 Bcache。本周二,Bcachefs 的补丁集已正式递交审查,有望被纳入内核。开发者希望能提供类似 XFS/EXT4 的性能,以及类似 Btrfs 和 ZFS 的特性。其主要开发者表示 Bcachefs 的特性“多到无法列出”,而已知错误也是“多到无法列出”。目前 Bcachefs 的快照支持被认为已经稳定,纠删编码接近稳定,可扩展性过去一年有了显著改进。

消息来源:Phoronix
老王点评:作者这样提交他的补丁集会不会被 Linus 喷一脸啊~

SSD 厂商称 2028 年硬盘将停止销售

一位 Pure Storage 的高管预测,由于电力成本和可用性,以及 NAND 闪存的每 TB 价格下降,2028 年后将不再出售硬盘驱动器。他认为,主要原因不是固态硬盘的成本下降和 DFM 低于磁盘的成本,尽管这也是一个因素。他说,“最终触发因素是电力。……我认为英国的电力最近已经上涨了近 5 倍。……当它们上升时,它们很少甚至永远不会下降”。当然,硬盘厂商是完全不同的看法,比如 2021 年,希捷就表示,SSD 肯定不会杀死 HDD。

消息来源:Blocks & Files
老王点评:大家现在是买硬盘多还是买固态盘多呢?

Rust 代码将首次出现在 Windows 11 Insider 预览版

根据 Azure CTO 的说法,最近的 Windows 11 Insider 预览版是第一个包含 Rust 的版本。之前,我们 报道 过,微软宣布“正在操作系统上使用 Rust 和其他结构”,而且这不仅仅是 Windows 内核。微软也正在将 Rust 引入其 Pluton 安全处理器。

消息来源:Thurrott
老王点评:看起来 Windows 要抢在 Linux 之前正式在内核中使用 Rust 了?

Roblox 不但不支持 Linux,还屏蔽了 Wine

多人游戏 Roblox 没有 Linux 原生版本,但之前可以通过 Wine 在 Linux 上运行。不过其最新的反作弊软件专门屏蔽了 Wine 应用,以至于其在 Linux 上无法运行。该公司的员工在其官方论坛上对此表示,他们很多人想要支持 Linux,但支持 Linux 的成本太昂贵,Linux 桌面至今还不是一个已经证明了自己的游戏平台。而使用 Wine 用户运行它的用户太少,以至于留下让作弊者利用的口子就更不值得了。

消息来源:Gaming on Linux
老王点评:所以,微乎其微的 Linux 玩家就被彻底鄙视了。顺便说一句,Roblox 的服务器已经从 Windows 迁移到了 Linux。

谷歌宣布其下一代大语言模型 PaLM 2

在今天的谷歌 I/O 大会上,谷歌宣布了其下一代大语言模型 PaLM 2。谷歌称,PaLM 2 具有改进的多语言、推理和编码能力:它在 100 多种语言文本上进行了更多的训练,可以理解、生成和翻译细微差别的文本;其广泛数据集包括科学论文和包含数学表达的网页,改进了逻辑、常识推理和数学方面的能力;它还在大量公开可用的源代码数据集上进行了预训练,擅长 Python 和 JavaScript 等流行的编程语言。PaLM 2 有四种大小,这使得它很容易部署到各种使用案例中。谷歌还宣布了超过 25 种由 PaLM 2 支持的新产品和功能,同时将 Bard 扩展到了新的语言。

消息来源:谷歌
老王点评:究竟好不好,相信很快就会有人用它和 GPT-4 做比较了。

Meta 开源多感官人工智能模型

Meta 公司宣布了一个新的开源人工智能模型 ImageBind ,将多种数据流联系在一起,包括文本、音频、视觉数据、红外图像和运动读数。该模型目前只是一个研究项目,还没有直接的消费级或实际应用,但它指出了生成性人工智能系统的未来,可以创造沉浸式多感官体验。像 DALL-E、Midjourney 这样的人工智能图像生成器可以将文本与图像关联起来,从而生成图像。而 ImageBind 可以给人工智能更多的感官,从而产出更丰富的可能用例。

消息来源:The Verge
老王点评:坚定支持开源的 Meta AI,总之是先掀了桌子再说。

OpenAI 用 GPT-4 来解释 GPT-2 的行为

大语言模型(LLM)像大脑一样,它们是由 “神经元” 组成的,它们观察文本中的一些特定模式,以影响整个模型接下来 “说” 什么。但由于 LLM 中的参数数量多到已经无法由人类解释的程度,因此,LLM 给人一种 “黑盒” 的感觉,并出现了偏见、幻觉、涌现等一系列不好解释的现象。OpenAI 正在开发一种工具,以自动识别 LLM 的哪些部分负责其哪些行为。它使用 GPT-4 来解释其 4 年前发布的只有 30 万个“神经元”(15 亿个参数)的 GPT-2。目前该工具代码和所有的 “神经元” 解释数据已经开源,OpenAI 称该工具还在早期阶段。生成的解释结果并不令人满意,看起来连 GPT-4 都不能太用人类可以理解的语言来解释 GPT-2 的行为。

消息来源:Tech Crunch
老王点评:用魔法打败魔法是个好的思路,但是将魔法解释给“麻瓜”可能未必能行。最怕的是,要是魔法可以(悄悄)改进魔法怎么办?

用开源和 AI 驱动的监测网来探索 UFO

由于对 UFO 现象的官方说法缺乏透明度和信任度感到沮丧,一个开发者团队决定自己动手做一个名为 Sky360 的开源公民科学项目。该项目旨在用价格低廉的监测站覆盖全球,全天候观察天空,甚至计划使用 AI 和机器学习来发现异常行为。Sky360 监测站由一个广角鱼眼镜头和一个倾斜相机组成,底层软件对捕获的运动事件进行初步分析,并决定是否进一步放大、跟踪和分析它。所有的硬件都可以由廉价购买的现成零件组合而成。他们目前已在全球建立了 20 个监测站,预计将在 6 月发布第一个面向开发者的开源版本。

消息来源:VICE
老王点评:UFO 究竟是什么,充斥着各种谎言和猜测。或许揭开谜团的唯一办法就是用广泛的事实来说明。这是个有趣的项目,但是也要小心这种数据被利用来监测其它目标。

研究显示元宇宙对美国 GDP 的贡献将可达 2.4%

由 Meta 公司委托进行的一项研究发现,到 2035 年,元宇宙可以为美国每年的 GDP 贡献约 2.4%,相当于 7600 亿美元。这些经济收益可能来自于国防、医疗和制造部门对这些技术的使用,以及视频游戏和通信等娱乐用例。在 Meta 公司的另一份报告中,到 2035 年元宇宙也能为欧盟增加类似比例的贡献。

消息来源:路透社
老王点评:我觉得这就是 Meta 公司给自己画的饼。以我看来,在没有基础设施的进一步突破之前,元宇宙只是一场妄想。

数千名黑客将寻找 AI 大模型的缺陷

今年的 DEF CON 将于 8 月在美国拉斯维加斯举行,期间将邀请数千名黑客对合作的 AI 服务,如 OpenAI、谷歌等的大型语言模型中寻找缺陷,比如代码中的传统错误,以及机器学习中更具体的问题,如偏见、幻觉和越狱。活动组织者称,这是“有史以来任何人工智能模型的最大规模的红队演习”。该活动将有一个夺旗式的积分系统,以促进对 “广泛的危害” 的测试,获得最多积分的人将赢得一块高端的英伟达 GPU。

消息来源:The Register
老王点评:目前看起来,不只是 AI 本身存在一些不足,其在安全性方面的考虑可能还远远不足。

AMD 计划采用开源固件 openSIL

AMD 平台上现在使用 AGESA 固件来初始化多个子系统,其中包括处理器核心、芯片组和内存。AMD 计划在整个 AMD CPU 产品堆栈中采用开源新固件 openSIL,到 2026 年做好投产准备。新的开源固件用标准工业语言编写,允许静态链接到主机固件,通过将开发、架构和验证开源以增强安全性。 AMD 称,openSIL 不只是代码开源,而且其规范也是公开的。openSIL 不是为了取代 UEFI,而是与其它主机固件如 Coreboot 整合。

消息来源:Phoronix
老王点评:很高兴看到 AMD 能采用开源固件,这会对开放硬件、自由硬件有很大的帮助。

Cloudflare 反对欧盟提出的网络使用费

大部分通过电信运营商网络的内容来自于内容和应用提供商(CAP),比如 Netflix 和 YouTube 等,它们将数据注入世界的网络,让运营商将其传递给用户。电信公司抱怨说,他们在新的网络上花费数十亿美元,而 CAP 们则从中渔利。因此,欧盟考虑向 CAP 们收取“网络使用费”。大科技公司认为它已经为海底电缆和其他网络基础设施付费,因而反对此提案。而 Cloudflare 担心,这样会导致对过境网络设定价格,也就是说会影响 CDN 服务商,因此也决定反对。

消息来源:The Register
老王点评:虽然说谁受益,谁付费。但是没道理让 CAP 们在买了带宽之后,还需要额外付费,我觉得这挺像“机场建设费”。

比利时合法化白帽黑客行为

比利时的新吹哨人法于年初生效,该法律合法化了白帽黑客(道德黑客)行为。只要满足一定条件,他们未经同意入侵的行为可以免于刑罚。在这之前,除非被攻击/调查的对象同意,任何形式的黑客行为都面临刑法惩罚。不管对付是否同意,现在自然人或法人可以调查位于比利时的组织的安全漏洞,但需要满足如下条件:不能造成伤害或有获利企图,不能在发现漏洞之后敲诈对方,除非是某些形式的漏洞悬赏计划;必须尽快向比利时网络安全中心(CCB)以及被调查的对象报告漏洞;黑客行动不能超出必要的范围;除非获得 CCB 同意,黑客不能过早披露发现的漏洞。

消息来源:Solidot
老王点评:想必比利时以后会有全球最安全的网络。

TCP/IP 创造者谈其设计中犯下的三大错误

TCP/IP 的共同创造者 Vint Cerf 获得了 IEEE 2023 年度的荣誉勋章。他接受采访时谈到了在 TCP/IP 设计中犯下的三大错误。第一个错误是认为 32 位对于互联网地址而言足够了,在 1973 年,128 位地址可能还无法想象;第二个是没有认真考虑安全性,如引入加密,RSA 算法刚刚实现时,该协议的设计已经冻结;最后一个是没有想到 Web 的出现,以及随之带来的海量内容,他完全没有预料到以后会需要搜索引擎来找到这些内容。

消息来源:IEEE
老王点评:虽然有历史局限性,但是 TCP/IP 真正给互联网奠定了最重要的基石之一,甚至没有之一。

ChatGPT 的流量增长放缓

发布于去年 11 月的 ChatGPT 在去年 12 月吸引了约 2.66 亿次访问,与雅虎新闻相近,之后在 1 月份流量增长 131.6%,2 月份增长 62.5%,3 月份增长 55.8%,到了 4 月份增长 12.6% 至 17.6 亿次,其指数级增长势头开始消退。它的流量超过了必应、纽约时报和 CNN,但仍然只有谷歌搜索引擎的 2%。有趣的是,以新必应爆拉一波流量的必应搜索引擎的流量开始下降,其全球的访问量下降 9.7% 至 13 亿次。

消息来源:Similar Web
老王点评:随着利用 GPT 的 API 的各个网站的出现,ChatGPT 的访问量下降在情理之中,但这并不能代表 OpenAI 的访问量增长放缓,也不能代表 AI 热情降低。

研究发现,硬盘一般三年就坏

根据一家安全数据恢复公司的研究,在它收到的 2007 个有缺陷的硬盘驱动器中,它发现这些硬盘的平均故障时间为 2 年 10 个月。而另外一家备份和云存储公司 Backblaze,以详细的硬盘和固态硬盘故障分析而闻名,在其检查的 17155 个故障硬盘中,硬盘故障的平均年龄为 2 年 6 个月。

消息来源:Ars Technica
老王点评:说实话这个数据有点令人惊讶地短。你的硬盘一般能用多久?

从微服务转换到单体应用,减少了 90% 的成本

一份来自 Prime Video 团队的亚马逊案例研究,评估了如何通过从微服务架构转向单体来节省资金。该团队最初创建了一个由 AWS Step Functions 协调的分布式组件的解决方案,这是一个基于状态机和任务的无服务器协调服务。最终他们的研究表明,微服务和无服务器组件在大规模下确实是有效的工具,但是否使用它们而不是单体应用,必须根据具体情况来决定。通过将服务转移到单体应用上,使得基础设施成本降低了 90% 以上。

消息来源:Dev Class
老王点评:微服务并不是灵丹妙药,云计算也不是银弹,AWS 推荐的也不一定是成本最优的。

Mojo:一种具有 C 语言速度的 Python 超集

Mojo 希望将 Python 的可用性与 C 语言的速度结合起来。Mojo 通过硬件加速,在运行特定数字算法时比 Python 快 35,000 倍。它是建立在下一代编译器技术之上的,使你能够定义零成本的抽象,并受益于类似 Rust 的内存安全。Mojo 代码可以访问各种人工智能调整的硬件功能,因此,对于某些种类的算法,它的速度远远超过了原版 Python,比如在 AWS 机器上运行 Mandelbrot 算法只需 0.03 秒,而 Python 3.10.9 则需要 1027 秒。有人称赞“Mojo 可能是几十年来最大的编程语言进步”。该语言还在早期开发中,仍然有一些缺失的部分,并且尚未开源。

消息来源:The Register
老王点评:会有这种既要又要的好事吗?让我们拭目以待。