分类 硬核观察 下的文章

中国的百亿亿级超算运行“大脑规模”的 AI

去年中国建造了两台百亿亿级的超算,其中一台名为“神威•海洋之光”的超算,是“太湖之光”的下一代,从 CPU 到网络都完全由中国的部件构建。在最近的一篇 论文中披露,该系统有“多达 96,000 个节点”,基于神威 SW26010-PRO 计算单元(内置自定义加速器的多核),具有自定义内存配置和自制的网络结构。此外论文还通过一个“大脑规模”的具有 14.5 万亿个参数的预训练语言模型的跨系统人工智能工作负载展示了其能力,其混合精度的性能超过一百亿亿次(10 的 18 次方)。

老王点评:虽然还是有人认为中国的超算只是花钱堆砌,但我觉得并非如此。

BAT 共同创建新视频流标准

中国三大互联网巨头字节跳动、阿里巴巴和腾讯联合 宣布创建 一种新视频流标准——“超低延迟直播协议信号标准”。新标准旨在解决视频流启动的问题,BAT 称现有的流媒体用户需要等待三到六秒钟才能开始观看视频,新标准试图将这一启动时间减少到一秒钟甚至半秒。新技术可能是建立在 WebRTC 之上的,但尚未公开新标准的代码。

老王点评:不管别人是否乐见,中国会越来越多主导各种标准的制定和推广。

a.out 二进制格式迈出彻底废弃的最后一步

早在 2019 年,Linux 内核就废除了对 a.out 格式的支持。这种文件格式在 ELF 占主导地位之前曾被使用过。目前只有 Linux 内核中的 Alpha 和 m68k 架构仍在使用 a.out 进行构建。现在计划通过 Kconfig 选项默认停止使用,看看是否有人在意。需要说明的是,这里指的是 a.out 文件格式,并不影响编译器在没有指定输出名称时使用 a.out 名称,因为那是 ELF 或其他格式。

老王点评:这次清楚了吧,你 gcc 默认输出的 a.out 只是名字相同。

elementary OS 开发商面临瓦解

近日,排名前十的 Linux 发行版 elementary OS 背后的开发商的两位创始人分道扬镳,并产生了 严重分歧。该公司的收入部分来自捐款,部分来自销售,但新冠疫情导致销售难以维系,公司一直在亏钱,为了维持公司的运营,他们决定从今年开始减薪 5%。但创始人之一 Cassidy 却突然通知另外一位创始人 Daniel 他决定接受一个全职工作,在谈好了退出条件之后,又突然加码,不愿意放弃在公司的股份,想要继续对公司有控制和决策权。Daniel 愤怒地回应,既不舍,但也可能考虑离开。

老王点评:唉,开源商业真的难,希望可以继续走下去。也许广大社区可以施以援手。

70% 的 IT 从业者想离开这个行业

Gartner 的 研究人员发现,全球只有 29% 的 IT 从业者有“高度意愿”留在他们目前的岗位上。根据 2021 年最后三个月对 1.8 万名员工进行的调查,年轻的技术人员比年长的同行更不可能坚持下去,只有 16% 的 19 至 29 岁的 IT 从业者计划留在该行业,而 50 至 70 岁的人则有 48%。

老王点评:看起来年轻人觉得 IT 行业没前途啊,只有我这样的老人家才“不得不”留在这个行业。

谷歌宣布将推动个人数据在不同平台迁移

日前,美国谷歌公司宣布了一项 推动数据迁移的计划,未来五年时间里,谷歌准备投入更多资金和人力来推进可移植性领域的各个项目,其中包括 2018 年谷歌参加的数据转移项目(DTP)。谷歌披露说,每个月,用户使用谷歌的数据迁移工具 Takeout 完成的个人数据外迁次数多达 820 万次,2021 年用户外迁的文件数量为 4000 亿个,比 2019 年翻了一倍。

老王点评:这确实是非常有意义的项目,但是我似乎没听说国内哪个互联网公司支持。

企业最舍不得扔掉的设备是台式机

根据 Euro PC 的 一份新报告,对 1200 名英国企业主的调查发现,只有约 1/4 的企业会修复坏掉的设备,约 2/3 的企业在 IT 设备达到使用寿命之前就将其扔掉,而超过一半的企业平均每三到五年就更换一次终端设备。87% 的公司扔掉了笔记本电脑,其次是服务器(76%)、路由器(63%)和显示器(59%),而唯一半数以上(52%)的受访者不会扔掉的终端类型是台式机。

老王点评:这么说,台式机还是有很多优势的,尤其是在制造 IT 垃圾方面。

能放大 40 亿倍流量的 DDoS 攻击

DDoS 放大攻击非常受网络罪犯的欢迎,它可以大幅减少发动攻击所需的资源。最早的放大攻击是利用错误配置的 DNS 服务器,能将攻击流量放大 54 倍,后来还有利用 NTP 服务器(556 倍)、RDP(86 倍)、memcached(5.1 万倍)等进行的 DDoS 攻击。研究人员发现,错误暴露在互联网上的用于测试的 Mitel 电话网关能 放大 40 亿倍 攻击流量。其原因之一是大幅延长攻击时间,一个欺骗性的数据包可以诱发持续时间长达 14 小时的 DDoS 攻击。

老王点评:这种攻击简直就像是捅了马蜂窝,捅一下蛰你 14 个小时。

Azure 在公有云采用方面领先于 AWS

根据一份报告,80% 的企业受访者采用了微软的公共云,比前一年的 76% 有所提高。这领先于 AWS,后者采用率为 77%,低于一年前的 79%。谷歌占 48%,其次是甲骨文的云基础设施,从一年前的 32% 跌至27%。但 AWS 仍然在中小企业公有云中处于领先地位,尽管它的采用率仍然略有下降,从 72% 下降到 69%,而 Azure 从 48% 跃升到 59%。

老王点评:没想到 Azure 发展这么快啊,虽然其微软 365 确实有很多企业在用。

科学家用 AI “听懂”猪是否幸福

这种人工智能猪翻译器可以 将各种猪叫识别为情绪,可以用来自动监测猪的健康状况。他们训练了一个神经网络,分析了从 400 多头猪身上录制的 7414 个猪叫声的声学特征,记录了从出生到死亡的不同情况下的猪的音频记录和行为数据,学习猪是在经历积极情绪,如快乐或兴奋,还是消极情绪,如恐惧和痛苦。

老王点评:这样或许可以让猪过的更幸福一些?

开源软件赶走了专利巨魔

“统一专利(UP)”是由 200 多家企业组成的国际组织,在过去的两年里,它一直在与专利巨头的斗争中获胜。它与世界上最大的专利不侵犯团体“开放发明网络(OIN)”一起,对不良专利发起了法律诉讼。它们用开源软件的证据来证明,专利巨魔们往往不具备立案条件。UP 已经监督和管理了 43 项挑战,这使得 UP 的成员获得了多项专利和解,而这些又直接传递给 OIN 的 3600 多名社区成员。随着 UP 在淘汰不良专利方面的高成功率,慢慢地专利巨魔们不仅 被赶出了开源软件,而且被赶出了所有软件。

老王点评:这种联合起来的力量很大,对开源软件和软件的健康发展很有意义。

韩国法律要求应用商店引入第三方支付渠道

2021 年 8 月,韩国政府投票批准了《电信业务法》,阻止了苹果和谷歌强迫开发者通过应用商店销售应用以及随之而来的佣金抽取,以防止应用内支付系统的强制排他性,以及限制商店经营者不合理地延迟批准或删除应用。3 月 8 日,韩国国会 通过了该法律,它将在 3 月 15 日前生效。苹果和谷歌仅有一周的时间为该法律的实施做准备。如果不遵守该法律,罚款可能会达到公司相关商业活动年平均收入的 2%。

老王点评:没想到韩国在这方面比美国更坚决。

Chrome 在 Mac 上性能测试首超 Safari

谷歌今天宣布,在 Mac 上的最新版 Chrome 浏览器 Chrome 99 在 Speedometer 测试中首次超过 Safari,得分超过 300。Speedometer 是苹果 WebKit 团队开发的网页响应测试工具,模拟用户与网页之间的各种交互。谷歌表示,自 M1 Mac 发布后,Chrome 在这期间速度提升了 43%,在图形处理方面,Chrome 浏览器比 Safari 快 15%。

老王点评:性能是越来越好,内存占用是越来越多。

Linux 发现严重的 “Dirty Pipe” 本地提权漏洞

安全研究人员发现了一个被称为 Dirty Pipe 的 Linux 本地提权漏洞,其概念验证利用代码也一同被披露。该漏洞在内核 5.8 中被引入。正常登录的用户或正在运行的流氓程序可以利用它来获得 root 权限;恶意应用程序也可以利用它来接管有漏洞的安卓设备。这个错误可以被滥用来添加或覆盖敏感的只读文件中的数据,例如从 /etc/passwd 中删除 root 密码,允许系统中的任何人获得超级用户权限,或者暂时改变一个 setuid 二进制文件来授予 root 权限。

老王点评:一般来说,Linux 发行版都会很快打上补丁,不过安卓往往要慢得多。

Fedora 鼓励放弃支持 32 位 x86 软件包

Fedora 已经很久没有专注于 32 位 x86(i686)硬件支持了,但仍在继续构建一些 i686 软件包,但其中一些软件包没有被使用。为了释放构建/编译阶段的资源和减轻软件包维护者的负担,正在开发中的 Fedora 37 鼓励 软件包维护者放弃末端或未使用的 32 位 x86 软件包。但这一变化不会影响对 multilib 的支持,或其他软件包依赖的 i686 软件包。

老王点评:32 位硬件该落幕了。

科学家扩展 DNA “字母表”以存储更多数据

科学家们一直在研究一种相当独特的解决方案:将文件、照片和文档存储在大自然自己的信息数据库中 —— DNA。每天,互联网上都会产生几百 PB 的数据,而只要一克的 DNA 就足以存储这些数据。DNA 用四种叫做核苷酸的分子来编码遗传信息,分别用 A、G、C 和 T 来代表。这相当于一个四字母的字母表。为了存储更多数据,科学家们在 DNA “字母表”中人为 增加了七个新字母,即新的核苷酸。为了可以精确地读回合成 DNA 的数据,研究人员使用了深度学习算法和人工智能。

老王点评:这就是字面意义上的“交换 DNA 就是交换信息”。

研究人员发布第一个开源的代码生成 AI 模型

尽管像 OpenAI 和 DeepMind 等已经开发出了强大的代码生成人工智能,但这些系统并没有开源,比如, 为 GitHub Copilot 提供动力的 OpenAI Codex 的训练数据尚未公开。研究人员开发了 PolyCoder,这是一个基于 OpenAI 的 GPT-2 的模型,在 12 种编程语言的 249 GB 代码数据库上进行了训练。虽然 PolyCoder 在表现上无法与顶级代码生成器相提并论,但研究人员声称,PolyCoder 能够用 C 语言编写代码,其准确度高于所有已知模型,包括 Codex。

老王点评:只有开源才能让更多的人参与进来,才能培养出生态,而不仅仅是某些大公司的专有服务。

9% 的安全事件由 USB 和其他可移动介质引起

在一份 报告 中发现,可移动媒体占所有安全事件的 9%。而在去除涉及云服务的事件后,这一比例增加到 20%。受信任的 USB 设备可能会感染恶意软件,然后会搜索连接到受害者主机的外部存储设备,以感染它们并进一步传播。当终端用户将 USB 设备从个人设备转移到企业资产时,这种风险会更大。

老王点评:USB 是安全风险的重要源头,但这事我觉得不能怨 USB。