分类 新闻 下的文章

PostgreSQL 超过 MySQL 成为开发者首选数据库

Stack Overflow 2023 年 5 月的调查显示,45.55% 的受访者使用 PostgreSQL,而 MySQL 为 41.09%,SQLite 为 30.9%。三年前,同样的调查中,MySQL 占 55.6%,PostgreSQL 占 36.1%。需要注意的是,这是一个开发者调查,它并不反映生产中的使用情况。此外,微软的 SQL Server 是排名最高的全商业数据库引擎,使用比例为 25.45%,比 2020 年的 33% 有所下降。

消息来源:Dev Class
老王点评:其实 PostgreSQL 在特性方面一直比 MySQL 好,但是这十多年来就一直被 MySQL 压着打。我接触的第一个开源数据库是 PostgreSQL 而不是 MySQL。现在似乎 MySQL 有点颓势了,而 PostgreSQL 多年的坚持得到了开发者们的认可。如果你是开发者,你会考虑选择哪个呢?

红帽准备开发 CentOS Stream 10

根据红帽工程师分享的 Fedora Enterprise Linux Next(ELN) 计划,推出 CentOS Stream 10 的进程正在进行中,这将最终形成 Red Hat Enterprise Linux(RHEL)10 的基础。预计将在 7 月把所有 Fedora ELN 内容大量导入 CentOS Stream 10。CentOS Stream 的目标是在明年 2 月的 Fedora 40 之前,不与 Fedora 分叉。预计 RHEL 10 将在 2025 年发布。

消息来源:Phoronix
老王点评:无论如何,我都觉得红帽放弃 CentOS 的战略是一大败笔,至少这件事可以做的更好。当然,任何决定背后都有其根本利益的驱动,红帽这样做无可厚非,只是如今这个局面可能是他们最初也没预料的吧。

英特尔简化其 CPU 品牌组合

英特尔已经宣布从下一代 Meteor Lake CPU 开始对其处理器品牌进行一些改变。最小的变化是,英特尔的主流 CPU 将失去其 “i”,从 Core i3/i5/i7/i9 转变为简单的 Core 3/5/7/9。英特尔还将停止在其处理器品牌中使用 “代” 的信息 —— 不会有被宣传为 “第 14 代” 的新 CPU,但会在 CPU 编号中包含世代编号。这是英特尔处理器品牌战略更广泛调整的一部分。去年,该公司放弃了低端笔记本电脑 CPU 的奔腾和赛扬品牌名称,它现在将这些英特尔处理器称为英特尔处理器。

消息来源:Ars Technica
老王点评:这些 CPU 厂商的命名真是有点随意,编号和实际的技术有时候有点脱节。

众包工人用 AI 为 AI 做数据标注工作

AI 模型是建立在人类劳动的基础之上的,高质量的数据标注对 AI 模型至关重要,AI 公司通常会雇佣廉价的众包工人做一些数据标注工作。但研究显示,随着 AI 聊天机器人,如 ChatGPT 的流行,众包工人开始利用 AI 做这些数据标注的工作。瑞士洛桑联邦理工学院的研究人员招募了 44 名众包工人来对 16 篇医学研究论文总结摘要,根据记录的击键情况,比如按下复制快捷键等,他们估计有 33-46% 的摘要文本是用 AI 生成的。

消息来源:The Register
老王点评:还记得前两天我们的#1032 期报道吗,显然这种 AI 吃 AI 的狗粮的事情已经在发生,并且会越来越多。而且,AI 真的能分清楚哪些是 AI 生成的么?可能会越来越难。

FreeBSD 本月庆祝其三十岁生日

1993 年 6 月 19 日,从 386BSD 项目中分裂出来的 FreeBSD 正式有了这个名字。但第一个正式版本直到 1993 年 11 月才发布。FreeBSD 14 将于未来几个月后发布,晚于预期计划。

消息来源:FreeBSD
老王点评:虽然不如 Linux 那么流行,但是 FreeBSD 仍然是一个独特而重要的操作系统。当然,这里面故事很多,感兴趣的朋友可以了解一下。

GPT-4 生成的商业计划书更受投资者青睐

虽然用 AI 撰写商业计划书能节约很多时间,但更重要的是,AI 撰写的比人类撰写的更好,更吸引投资。有公司邀请了数百名投资者和企业主对一组由人类创造和 GPT-4 生成的商业计划书进行评分,他们并不知道有 AI 参与撰写。而且,其中人类撰写的计划书来自于已经获得融资的成功案例。结果显示 GPT-4 生成的商业计划书比人类更有效,被认为在质量、关键要素描述和问题描述上胜过人类。调查显示,在投资者和企业主阅读了 GPT-4 的计划书之后,投资可能性为人类的三倍,他们认为 AI 生成计划书的说服力是人类的两倍。

消息来源:ZDNet
老王点评:投资人可能会想,那我为什么不直接投资 AI 创建的企业呢?这一天或许不远了。

英特尔开始出货量子处理器

这个名为 Tunnel Falls 的处理器是一款 12 量子比特的芯片,虽然远远落后于英特尔的许多竞争对手的量子比特数量,但英特尔正试图建立基于硅的量子比特,而其它的量子处理器厂商都在通过云服务提供量子处理器。这些量子比特基于“量子点”,这些结构比材料中的电子波长还要小。量子点可以用来捕获单个电子,然后可以处理电子的特性来存储量子信息。英特尔利用其制造专长来制作量子点,并创造出设置和读取其状态以及执行操作所需的所有邻近功能。

消息来源:Ars Technica
老王点评:居然可以像民用芯片一样销售了?我感觉量子时代或许来的比我想象的要早。

谷歌利用 YouTube 开发其下一代人工智能

据透露,谷歌的研究人员一直在利用 YouTube 开发其下一个大型语言模型 “ 双子座 Gemini ”,该模型展示了在其他任何模型中都看不到的多模态能力。而 OpenAI 也已经秘密地使用了 YouTube 的数据来训练其一些人工智能模型,但谷歌能够拥有 YouTube 更全面的视频数据。人工智能开发者在寻找用于训练和改进模型的高质量数据方面面临着新的障碍。从 Reddit 到 Stack Exchange 再到 DeviantArt 的主要网站出版商正越来越多地阻止开发者为该目的下载数据。

消息来源:The Information
老王点评:人工智能下面一个竞争优势就是,看谁拥有大量的数据。所以,我有点明白 Reddit、Twitter 为什么要对其 API 收高价了,可能广告的流失可能并不是主要的原因,因为这种情况并不是第一天存在了。

Meta 公司希望人们能利用其开源人工智能赚钱

Meta 公司正在研究如何将其开源的大语言模型的下一个版本用于商业用途,他们希望其他公司自由使用 Meta 正在开发的新人工智能软件并从中获利,这一决定可能会对其他人工智能开发者和越来越多地采用它的企业产生重大影响。随着开发者采用和改进这些 Meta 开源的模型或修补其安全漏洞,Meta 也将能够把这些改进纳入其自己的消费者和广告产品的人工智能模型中。

消息来源:The Information
老王点评:Meta 公司显然是走一条弯道超车的方法,走开源的路,让其它人无路可走。

Reddit 威胁换掉继续抗议的子区管理员

本周初,数千 Reddit 子区 闭版 以抗议 Reddit API 的天价收费,因为这事实上扼杀了管理员们赖以执行管理操作的第三方客户端。Reddit CEO 对员工 表示 不要担心,因为抗议不会影响公司收入。他称,“大部分子区会按计划在周三回归,我们干好自己的工作就行了”。周三,部分子区陆续恢复,但也有很多子区将继续保持关闭 —— 直到 Reddit 改变其政策。目前还有超过一半的子区保持关闭或限制,这包括订阅数超过四千万的 r/funny、超过三千万的 r/aww、r/Music 等。此外,Reddit 还威胁将移除继续抗议的管理员。Reddit 宣称,如果一个子区的管理团队一致同意停止管理社区,它将邀请愿意管理社区的新管理员来管理社区;而如果至少有一名管理员愿意维持社区运作,Reddit 将移除不想管理社区的管理员。

消息来源:Hacker News
老王点评:真是要硬扛到底啊,这不是移除几个“刺头”管理员就能解决问题的,相信这样的抗议也代表了大部分社区中坚的意见。无论如何,这都是一幕罕见的大规模社区对抗事件,让我们拭目以待。

YouTube 通知其开源替代品 Invidious 关闭

Invidious 是 YouTube 的一个开源 “替代前端”,允许用户在没有数据跟踪的情况下观看 YouTube 视频,也可以让用户在观看视频时不被 “恼人的广告” 打断。YouTube 声称该软件违反了其 API 政策,称它没有显示 YouTube 服务条款的链接,也没有 “明确” 解释其对用户信息的处理。YouTube 要求它在 7 天内关闭。

消息来源:VICE
老王点评:看来开放 API 将全面进入关闭时代,各个网站都开始扼杀这些妨碍其广告业务的客户端了。或许在官方看来,这些利用其 API 的第三方客户端就是在对它们吸血。

Alphabet 出售了谷歌域名产品

Alphabet 正在结束其谷歌域名业务,并将其资产以约 1.8 亿美元的价格出售给 SquareSpace。这些资产包括“在谷歌域名业务上托管的 1000 万个域名,分布在数百万个客户中”。谷歌域名业务于 2014 年推出,在 2022 年退出了测试阶段。它拥有诸多新的顶级域名,是 HTTPS 的主要支持者之一。

消息来源:9to5google
老王点评:谷歌连域名这么重要的基础设施服务都开始砍掉,以后还能信任谷歌在基础设施方面的持续性么?

安卓开源项目将不是一个完整的开源移动操作系统

安卓开源项目(AOSP)是安卓系统开源的部分,但谷歌不断地将其中一些部分抽取到其私有的谷歌服务框架。最近,谷歌又废弃了 AOSP 中的拨号和消息应用程序,谷歌称,“这个应用程序没有得到积极的支持,其源代码只作为参考。这个项目将在未来的某个时候从源代码清单中删除。”虽然每个安卓 OEM 厂商都已经使用了他们自己的拨号和消息应用,而且也有比谷歌更好的开源替代品,但对于安卓这个开源操作系统来说,由于 AOSP 的功能不断地被转移到闭源的谷歌服务框架中,你将不能说 AOSP 是一个完整的开源移动操作系统了。

消息来源:OS News
老王点评:从谷歌删除“不作恶”信条那时起,开源就不断被它践踏。当然,这并不是谷歌做的有多差,或者违背了开源许可证,在这方面比它差的比比皆是。叹息的是,终究很多公司只是将开源当成一件需要利用时披上的华丽衣服,而在金钱当道时就如旧衣一样丢弃。

Debian 13 将支持 RISC-V 64

Debian 12 已经正式发布,官方支持 AMD64、AArch64、i386、POWER 等架构,但不支持 RISC-V 64 位。不过,对 RISC-V 64 位的移植正在取得良好的进展。在一年半到两年后的 Debian 13 版本中,预计会有对 RISC-V 64 位的支持。考虑到许多社区开源开发者缺乏高性能 RISC-V 硬件,这也是可以理解的。

消息来源:Phoronix
老王点评:如果 Debian 能够支持高性能 RISC-V 架构,将从根本上推动 RISC-V 的发展。

生成型人工智能每年可为全球经济增加 4.4 万亿美元

麦肯锡公司称,生成性人工智能每年可为全球经济增加 “2.6 万亿至 4.4 万亿美元”。这几乎是 “相当于在地球上增加一个规模相当于英国的新国家(其 2021 年 GDP 为 3.1 万亿美元)”。这一数据比该公司在 2017 年的预估上调了 15% 至 40%。生成性人工智能和其他技术有可能使工作自动化,但麦肯锡认为这并不意味着大规模的工作流失,而是“使这些工作的执行速度大大加快”。麦肯锡发现,主要受到影响的工作任务是客户运营、市场和销售、软件工程和研发等工作。

消息来源:Venture Beat
老王点评:虽然如此说,但是一些人失业是不可避免的,就看谁能适应。可以预期的是,人工智能鸿沟会进一步拉大社会差距。

回音

  • AMD 上个月 披露 将用开源固件 openSIL 取代其 AGESA 固件。这件事的新进展是,AMD 刚刚 发布 了 openSIL 非常早期的概念验证代码。

伊朗把 FPGA 开发板“变成了”量子设备

上周伊朗军方展示了其海军大学开发的“量子处理算法”的首款产品,它能帮助军方探测水面的扰动。但通过媒体公布的“量子”设备图像的分析显示,该设备可能是一款在亚马逊上出售的 FPGA 开发板 ZedBoard,在图像上甚至可以清晰地看到该品牌名。ZedBoard 开发板主要是用于视频处理、可重构计算、电机控制、软件加速等用途,并不具有“量子比特”。

消息来源:VICE
老王点评:有没有一种可能,他们就是在这样的板卡上安装了几个“量子比特”??

人工智能对人工智能生成的内容进行训练将导致人工智能崩溃

用于训练大型语言模型的数据最初来自人类来源,如书籍、文章、照片等,这些都是在没有人工智能的帮助下创建的。但随着越来越多的人使用人工智能来制作和发布内容,一个明显的问题出现了:当人工智能生成的内容在互联网上扩散时,人工智能模型开始对其进行训练。研究人员发现,“在训练中使用模型生成的内容会导致所产生的模型出现不可逆转的缺陷。”他们研究了文本到文本和图像到图像的人工智能生成模型的概率分布,得出结论:“从其他模型产生的数据中学习会导致模型崩溃 —— 这是一个退化的过程,并且随着时间的推移,模型会忘记真正的基础数据分布。”他们观察到模型崩溃发生得如此之快:模型可以迅速忘记它们最初学习的大部分原始数据。这导致它们随着时间的推移,表现越来越差,错误越来越多。

消息来源:Venture Beat
老王点评:这让我想起了衔尾蛇,一种自己吞噬自己尾巴的蛇。这样下来人工智能失去对世界的真正认知,我们的未来或许再也分不清现实和人工智能虚构的“现实”。

Meta 开源了音乐和图像模型

Meta 公司开源发布了自己的人工智能音乐生成器 MusicGen。它可以将文字描述(例如 “一首 80 年代的流行歌曲,背景音效是重鼓声和合成器垫音效”)变成大约 12 秒的音频。该公司没有提供用于训练模型的代码,但它提供了预训练的模型,任何拥有合适硬件的人,如 16GB 的 GPU 都可以运行。

Meta 也发布了一个 “类似人类” 的人工智能图像创作模型 I-JEPA,训练代码和模型快照发布在 GitHub 上。Meta 称,该模型利用相关世界的背景知识来填补图像的缺失部分,而不是像其他生成性人工智能模型那样只看附近的像素。它使用了类似人类的推理,可以避免人工智能生成的图像中常见的错误,如多了手指的手。

消息来源:Tech Crunch
消息来源:路透社
老王点评:Meta 在人工智能方面的战略就是走开源的道路,让别人无路可走。