标签 AI 下的文章

GitHub 年入 10 亿美元

微软在财报会议上宣布了 GitHub 的一些新数据:GitHub 平台目前年收入 10 亿美元,高于收购时报告的 2 至 3 亿美元。GitHub 现在有 9000 万的活跃用户,高于收购结束时的 2800 万。微软于 2018 年以 75 亿美元收购了 GitHub。

消息来源:Tech Crunch
老王点评:可以说,微软给 GitHub 带来了更大的发展,当然,GitHub 也成了微软的一座宝库。

不管同意不同意,名人的“深度伪造”开始出现在广告中

上周,埃隆・马斯克似乎在一家房地产投资公司的营销视频中出演。而上个月,机器学习公司 Paperspace 的宣传视频中出现了汤姆・克鲁斯和莱昂纳多・迪卡普里奥等演员。这些名人都没有花时间拍摄这些宣传片,他们甚至从未同意为有关公司代言。这和好莱坞传奇人物 布鲁斯・威利斯 的情况不同,使用“深度伪造”技术创作的宣传片是威利斯授权制作的。

消息来源:华尔街日报
老王点评:这种图像融合技术越来越受欢迎,给营销行业带来了新的法律和道德问题。

图片巨头开始销售 AI 生成的图片

AI 图像生成器会不会扼杀图片销售行业?该行业的巨头的答案是“不会” —— 如果他们能先开始销售 AI 生成的内容,就不会。Shutterstock 宣布与 OpenAI 扩大合作,DALL-E 2 将直接整合到 Shutterstock 中。此外,Shutterstock 将向提供了 AI 创作素材的作者们支付费用。另一方面,Shutterstock 禁止在其网站上销售未使用其 DALL-E 整合的 AI 生成的艺术作品。

消息来源:The Verge
老王点评:螳臂当车而已,随着 AI 普及化,谁还会去买图片?那时候可能各种 AI 图片及其素材都会进入公共领域。

微软准备正式推出 Windows 的安卓子系统

微软准备发布 Windows 的安卓子系统(WSA)的 1.0 版本,它可以运行安卓虚拟机,安卓应用就像 Windows 的应用一样运行。通过 WSA 可以运行 “50,000 个应用程序”,但是这些应用程序来自于亚马逊的应用商店,而不是谷歌的安卓商店。也就是说你找不到谷歌的安卓应用,微软的也找不到,Twitter、WhatsApp、Slack 等等都没有,只有各种游戏和一些看起来就山寨的应用。

消息来源:The Register
老王点评:理论上也是可以运行其它商店的安卓应用的,但是我不明白的是,为什么微软非要和亚马逊的商店合作。

利用智能手机预测死亡风险

根据一项研究,智能手机对人们行走活动的被动监测可以用来构建健康和死亡风险的人群水平模型。研究人员利用英国生物银行项目中超过 10 万名英国人的数据进行了 16 年的研究,他们佩戴的运动传感器可以用来从短时间的步行中提取步行强度的信息。该团队仅利用传感器收集的每天 6 分钟的稳定行走数据,结合传统的人口统计学特征,就成功验证了死亡风险的预测模型。研究人员的模型预测一年后的死亡有 72% 的正确率。

消息来源:Yahoo
老王点评:所以其实我们自身的“大数据”早已经“决定”了命运?

谷歌上线软件供应链管理项目 GUAC

谷歌与花旗银行、普渡大学等合作开发了这个项目,其简称 GUAC 代表“理解工件构成的图形”。这是一个免费的工具,用于汇集许多不同来源的软件安全元数据。GUAC 有四个关键功能:连接到各种软件安全元数据的来源来收集数据;从软件的上游数据源导入各种数据;整理这些数据,将其组合成一个连贯的图谱;对照组装好的图谱,用户可以查询附属于图中实体或与之相关的元数据。

消息来源:Record
老王点评:这个项目或许可以将软件供应链管理变得科学化,但是这个事情很复杂,想要真正解决,可能还需要更多的其它措施。

Ubuntu Linux 22.10 & OpenBSD 7.2 发布

今天想必是个好日子,Ubuntu Linux 22.10 & OpenBSD 7.2 都选在今天发布。我们先来看看 Ubuntu 22.10,这个版本不是 LTS 版本,其代号为 “Kinetic Kudu”,意思是 “充满活力的捻角羚”。不过,22.10 除了升级到 GNOME 43 之外,并没有什么特别值得关注的新特性。而对于 OpenBSD 7.2,最值得关注的是支持了 Ampere Altra 处理器,这个处理器在 Linux 上取得巨大成功后,BSD 也在加紧提供对它的支持。

消息来源:Phoronix 1 & 2
老王点评:没什么好说的,喜欢试用新版的尝个鲜吧。

LoongArch 成为第四个进入 UEFI 上游的 ISA

2022 年 9 月初,UEFI 官方在新发布的 UEFI v2.10 规范中,全面支持了龙芯处理器的 LoongArch64 架构,以及部分 LoongArch32 架构。近期,龙芯团队又完成了 LoongArch 基础代码与UEFI 上游 TianoCore EDK2 的合并,从而进入其主分支,成为继 x86、Arm、RISC-V 之后,第四个官方支持的芯片指令系统架构。合并后,开发者可以直接从上游获取 LoongArch 架构的基础代码,有助于 LoongArch 虚拟机开源。

消息来源:龙芯中科
老王点评:龙芯在上游的工作逐渐取得了不错的进展,虽然我更支持 RISC-V,但是也为龙芯点赞。

RIAA 将 AI 混音器列为新出现的版权威胁

美国唱片业协会(RIAA)在其最新的市场概述报告中,将几个 “基于 AI” 的混音器和提取器被添加为一个新出现的威胁。RIAA 称,“有一些在线服务,据称使用人工智能,从录音中提取,或者说,复制人声、乐器或乐器的某些部分,和/或生成、后期处理或重新混合录音,使其与选定的知名录音艺术家的参考曲目非常相似或几乎一样好。” RIAA 将这种破坏原始的受版权保护的曲目创造衍生作品的做法视作侵权。它提及的 Songmastr 可以根据知名音乐艺术家的风格 “后期处理” 任何歌曲,该网站的底层技术基于开源的 Matchering 2.0。

消息来源:TorrentFreak
老王点评:AI 会逐渐侵蚀各种原有的版权边界,我觉得版权相关法规需要正视 AI 的出现带来的变化,而一昧的封堵是没意义的。

AI 成为丹麦新成立的合成党党魁

合成党是今年 5 月丹麦成立的一个新的党派,倡导人类与 AI 的和谐共处。该党派正试图在今年 11 月的丹麦议会选举中赢得一个席位。令人吃惊的是,合成党的公众形象和挂名领袖是一个名叫 Leader Lars 的 AI 聊天机器人。它根据 1970 年以来丹麦各个边缘政党的政策编程,旨在代表 20% 不参加选举的丹麦人的价值观。它通过 Discord 与民众交流。但它不会参与投票。

消息来源:VICE
老王点评:这个党派唯一不足的地方就是,成员还是人类。?

AI 专家点评各大 AI

UNDARK 对纽约大学名誉教授 Gary Marcus 进行了采访,在采访中他对当前的几个主流 AI 进行了有趣的点评:GPT-3 “其实是一个自动完成系统,可以预测下一个单词和句子。就像你的手机一样,你输入一些东西,它就会继续。它并不真正理解它周围的世界。”谷歌的 LaMDA “没有知觉,它不知道自己在说什么东西”。无人驾驶汽车“仅仅记住你所见过的大量交通情况并不能表达你真正需要了解的世界”。OpenAI 的 DALL-E “利用了人类的非故意贡献,他们也许已经签署了‘服务条款’协议,但没有认识到这一切会导致什么”。

消息来源:Undark
老王点评:简直把当前热捧的 AI 批评的一无是处,人间清醒啊。

修好了电脑的 Linus Torvalds 呼吁内核开发人员别赶 Deadline

Linus Torvalds 发布了 Linux 内核 6.1 的第一个 rc 版本,对这个版本,Torvalds 说,“不算小,但比过去几个版本小”。内核的每一个新版本都有一个为期两周的合并窗口,“企鹅皇帝”说,“在我把我的机器整理好并赶上合并窗口后,我对各种迟到的拉取请求感到有些沮丧。我以前提到过这个,但是在合并窗口的最后几天收到相当多的拉动请求,这真的很烦人。”然后他抱怨内核开发人员们没有尽早提交代码,不要“在两周内匆匆忙忙地把一个分支放在一起,然后在第二周的星期五发给 Linus。……在截止日期前熬夜完成论文的做法在高中毕业后就应该被淘汰了。你知道我说是谁”。

消息来源:The Register
老王点评:有时候看内核邮件列表里面 Torvalds 每次的邮件也挺有意思的。

微软发布免费的 AI 图像合成软件

微软宣布了基于 OpenAI 的 DALL-E 2 模型的应用 Designer。用户可通过输入文字提示生成一系列图像。Designer 有免费版和付费版,将提供给微软 365 个人和家庭订阅用户。目前 Designer 作为一个免费的 Web 应用供公众测试和获取反馈,类似的技术将整合到 Edge 浏览器和 Bing 搜索引擎中。

消息来源:ARS Technica
老王点评:AI 图像生成已经势不可挡,虽然目前还有一些道德瑕疵,但是这总是能解决的。

GNU 工具链考虑将其基础设施转移到 Linux 基金会

GNU 工具链是 GNU/Linux 生态系统、云和嵌入式环境的基石。红帽公司资助的 SourceWare.org 多年来一直在托管 GNU 工具链的大部分基础设施,但最近有提议将其基础设施转移到 Linux 基金会提供的 IT 服务下。Linux 基金会的 IT 服务将管理 Git 存储库、邮件列表、错误跟踪器、网站、CI/CD 以及相关的基础设施。GNU 工具链的领导层已经正式表态支持这一提议。

消息来源:Phoronix
老王点评:这件事 Linux 基金会做的不错,毕竟有专门的组织来负责维护,总比红帽员工兼职维护更可靠些。毕竟,现在这种基础软件的安全一旦动摇,影响的范围已经不仅仅是个人爱好者了。

Debian GNU/Linux 14 代号已确定为“Forky”

Debian 方面今天宣布,计划 2027 年发布的 Debian 14 将被称为 “Forky”。Debian 的代号是以《玩具总动员》系列中的玩具命名的。即将在 2023 年发布的 Debian 12 代号为“Bookworm”,而 2025 年发布的 Debian 13 的代号是 “Trixie”。

消息来源:Phoronix
老王点评:不知道《玩具总动员》中有多少个的有名字的玩具,要是用完了怎么办。

谷歌 AI 引入了一个用于数组存储的高性能开源库 TensorStore。

谷歌开发的开源 C++ 和 Python 框架 TensorStore 旨在加速大型多维数组的读写设计。覆盖单一大型坐标系的多维数据集通常用于当代计算机科学和机器学习应用程序中。使用这些数据集具有挑战性,因为客户经常希望进行涉及多个工作站并行操作的调查,并且可能会以不可预测的间隔和不同的规模接收和输出数据。

谷歌研究院开发了 TensorStore,该库为用户提供了一个可以管理巨大数据集的 API,而无需复杂的硬件,以解决数据存储和操作问题。该库支持许多存储系统,包括本地和网络文件系统、谷歌云存储等。

为了加载和处理大量数据,TensorStore 提供了一个简单的 Python API。任何任意大小的基础数据集都可以加载和更新,而无需将数据集完整存储在内存中,因为在需要精确切片之前不需要在内存中读取或保存实际数据。

这是通过索引和操作语法实现的,它与 NumPy 操作的语法非常相似。除了虚拟视图、广播、对齐和其他复杂的索引功能,TensorStore 还支持如数据类型转换、降低取样和随意创建的数组这些功能。

此外,TensorStore 包含一个异步 API,可以并发进行读取或写入操作。在执行其他工作时,软件可以进行内存缓存处理(可配置),从而减少在访问常用数据时处理较慢存储系统的需要。

大型数值数据集需要大量的处理能力来检查和分析。实现这一点的常用方法是在分散在许多设备上的大量 CPU 或加速器内核之间并行化任务。在保持出色速度的同时并行分析单个数据集的能力一直是 TensorStore 的关键目标。 PaLM、脑图和其他复杂的大规模机器学习模型是 TensorStore 应用案例的一些例子。


via: https://www.opensourceforu.com/2022/10/google-ai-unveils-a-new-open-source-library-for-array-storage/

作者:Laveesh Kocher 选题:lkxed 译者:KevinZonda 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出