标签 Copilot 下的文章

1 Ubuntu 考虑停止提供源代码 ISO

这些 ISO 包含了 Ubuntu Linux 的所有源代码包,其最初的动机是帮助遵守 GPL 许可证,并确保代码易于访问。但在实践中它的作用有限,很少有人下载这些 ISO。Ubuntu 源代码仍将可用,这并不是说要关闭源代码,而是是否值得为组装源代码 ISO 而付出代价和持续的维护负担。此外,Snap 软件包目前也不属于 Ubuntu 源代码 ISO 的一部分,因此这些源代码 ISO 是不完整的。各种 Ubuntu 风味版/混合版也没有发布它们的源代码 ISO。

(插图:DA/68e80ab6-2798-4606-868b-94317256760a)

消息来源:Phoronix
老王点评:源代码 ISO 确实不太重要,只要不像红帽一样将源代码放在付费墙之后就行。

2 微软给键盘加入了 Copilot 键

微软将在 PC 键盘上添加一个专用的 “Copilot” 键,这是自 1994 年 “Windows” 键首次出现在自然键盘上以来,微软首次调整标准 Windows 键盘布局。按下 “Copilot” 键将在 Windows 10/11 中打开 Copilot 人工智能助手。对于没有启用 Copilot 的电脑,包括那些没有登录微软账户的电脑,“Copilot” 键将打开 Windows 搜索。微软表示不会强制要求 OEM 厂商给键盘添加 Copilot 按键,但随着时间的推移,Windows 11 键盘应该会要求配备 Copilot 键。

(插图:DA/510abfe7-4538-442c-8229-4c2723a23bee)

消息来源:Ars Technica
老王点评:或许还可以将 Windows 改名为 Copilot。?

3 人工智能辅助生成的错误报告浪费了开发者的大量时间

curl 的作者最近提出了人工智能生成的安全报告的问题:当这些报告被做得更好看、看起来有道理时,就需要花费更长的时间来研究并最终丢弃它。在 curl 漏洞悬赏计划收到的 415 份漏洞报告中约有 66% 的报告是无效的。这些人工智能可以生成详细、可读的文本,而无需考虑准确性,“但对项目毫无帮助。它反而会占用开发人员的时间和精力,使其无法从事有成效的工作。”他列举了提交给漏洞报告社区 HackerOne 的两份报告作为例子。他说,这份报告是在谷歌 Bard 的帮助下编写的,“充满了典型的人工智能式幻觉:它将旧安全问题中的事实和细节混杂在一起,创造和编造出一些与现实毫无关联的新东西。”

(插图:DA/bd2f9099-a48c-408a-82e8-243ee41e3688)

消息来源:The Register
老王点评:人工智能很快显示出了它的负面作用,在为人类完成琐碎工作的同时,也生成了各种以假乱真的内容。

软件自由保护协会 Software Freedom Conservancy (SFC)是一家由开源倡导者组成的非营利性社区。今天(本文原文发表于 2022 年 7 月 5 日),它发布了一篇抨击性的博文,宣布退出 GitHub,并请求其成员及支持者公开谴责该平台。SFC 与 GitHub 的如此纷争,源于这一颇受指责的举动:微软和 OpenAI 训练了一个名为 Copilot 的 AI 系统,而其训练数据的来源,是那些使用了开源许可证公开的代码。开源代码不是捐款箱,不是想拿多少就拿多少,想怎么用就怎么用的。

它更像是摄影作品。即便摄影师没有向你收取照片的使用费,你仍需要在该署名的地方进行署上来源。据 SFC 的一篇 博文 所述,Copilot 在使用他人的代码片段时,并没有保留来源信息:

“这反映了 GitHub 长期以来的问题,也是我们必须一齐放弃 GitHub 的关键原因。从 Copilot 中,从 GitHub 的代码托管服务中,从我们所见的基本每个领域,我们都发现 GitHub 的行为比其同行要差得多。我们也不相信 Amazon、Atlassian、GitLab 等其他盈利性的代码托管平台,能有杰出的表现。然而,将 GitHub 的行为与其同行相对比较一下,就能发现 GitHub 的行为要差得多了。”

GitHub 是全世界事实上的开源代码仓库。它是 YouTube、Twitter 和 Reddit 的混合体,但专为程序员及其代码服务。自然,替代品是有的。但是,从一个代码仓库生态切换到另一个,并不等同于用 Instagram 来替代 TikTok。微软在 2018 年花了 70 多亿美元来收购 GitHub。从那时起,微软就利用其 OpenAI 的主要受益者的地位,来共同开发 Copilot。并且,要访问 Copilot 服务,只能通过微软的特别邀请,或者支付订阅费。该举激怒了 SFC 及其他开源倡导者,因为微软和 OpenAI 实际上在将他人的代码货币化,同时让使用这些代码的人们不能正确地表明归属信息。

Copilot 必须毁灭。或者,微软和 OpenAI 可以造一台时光机,然后穿越到过去,将 Copilot 数据库中的每一点数据做标记,从而能够为所有输出提供正确的署名。但是,与其去关心你产品或者服务中的伦理问题,不如去鼓动人们,去开拓那荒野西部似的监管环境,后者总是更加简单的。

(题图:MJ/1a101872-c0d6-475e-b3e2-3646c9a2d66b)


via: https://www.opensourceforu.com/2022/07/github-copilot-is-only-effective-because-it-steals-open-source-code/

作者:Laveesh Kocher 选题:lkxed 译者:Peaksol 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

谷歌 Bard 现在可以自己编写代码来回答问题

谷歌表示 Bard 在逻辑和推理方面越来越好。谷歌说,现在当你问 Bard 一个计算任务,如数学或字符串操作,Bard 不像其它大语言模型一样显示语言模型的输出,而是会写一个程序,并执行该程序,然后向用户显示该程序的输出作为答案。谷歌举例说,对于“请为我逆转 Lollipop 这个单词”的问题,ChatGPT 会通过语言模型给出答案 “pillopoL”,这个答案是错误的。而 Bard 会显示正确的结果,并给出计算的 Python 代码。当然,谷歌警告说,Bard 可能会对你的问题解释错误从而犯错;也有可能编写了错误的程序,就像人类编写程序一样,往往第一遍是带有错误的。

消息来源:谷歌
老王点评:这就太像人类了,居然会自己编程、自己运行。

GitHub Copilot 是一种“巧妙的软件盗版方法”

GitHub Copilot 是根据 OpenAI 的 Codex 模型建立的代码建议工具,由微软的 GitHub 进行商业化。Copilot 因其无视版权和许可证直接输出开发者公开发布的开源代码而被起诉。微软、GitHub 和 OpenAI 试图驳回此案,但只设法甩掉了一些索赔,法官保留了主要的版权和许可问题待审。2022 年 7 月,为了回应公众对 Copilot 的批评,GitHub 推出了一个用户可调整的 Copilot 过滤器,以将代码建议及其周围约 150 个字符的代码与 GitHub 上的公共代码进行检查。如果有匹配或接近匹配,该代码建议将不会显示给你。但 Copilot 优化了 AI 输出的温度设置,以尽可能多地产生许可内容的小变化,使其看起来不是完全复制的,来逃避版权和许可的侵犯。投诉称,“Copilot 是一种巧妙的软件盗版方法”。

消息来源:The Register
老王点评:到底改变多少才不算抄袭呢?或许,我觉得更公平的做法是,在输出代码时提示该代码衍生自哪种许可证的代码,因此受哪种许可证影响,如何使用取决于用户自己。但似乎这样做存在一些技术困难,因为 AI 到底是如何糅合出新的代码,对人类来说还是一个黑盒。

Reddit 封杀第三方客户端之后的社区反应

之前,我们 报道 过, Reddit 大幅调整了其 API 价格,事实上扼杀了第三方客户端。出于对此政策的极度不满,Reddit 社区将于 6 月 12 日举行大规模抗议活动,参与抗议的大部分子区将关闭 48 小时,但还有部分将无限期关闭。ArchiveTeam 团队希望赶在 12 日之前 存档 内容,他们目前已存档了 108 亿个帖子(包括帖子内容、评论和图像),还有 1.5 亿个帖子等待完成,团队表示时间来不及了,希望更多人参与帮助。此外,著名的 Reddit 第三方 iOS 客户端 Apollo 宣布将于 6 月 30 日 关闭 该客户端,并 公开 了其后端源代码以示它是合法使用 API,并遵守了 API 的速率限制。

消息来源:Reddit
消息来源:Reddit
老王点评: Reddit 的日子或许不好过,他们在裁员和缩减招聘。但是我觉得这种学着 Twitter 作死而跟着作死的做法,实在是无语。

cURL 发布 8.0,庆祝其 25 岁生日

它是一个用于用 URL 传输数据的命令行工具和库,任何认真编写通过网络进行交互的代码的开发人员都可能使用过 curl。如今,它估计已经被安装了超过 100 亿次。它的第一个版本是 4.0,发布于 1998 年,它仅有 2200 行代码,由 httpget 和 urlget 项目改编而成。当时只能支持三种协议,24 个命令行选项,而现在可以支持 28 种协议,249 个选项。

消息来源:The Register
老王点评:就这样一个原本的个人项目,现在居然发展成了互联网基石项目。

GitHub Copilot 将迁移到 GPT 上

GitHub 已经对其 Copilot 编程模型进行了培训,以执行新的任务,并有了一个新的名字 GitHub Copilot X。今后,Copilot 将依靠一套不断发展的大型语言模型,包括 OpenAI 的 GPT-3.5-turbo 和 GPT-4,而不是 OpenAI 的 Codex 的定制版本。OpenAI 将在 3 月 23 日关闭 Codex 的公共 API。根据 GitHub 的数据,截至上个月,Copilot 参与了微软的云代码库中 46% 的代码创建,并帮助开发者的编程速度提高了 55%。

消息来源:The Register
老王点评:通过 VSCode、GitHub、Copilot,微软似乎已经把开发者所需要的各个方面都掌握了。

Mozilla 将建立 Mozilla.ai

Mozilla 今天宣布,他们将投资 3000 万美元建立一个新的创业公司 Mozilla.ai,专注于 “建立一个值得信赖的、独立的、开源的 AI 生态系统”。Mozilla 称,“人工智能的核心是代理权、问责制、透明度和开放性。Mozilla.ai 将成为大科技公司和学术界之外的一个空间,供志同道合的创始人、开发人员、科学家、产品经理和建设者聚集。”

消息来源:Phoronix
老王点评:虽然这又是一个 Mozilla “不务正业”的项目,但是希望可以为 AI 打造一个可信、独立的道路。

无法从 Ubuntu Linux 中消除 Ubuntu Pro 的广告

在更新 Ubuntu 时,它会提示你安装 esm-apps 软件包,以通过 Ubuntu Pro 获得更多的安全更新。当然,你可以获得一个免费的 Ubuntu Pro 账户,为不超过 5 台的计算机获得更多安全支持。但是,如果你不想用它,也不想看到这个广告信息,你可能认为永久防止这些信息的方法之一是删除提供 Ubuntu Advantage 集成的软件包。但你不能这样做。正如 Ubuntu #1950692 错误所描述的,该软件包现在是核心的 ubuntu-minimal 元包的一个依赖关系,所以如果你删除它,它将会删除其他多个核心包。

消息来源:The Register
老王点评:就没有“免费”的午餐,但是 Canonical 一直将广告打到 Ubuntu 中,并且不能删除,总是有些失望。

新的 GitHub Copilot 将为开发者写出 40-60% 的代码

GitHub 更新了它的 Copilot 编码助手,变得更智能,它建议的代码的接受度从 2022 年 6 月的 27% 提升到现在的 46%,而 Java 代码的接受度甚至高达 61%。此外,它还新提供了一个漏洞过滤系统,以阻止不安全的编码模式,如 SQL 注入或硬编码凭证。新的漏洞扫描器使用大型语言模型来“接近静态分析工具的行为”,虽然不会像那样严格。

消息来源:Dev Class
老王点评:就像大部分手工制品都会被机器淘汰,以后编码这种手工活早晚被替代。

非 GNU/Linux 的 Linux

有一些 Unix 极客坚持认为 Linux 应该正确地被称为 GNU/Linux,因为内核是用 GNU C 编译器构建的,所有东西都是针对 GNU C 库链接的,使用 GNU Coreutils,通常还有来自 GNU 项目的其他多个组件。Chimera Linux 是一个正在建设中的新发行版,它不仅是无 systemd 的,而且也是无 GNU 的。它的创建者希望在今年春天达到 alpha 测试。Chimera 用 LLVM 编译,使用与轻量级 Alpine Linux 发行版相同的 musl C 库和打包工具,新的 Dinit 初始化系统,用户空间其余的大部分都来自当前版本的 FreeBSD。

消息来源:The Register
老王点评:这说明 Linux 并不一定必须的 GNU 的,也可以是 Free 的。

谷歌裁掉了很多重要的开源开发者

许多被开除的人是谷歌开源项目办公室(OSPO)和其他开源工作中最优秀的人。这包括 18 年前创建谷歌 OSPO 的 Chris DiBona;还有 Samba 的共同创造者,前谷歌开发者生态系统的项目经理,以及新招聘的负责谷歌开源安全计划的人等等。

消息来源:The Register
老王点评:这时候我们要问一句,“谷歌还爱开源”吗?并不是开源的人不能裁,对谷歌来说,这些开源专家并没有他们自己想象中的那么重要。他们只是裁人算法下的牺牲品。

沃顿商学院的副教授要求学生使用 ChatGPT

出于对利用 ChatGPT 作弊的担忧,一些学区已经禁止使用它,但沃顿商学院的副教授 Ethan Mollick 不仅允许学生使用 ChatGPT,而且将其列为要求,并将 AI 政策纳入教学大纲。他说,“我们是在一个有计算器的世界教学生数学。现在的挑战是教育者要教学生世界如何再次改变,以及他们如何适应这种改变。”他指出,使用人工智能是一项 “新兴技能”;它可能是错误的,学生应该根据其他来源检查其结果;他们将对该工具提供的任何错误或遗漏负责。

消息来源:NPR
老王点评:积极正面的去迎接新技术的到来,而不是螳臂当车。

GitHub 质疑对 Copilot 滥用开源代码的指控

GitHub、微软和 OpenAI 在周四给法庭的文件中说,由一群匿名版权所有者提出的投诉没有足够具体地概述他们的指控。他们认为,原告缺乏提起诉讼的资格,因为他们未能证明他们因该公司的行为而受到具体伤害。并称,诉讼中没有指明他们滥用的特定版权作品或他们违反的合同。文件中还称,这些版权指控将 “一头撞上合理使用原则”,该原则允许在某些情况下未经许可使用版权作品。

消息来源:路透社
老王点评:首先,GitHub 恐怕否认不了 Copilot 是从 GitHub 上存储的代码进行学习的,甚至是直接原样复制了代码。而是否是“合理使用”,可能不仅仅要看判例,还要看这些代码使用的许可证。