标签 AI 下的文章

硬核观察 #958 Twitter 公开推荐算法源代码，马斯克获特别优待

硬核老王发布于 2023-04-02
另请参阅: 硬核观察,AI, Twitter, 电子游戏
评论

Twitter 公开推荐算法源代码，马斯克获特别优待

Twitter 终于如约公开了推荐算法源代码，源代码托管在 GitHub 上，采用 AGPLv3 许可证。推荐算法控制着出现在 “For You” 中的推文，利用机器学习模型进行排名，过滤掉不良推文和已屏蔽用户的推文等，最后展示到用户的时间线。该代码仓库迅速获得了数十万星标。在代码中，用户发现埃隆·马斯克被专门标出。上个月马斯克的推文曾一度展示给几乎所有 Twitter 用户。代码的注解声称这些标签只是用于数据收集的目的。对于这一发现，马斯克本人在 Twitter 上表示将会移除，声称他也是才知道。

消息来源：Ars Technica

老王点评：这是我对马斯克入主 Twitter 之后所做的事情中唯一赞赏的，或许这会带来一个所谓的 “Twitter 2.0”。今天早上我在朋友圈嘲讽道，某个国内的山寨品怕是都不敢用 Twitter 开源出来的算法来改善自己的算法，因为他们的算法是 “MONEY”。

Midjourney 由于新用户过多而暂停免费试用

AI 图像生成服务 Midjourney 已经停止了其服务的免费试用。人们最初认为暂停的原因是，有人利用 Midjourney v5 生成的 AI 图像在社交网络病毒式传播，如前总统特朗普被捕和罗马天主教教皇身穿时尚夹克的照片，让很多人信以为真。但 Midjourney CEO 表示暂停原因是免费用户流量过大，试用遭滥用。他们认为“罪魁祸首可能是中国的一个病毒式的操作视频”和“暂时的 GPU 短缺”。并指出，Midjourney 的免费试用版从未包括访问 Midjourney 最新的第 5 版，而该版本可创建最真实的图像，并被认为是用于这些病毒图片。

消息来源：The Verge

老王点评：看看，其实不是被玩坏了，而是太受欢迎了。

电子游戏行业盛会 E3 2023 取消

今年的电子娱乐博览会（E3）已经被取消了。娱乐软件协会（ESA）和展会发起人 ReedPop 周四晚些时候宣布，计划中的 6 月活动“没有从主要出版商和潜在与会者那里获得必要的持续兴趣”，以证明大规模会议的合理性。这本来该是自 2019 年后第一次现场的 E3 大展。但所有三个主要的游戏机制造商已经确认他们不会参加，而主要的出版商育碧和世嘉最近也公开放弃了这个展会。

消息来源：Ars Technica

老王点评：真是见证了一个时代的落幕，而三年的大流行只是加速了这个过程。

硬核观察 #957 Twitter 要求 GitHub 披露其源代码上传者的身份

硬核老王发布于 2023-04-01
另请参阅: 硬核观察,AI, Twitter, npm
评论

Twitter 要求 GitHub 披露其源代码上传者的身份

Twitter 上周披露它的部分源代码被人在今年初上传到 GitHub，当时 Twitter 刚刚被收购并解雇了数千名员工。上周五 GitHub 在 Twitter 的要求下删除了该仓库。本周二，法庭应 Twitter 要求 GitHub 在 4 月 3 日前提供上传者所有的身份信息，包括姓名、地址、电话号码、电邮地址、社交媒体资料和 IP 地址。此外，还要求提供下载和修改该代码仓库数据的用户信息。

消息来源：Ars Technica

老王点评：这有点过分了啊。

开源聊天机器人在质量评估上能达到 ChatGPT 的九成

开源聊天机器人 Vicuna-13B 基于 Meta 的大语言模型 LLaMA，它使用了用户通过 ShareGPT 分享的 7 万对话样本进行微调。研究人员让 OpenAI 的 GPT-4 作为裁判，去对比 Vicuna-13B 以及 ChatGPT 和谷歌 Bard，结果显示它在质量评估中能达到 ChatGPT 的 92%，而 Bard 为 93%，LLaMA 为 68%。Vicuna-13B 的训练成本只花了 300 美元。研究人员还计划释出其模型权重。

消息来源：Vicuna

老王点评：这说明并一定非得用海量的参数、巨额的训练费用，也可以取得可观的 AI 效果。所以，AI 也会有类似的“摩尔定律”，会随着时间迅速降低 AI 成本和提高 AI 效果。

超过一半的新 NPM 包是 SEO 垃圾包

目前提交给 NPM 的所有新包中，有一半以上是 SEO 垃圾。这是一种空包，只有一个包含各种恶意网站链接的 README 文件。在过去一周 Sandworm 扫描的 32 万个新的 NPM 包或版本中，至少有 18 万个被标记为 SEO 垃圾。检测到的大多数垃圾包都来自一个俄语的 Telegram 频道。

消息来源：Sandworm

老王点评：为什么 NPM 没有发现并做成反应？

号称可以成为 ChatGPT 平替的开源模型 “Dolly”

Sourav Rudra 发布于 2023-03-31
另请参阅: 新闻,AI, ChatGPT
1 条评论

你需要一款 ChatGPT 的平替？还得是开源的？看起来我们已经被卷入了与 ChatGPT 的开源大战。

open source model dolly

Databricks 这家软件公司，在各个领域都有所建树，尤其是在数据仓库和基于人工智能的解决方案方面。

最近，随着 ChatGPT 横空出世，Meta、谷歌甚至 Mozilla 都开始效仿 ChatGPT。

而现在，Databricks 开源了其大型语言模型 large language model （LLM）“Dolly”，也正在以自己的方式进行尝试。

我们一起来看看它。

发生了什么？ 在最近的公告中，Databricks 介绍了他们号称 “廉价构建” 的 LLM，使用 EleutherAI 的已经开源的参数模型提供功能。

他们在该模型基础上稍作调整，赋予了 Dolly 指令诸如头脑风暴和文本生成的能力。

当你拿它与 GPT-3 中的 1750 亿个参数 比较时，Dolly 的 60 亿个参数 就可能显得微不足道。

但是，当 Databricks 的人看到即使数据量与 GPT-3 相差这么多，Dolly 也能 展示很多与 ChatGPT 相同的能力 时，他们感到非常震惊。

下面是他们展示的其中一个例子：

a screenshot of how dolly performs in an open question and answer scenario

原始模型使用了 Alpaca 的数据，该模型由斯坦福大学以 Meta 的 LLaMA LLM 为基础建立。

但是，正如你所看到的，原始模型产生了一个非常杂乱无章的结果，而 Dolly，通过不同的模型和调整，能够产生一个更为可用的答案。

? 有趣的事实：“ 多莉 Dolly ” 名字取自世界上第一只克隆羊。

为什么是现在？ 根据 Databricks 的说法，他们认为 **许多公司更愿意建立自己的模型，**而不是将数据发送给某个紧紧掌握模型只对外提供 API 的集中式供应商。

许多公司可能不愿意将他们最敏感的数据交给第三方，然后在模型质量、成本和所需行为方面进行各种权衡。

你想看看吗？

当然，但有一个问题。

你必须 使用他们的平台来使用 Dolly，他们已经开源了一个 Databricks 笔记本，可以帮助你在 Databricks 上构建它。

此外，如果你想获得训练好的权重，你必须联系他们。不过我不确定他们是否会免费提供使用权。

总而言之，这种开源其模型的举动应该对其他公司有好处，可以保护他们的数据、节省运营成本，其他公司也能使用它创建自己的模型。

你可以查看其公告博客，以了解更多技术细节和其他计划。

via: https://news.itsfoss.com/open-source-model-dolly/

作者：Sourav Rudra 选题：lkxed 译者：lxbwolf 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

硬核观察 #955 马斯克等人呼吁暂停训练更强大的 AI

硬核老王发布于 2023-03-30
另请参阅: 硬核观察,DDoS, AI, 英伟达
1 条评论

马斯克等人呼吁暂停训练更强大的 AI

埃隆·马斯克和一群人工智能专家、行业高管在一封公开信中说，他们呼吁至少在六个月内暂停训练比 OpenAI 的 GPT-4 更强大的系统，并呼吁政府介入。其理由是对社会和人类的潜在风险。这份公开信有 1000 多人签名，除了马斯克，还包括 DeepMind 的研究人员、开发稳定扩散 AIGC 的公司 CEO 等等。他们认为需要先制定、实施并由独立专家审核的共享安全协议。OpenAI 没有参与签名，也没有置评。

今天还有一则消息称，马斯克离开 OpenAI 是由于夺权失败。马斯克曾承诺赞助 10 亿美元给 OpenAI，但赞助 1 亿美元后离开了 OpenAI 就没有继续赞助。

消息来源：路透社

老王点评：签署这封信的人可能大多出于公义，但是 AI 这个魔盒打开，恐怕是难以这样轻易关上的。

英伟达表示加密货币没有给社会带来任何有用的东西

英伟达的显卡曾经被大量用来挖掘以太坊之类的加密货币，由于被大量抢购，英伟达一度限制过其显卡的挖矿能力。英伟达也曾推出挖矿专用的显卡，并从中获利甚丰。但随着以太坊转向 POS 共识，不再需要显卡来挖矿，这一市场几乎马上消失了。如今该公司的 CTO 称，加密货币没有 “给社会带来任何有用的东西。……处理能力的其他用途，如人工智能聊天机器人 ChatGPT，比挖掘加密货币更有价值。”第一个版本的 ChatGPT 是在一台由大约 10,000 块英伟达显卡组成的超级计算机上训练的。

消息来源：《卫报》

老王点评：这翻脸可真快啊。

英国设置假的 DDoS 雇佣网站以扰乱市场

英国国家犯罪署建立了虚假的 DDoS 雇佣网站，试图收集用户的信息，提醒他们发动 DDoS 攻击是非法的。这些看起来像提供了使网络罪犯能够实施这些攻击的工具和服务的虚假网站，迄今已有数千人访问过。然而，在用户注册后，在英国的用户将被国家犯罪署或警方联系，并被警告参与网络犯罪。与设在海外的用户有关的信息将被传递给国际执法部门。

消息来源：Krebson Security

老王点评：这让那些想要攻击别人的人自投罗网。

硬核观察 #954 Zoom 的新 AI 功能能替你参加会议

硬核老王发布于 2023-03-29
另请参阅: 硬核观察,ARM, AI, 恶意应用
1 条评论

Zoom 的新 AI 功能能替你参加会议

Zoom 正在与 OpenAI 合作，通过其 Zoom IQ 人工智能助手为视频会议应用带来人工智能生成的摘要、信息草稿等。不但如此，Zoom IQ 还可以替你参加你迟到的会议，帮你总结你错过的内容，生成会议提要，并提出进一步的问题，以及生成对同事的回应。

消息来源：ZOOM

老王点评：咱就是猜啊，会不会以后线上会议室里面开会的都是 AI？

又一家安全机构确认某应用的非谷歌商店版本包含恶意代码

本月早些时候，独立安全研究机构 DarkNavy 发表文章披露，中国某个移动应用利用了安卓系统的零日漏洞提权使其难以卸载。上周，谷歌将该公司的多个应用标记为恶意程序并下架。被指的公司发表声明反对对其应用的恶意推测和指控。现在，又一家安全公司 Lookout 对该应用的两个非谷歌商店版本进行了分析，确认了 DarkNavy 的指控。被利用的漏洞是谷歌在 3 月 6 日公开并修复的，利用该漏洞可以提权，而且整个过程不需要用户交互。目前没有证据表明该应用的谷歌商店和苹果应用商店版本含有恶意代码，但通过第三方市场下载的则不能保证。

消息来源：Ars Technica

老王点评：我就呵呵了。

ARM 想要改变芯片授权模式来增加收入

ARM 目前主要依赖于芯片授权协议，每季度的收入在 5 亿美元左右。为了提高收入，ARM 据称准备彻底改变芯片授权模式，以大幅增加授权费用。ARM 考虑停止向芯片制造商收取授权费用，而是转而向设备制造商收费，其费用将基于产品的总价。ARM 计划在 2024 年推动新的模式，据称手机厂商对此持抵制态度。此举可能推动手机厂商拥抱免授权费的开放架构 RISC-V。

消息来源：Ars Technica

老王点评：感谢老铁给 RISC-V 刷的火箭！

硬核观察 #953 比尔·盖茨称人工智能是他见过的唯二的革命性技术

硬核老王发布于 2023-03-28
另请参阅: 硬核观察,x.org, AI, DOOM
评论

比尔·盖茨称人工智能是他见过的唯二的革命性技术

比尔·盖茨称人工智能的发明 “与微处理器、个人电脑、互联网和移动电话的创造一样根本”，并在一篇题为《人工智能时代已经开始》的文章中预测 “整个行业将围绕它重新定位”。他称，他一生中只见过两次革命性的技术展示，一次是 1980 的图形化用户界面，这导致了后来的 Windows 的诞生；另外一次就是去年兴起的人工智能爆发。在他的要求下，OpenAI 训练的 GPT 仅仅用了几个月就以最高分 5 分通过了 AP 生物测试。

消息来源：盖茨笔记

老王点评：这篇文章中，盖茨还提出很多预测，我认为比一些其他互联网大佬的瞎说要可靠得多。

DoomLinux：一个只用来玩 DOOM 的 Linux

有些 Linux 发行版是主要用于某些用途的，但还有一些只能用于某个用途，如一位爱好者开发的 DoomLinux 就只能运行 1993 年的经典游戏《毁灭战士 DOOM 》。它通过 BusyBox 加载 Linux 内核和标准实用程序，然后运行 fbDOOM，这是一个专门为在 Linux 帧缓冲器上运行而设计的移植版。整个发行版被放在一个可启动的 ISO 文件中，可以放在任何可启动的驱动器上。

消息来源：Hack A Day

老王点评：无用的乐趣，才是有趣的。

由于人数不足，X.org 推迟董事会选举

有些年份，他们只有 4 名候选人竞选 4 个空缺席位，而另外一些年份，他们几乎没有达到投票者参与的 25% 的法定人数。今年的 X.Org 董事会选举被推迟了两周，希望一些有能力的人提名自己参加选举，并能够承诺在董事会任职。

消息来源：Phoronix

老王点评：每每看到 X.org 的消息，都给人一种英雄迟暮的感觉。