标签 AI 下的文章

Alexa.com 将在明年关闭

Alexa.com 是一家提供超过 3000 万个网站的网络流量数据、全球排名和其他信息的网站。现在,他们宣布,“二十五年前,我们创立了 Alexa。在帮助你寻找、接触和转换你的数字受众的二十年后,我们做出了一个艰难的决定,即在 2022 年 5 月 1 日关闭 Alexa.com。”在公告中,他们没有解释关闭的原因,即日起停止提供新的订阅,但现有的订阅在关闭前还能继续访问。

老王点评:虽然没说为什么,但是我觉得可能是找不到盈利来源,不足以支撑下去吧。还是很可惜。

研究发现,更大的 AI 模型能带来更好的效果

在人工智能领域,一般来说,越大越好,更大的模型通常提供更高的性能。DeepMind 的研究证实了这一趋势,并表明扩大“大语言模型(LLM)”的规模确实在测试情感分析和总结等最常见的基准上提供了 更好的性能。DeepMind 建立了一个拥有 2800 亿个参数的语言模型,名为 Gopher,来探究这种 LLM 的能力。Gopher 比 OpenAI 拥有 1750 亿个参数的 GPT-3 大,但不如一些更具实验性的系统,如微软和 Nvidia 的拥有 5300 亿个参数的 Megatron 模型大。

老王点评:这才是“大”数据,目前从 DeepMind 的结论来看,还不知道这个规模的上限是哪里。

上诉期间,开发者们还得继续使用苹果公司的支付渠道

之前苹果公司和 Epic 的诉讼案中,虽然苹果公司取得了大多数胜利,但是被地区法院法官裁定需要开放其支付限制,允许开发者将用户引导至苹果商店之外进行支付,而不用必须使用苹果商店的应用内购买的方式,也就是可以避免“苹果税”。原本苹果公司需要在 12/9 前执行该裁决,但是苹果对此提出了上诉,并得到了美国第九巡回上诉法院的支持,因此在其上诉期间 不必修改其支付政策

老王点评:看来这件事有可能变成旷日持久的诉讼战。

微软在利用 DNA 作为数据存储的探索中取得了突破

微软与华盛顿大学的分子信息系统实验室在 DNA 存储方面进行合作研究,发表的一篇新的研究论文 宣布 了第一个纳米级 DNA 存储写入器,可达到每平方厘米 25 * 10^6 个序列的 DNA 写入密度,比之前提高了三个数量级。这一点特别重要的是,它是实现 DNA 存储所需最低写入速度的第一个突破迹象。找到提高写入速度的方法可以解决 DNA 存储的两个主要问题之一(另一个是成本)。

据称,DNA 的密度能够在每平方英寸内存储 1 EB(即 10 亿 GB)。据 IDC 预测,到 2024 年,全球数据存储需求将达到 9 ZB(即 1 万 EB),如果使用 DNA 来存储,只需要一个冰箱大小的空间。而且使用 DNA 可以存储数千年,而磁带只能存储几十年。

老王点评:技术的突破只能感慨一句,日新月异。

DeepMind 的 AI 帮助发现新猜想和定理

从 1960 年代开始,数学家开始使用计算机帮助发现规律和提出猜想,但还没有使用 AI 技术。DeepMind 和数学家们一起建立了一个 机器学习框架,用于协助数学研究。他们的算法搜索数学对象间潜在的规律和联系,尝试寻找意义。其后由数学家接手,利用这些观察来引导他们对潜在猜想的直觉。他们将机器学习框架这一方法应用于两个纯数学领域,发现了拓扑学的一个新定理,以及一个代数表示论的新猜想。

老王点评:或许将来 AI 能独立发现并证明新的定理了。

“笑哭?” 是 2021 年使用最多的表情符

Unicode 联盟统计发现“笑哭?”表情符号占所有表情符号使用量的 5% 以上,其次是“红色爱心❤️”表情符号。不过在过去几年里,最受欢迎 的表情符号没有什么变化。如果按类别细分表情符号,那么派对烟花?是最受欢迎的活动表情符号,火?是最受欢迎的天气表情符号,而最受欢迎的植物表情符号是玫瑰?。蝴蝶?是使用最多的昆虫表情符号,而兔脸?是使用最多的哺乳动物表情符号。在服装表情符号中,皇冠?是最受欢迎的,而生日蛋糕?是迄今为止最受欢迎的甜食表情符号。热饮☕️是最受欢迎的饮料表情符号,而在水果类别中,草莓?占据了首位。

老王点评:如果说早期的字符表情 :> 代表了人们在文字中表达感情的需求,而表情符更是将这一需求表达的淋漓尽致。而我最喜欢用这个斜着的笑哭?。

一句话回音

  • 为了避免被 诉讼,美国前总统特朗普的社交媒体网站正在 悄悄承认 为该平台提供动力的计算机代码来自 Mastodon,但还没有按照许可证公开其修改后的代码。

攻击者不愿费力暴力破解长密码

根据微软蜜罐服务器网络收集的数据,大多数暴力破解攻击者主要 尝试猜测短密码,很少攻击针对长的或包含复杂字符的凭证。微软安全研究员表示:“我分析了微软传感器网络中约 30 天的数据,这包括超过一百万次针对 SSH 的暴力攻击输入的凭据。77% 的破解行为使用的是长度在 1 至 7 个字符之间的密码。长度超过 10 个字符的密码尝试只占 6%。”

老王点评:看,你只需要使用一个比较长的密码就可以了,换句话说,你只要“比其他人跑得快,狗熊就追不上你”。

央视新闻 AI 手语主播亮相

11 月 24 日,据 央视新闻官微消息,今日,央视新闻联合百度智能云打造的首个 AI 手语主播正式亮相,将从 2022 北京冬奥会开始为听障人士提供全年无休服务。从视频来看,这位 AI 手语主播有着“真人般”的皮肤、头发、眼睛,形象亲切自然,气质优雅独特。据介绍,百度智能云采⽤语⾳识别、⾃然语⾔处理等⼈⼯智能技术,构建出⼀套复杂⽽精确的⼿语翻译引擎,实现了⽂字及⾳视频内容到⼿语的翻译。随后,通过专为⼿语优化的⾃然动作引擎,进⾏虚拟形象的驱动,将⼿语实时演绎为数字⼈的表情动作。

老王点评:AI 技术的正确打开方式,这比现在热捧的元宇宙有用多了。

苹果“播客”应用找到了迅速提升了评分的捷径

苹果默认安装的“播客”应用在一个多月内,在没有任何实际修复的情况下,从公开的 1.8 星得分一路上升到 4.6 星。而且它还在上升:该应用每天都有成千上万的评分,其中绝大多数都是 5 星。截至目前,该应用的总体评分已达到 4.7 星,并稳居苹果应用商店“播客”搜索结果的第一位。而做到这一切的做法是通过 应用内的提示 来中断听众的播客收听,让他们提交更好的评论和评分。可能很多喜欢苹果“播客”应用的人,从未费心在苹果商店中查找它并给出评分;但是另外一方面,一些积极的评论根本不是对苹果“播客”应用的评论,它们是对播客内容本身的评论。

老王点评:滥觞一开,我觉得各种浏览器、内容应用都可以效仿了。

哈希表理论突破提升数据存储效率

哈希表是最常用的组织和存储数据的方法之一。线性探测哈希表于 1954 年引入,是当今可用的最古老、最简单和最快的数据结构之一。在线性探测哈希表中,可存储信息的位置位于一个线性数组中。几乎每个使用线性探测哈希表的人都认为,如果你让它们变得太满,那么长长的、被占据的位置就会聚集在一起形成“集群”,结果找到一个空位所花费的时间会急剧增加。但是这个已有半个多世纪、一直不利于高负载率的原则已被 三名研究人员的工作 彻底颠覆。他们发现,对于插入和删除数量大体相等的应用程序,线性探测哈希表可以在不牺牲速度的情况下以高存储容量运行。

老王点评:果然只有数学理论的突破才能真正突破硬件的升级幅度。

英特尔发布了检测漏洞的 AI

英特尔上个月开源了 ControlFlag,今天 发布了 1.0。在该版本中,他们宣传说已经完全支持 C 语言编程,并特别针对 C 程序的 if 条件语句做了调整。ControlFlag 的方法是在 C/C++ 开源代码库中挖掘模式,然后在开发者的代码库中检测异常模式。他们在 6000 多个 GitHub 存储库的超过 10 亿行代码中进行了训练。英特尔表示,他们已经成功地在他们的软件中使用了它,包括应用程序和固件。

老王点评:以后看来不但写程序不用程序员,就连程序员的 bug 也不用程序员找了。

英特尔开发下一代固件平台

英特尔 发布通用可扩展固件(USF) 的规范草案。USF 建立在现有的行业标准上,如 UEFI 和 ACPI。USF 在 SoC、平台和操作系统之间引入了新的抽象和领域界限。USF 打算将其范围扩大到不仅仅是系统固件,还计划让英特尔的独立图形处理器使用。USF 的目的是“开放”,但英特尔承认它由外部行业规范和他们的内部规范组成。据估计,英特尔或将使 USF 成为一个完全开源的固件堆栈。

老王点评:虽然已经有了一些开源固件解决方案,但是如果 USF 能真正开源,那对开放硬件应该是一件好事。

Linux 发行版在性能测试中击败 Windows 11

Phoronix 本周进行了一些有趣的 性能测试。所有 44 项测试的几何平均值显示,在当前这一代英特尔平台上,Linux 明显领先于 Windows 11。在这个系统上,Ubuntu / Arch / Fedora 总体上比 Windows 11 Pro 快 11% 左右。Clear Linux 比 Windows 11 快约 18%,总体上比其他 Linux 发行版的性能高约 5%。Clear Linux 获得了 33 项的第一,Windows 11 Pro 获得 3 项第一。

老王点评:不出意料的结果,不过 Clear Linux 居然得到大部分的第一,值得关注。

NASA 希望人工帮助改善火星车的人工智能

NASA 呼吁任何有兴趣的人为其火星车的机器学习算法 做出贡献,以帮助毅力号火星车四处游走。你所需要做的就是看一些图片并标记地质特征。毅力号有增强的人工智能,以帮助它避开障碍物。它有 23 个摄像头,可以从火星上捕捉到大量的视觉数据,但它必须依靠人类操作员来解释其中大部分图像,从而改善其人工智能水平。

老王点评:所谓人工智能还是需要“人工”才能智能。

Hive 勒索软件已经准备加密 Linux 和 FreeBSD

Hive 勒索软件团伙自 2021 年6月以来袭击了 30 多个组织,现在针对 Linux 和 FreeBSD 开发了 新的恶意软件变种 来加密这些系统。不过,ESET 发现,Hive 的新加密器尚在开发中,仍缺乏功能,并且存在一些 bug。相比之下,Hive 的 Windows 勒索软件具有更多功能。

老王点评:Linux 和 FreeBSD 管理员们需要注意了,它们并不具有先天的高安全性。

微信允许搜索引擎索引公众号内容了?不,是 bug

一直以来,微信公众号的内容是不允许外部搜索引擎的爬取和索引的。而据 路透社报道,微信公众号上的内容和视频已经向外部搜索引擎开放。但是,这实际上是个 bug,是腾讯意外删除了微信域名下的 robots.txt。这个文件是一个指导搜索引擎可索引范围的行业默认规则。现在该文件 已经恢复 禁止外部搜索引擎爬取的状态。

老王点评:看,这才是信息孤岛,开放是要允许出去,也允许进来。

交通摄像头将 T 恤上的字母识别为汽车

英国《每日邮报》报道称,萨里郡的一名男子最近收到一张 90 英镑罚单:理由是他在 120 英里外的巴斯市驾车驶入了公交车道。因为没有做过这样的事,他仔细查看了打印在罚单上的照片证据。他惊讶地发现,照片上是一个正在走路的女人。因为她的 T 恤前襟有 KNITTER 的字样。被识别为车牌 KN19TER。

老王点评:真不靠谱的 AI,问题是,谁来给 AI 把关呢?

树莓派史上首次涨价

去年 2 月,树莓派 4 2GB 版的价格从 45 美元“永久”降至 35 美元,1GB 型号的产品则停产。但由于全球供应链的短缺,树莓派贸易公司宣布 2GB 版的树莓派重新回到 45 美元,而 1GB 版则以之前的 35 美元价格重新回来了。该公司表示涨价只是暂时的,他们今年只能设法达成 2020 年约 700 万台的出货量。主要短缺的是树莓派 Zero 和树莓派 4 2GB。

老王点评:全球供应链紧张可见一斑。