标签 AI 下的文章

DeepMind 用游戏的方式打破了矩阵相乘 50 年来的记录

矩阵乘法问题是一种关键的计算类型,它是许多不同应用的核心,从屏幕上显示图像到模拟复杂的物理学。加快这种计算可能会对成千上万的日常计算机任务产生重大影响。但想优化矩阵相乘的步骤很难。DeepMind 将该问题变成一种三维棋盘游戏 TensorGame。训练了一个新版本的 AlphaZero,称为 AlphaTensor,来玩这个游戏,以尽可能少的动作赢得游戏。AlphaTensor 发现了一种将两个四乘四的矩阵相乘的方法,只需要 47 步,基本的高中数学方法需要 64 步,而之前的最佳方法是德国数学家在 1969 年发明的 49 步的方法。此外,“AlphaTensor 在超过 70 种不同大小的矩阵中击败了现有的最佳算法。”

消息来源:Technology Review
老王点评:没想到 AI 居然可以在数学上找到更好的算法,果然人力有时而穷。此外,对矩阵相乘的改进,应该会从底层提升很多你想不到的地方的性能。

英特尔推动 GPU 通用编程库 SYCL 的发展

如今在加速计算和 GPU 领域,CUDA 只能在英伟达的 GPU 上运行,AMD 的 CUDA 可以在 AMD 的 GPU 上运行,但你不能用 CUDA 为英特尔的 GPU 编程。因此,英特尔推动开源 SYCL 规范的发展,该规范旨在为 GPU 和加速计算做几十年前 Java 为应用开发所做的工作。SYCL 是一种用 C++ 语言进行数据并行编程的方法,它看起来很像 CUDA,可以在英特尔、AMD 和英伟达的 GPU 上运行,而无需改变你的代码。

消息来源:Venture Beat
老王点评:这就是一个英特尔的 CUDA,但是以开放的名义。

SELinux 继续废弃运行时禁用功能

SELinux 已经废弃了运行时禁用功能,即通过编辑配置文件或 sys 文件系统来即时禁用它。但相关的代码和功能尚未从内核中删除,Linux 6.1 仍然具有处理 SELinux 运行时禁用的废弃能力。在最新的 Linux 6.1 的合并请求中,SELinux 删除了对该能力的一个文档参考,向废弃该能力小小的迈了一步,其它的部分几乎没有什么大的变化。一种简单和非侵入性的正确禁用 SELINUX 的方法是,在启动 Linux 时可以将 selinux=0 作为一个内核参数传递进去。

消息来源:Phoronix
老王点评:抛开 SELinux 的 NSA 背景不谈,SELinux 其实安全但繁琐,所以运行时禁用 SELinux 往往成为了一种偷懒行为或安全缺陷。

使用 AI 和激光炮塔击杀蟑螂的开源项目

研究人员使用四核 ARM 处理器的 Jetson Nano 小型计算机来处理来自两个相机的数字信号,并使用神经网络来确定目标昆虫在三维空间中的位置。然后驱动来自中国的激光器来瞄准蟑螂。当激光功率较低时,可以驱赶蟑螂,功率更高时可以甚至可以直接杀死蟑螂。此项目已全部在 GitHub 上开源,作者此前还尝试用同样的手段消灭蚊子。

消息来源:VICE
老王点评:这算不算 AI “武器化”?

基于 Linux 的 Steam Deck 掌机出货量逾一百万部

Valve 的 Linux 掌机 Steam Deck 于今年 2 月 25 日上市,采用预售制,玩家需要先支付 5 美元预定一个版本。据 KDE 开发者在最近举行的 Akademy 2022 会议上透露的消息,Steam Deck 掌机出货量已逾一百万部。Steam Deck 包含了一个完整的 KDE Plasma 桌面模式。

消息来源:Gaming On Linux
老王点评:这相当于拉高了 Linux 的桌面终端占有率啊。

美国白宫提出围绕 AI 的自愿安全和透明规则

白宫周二提出了一项不具约束力的《人工智能权利法案》,称其将帮助父母、病人和工人避免因教育、医疗和就业领域越来越多地使用自动化而受到伤害。人工智能软件的开发者和使用者应该自愿遵守,以防止该技术不公平地对人们造成不利。但该法案对私营企业没有约束力,美国商会警告说,如果这些不具约束力的建议成为规则,可能会损害美国企业在全球舞台上的竞争能力。近些年屡屡出现算法失控的例子,如一些算法被发现具有歧视性,这是由于系统训练所依据的数据。

消息来源:路透社
老王点评:人工智能该不该约束?应该。但是以什么样的方式,约束到什么程度,恐怕上面美国商会的意见才是真的意图。

复古极客给 SSD 添加机械硬盘读写声音

复古计算的一个 “问题” 是,我们用紧凑型闪存、SD 卡甚至 SSD 来取代这些传统的机械硬盘时,通常情况下不会发出任何你能听到的声音。这样不但显得不够“复古”,而且有时你无法判断电脑是崩溃了还是仍在工作。有位极客制造的一个小装置解决了这个问题,它被称为 HDD Clicker,它连接到硬盘活动指示灯,触发扬声器发出的一系列咔嚓声,听起来非常像硬盘在寻找轨道。

消息来源:Hackday
老王点评:我觉得我的 SSD 硬盘也需要这样一个小装置,要是能像个 U 盘一样插上就能用就更好了。这就是“无用”的极客精神。

黑爵士达斯·维德的声音未来将用 AI 合成

为星战系列的黑爵士达斯·维德的配音长达 45 年的 James Jones 已经 91 岁了。他早就考虑退出了,在创作星战电视剧《欧比旺·克诺比》期间,James Jones 签署了允许迪士尼在未来项目中使用 AI 合成其声音的协议。他们使用的软件是 AI 语音建模工具 Respeecher,它使用了深度学习去建模和复制人类声音,能达到以假乱真。在此之前卢卡斯公司使用该软件在《曼达洛人》中克隆了天行者卢克的扮演者的声音。

消息来源:Ars Technica
老王点评:从配音演员、有声书朗读演员开始,AI 真的会接管很多工作。

Cloudflare 宣布了一个新的“验证码”服务

Cloudflare 本周宣布了一个名为 Turnstile 的项目,旨在取消整个网络上用来验证人们是否机器人的传统验证码。它会根据遥测和会话中表现出的客户行为自动选择浏览器挑战方案,以检查网页的访问者是否实际上是机器人。廉价劳动力的兴起、各种验证码类型的错误以及自动解算器让验证码越来越容易绕过。一些研究人员声称基于 AI 的攻击可以成功解决世界上最受欢迎的网站使用的验证码。

消息来源:Tech Crunch
老王点评:终究还是一种高级的验证码。

回音

  • 谷歌 推迟 MV2 扩展淘汰时间,明年 1 月起停止接受 MV2 扩展更新,这些扩展将从明年 6 月开始不再列出。

AI 生成的漫画获得版权注册

Midjourney 是一个商业的图片合成服务。一位艺术家使用 Midjourney 创造了一本名为《黎明的扎丽亚》的漫画书,已经获得了美国版权注册。该作品是 AI 辅助的,而不是完全由 AI 创造的。艺术家编写了漫画故事,创造了版面,并做出了艺术选择,将图像拼接在一起。这本漫画书可以免费下载。

消息来源:ARS Technica
老王点评:即便 AI 还不能独立完成创作,也不能以 AI 身份取得版权和专利,但是 AI 辅助创作必然会越来越用在各种艺术创作中,而且可能会毫不逊色。很可能,以后你创作时,只是提供一些素材、提示词,然后去喝杯咖啡,等着从 AI 生成的结果中挑选一二。

黑客利用 BGP 劫持 IP 段窃取了约 23 万美元加密货币

8 月 17 日,英国一家不知名的网络运营商 Quickhost.uk 突然通过 BGP 广播宣布,隶属于亚马逊 AS16509 的一个 IP 段需要路由经过它的网络 AS20943。该 IP 段中的一个地址被用于托管加密货币交易所 Celer Bridge 的一个子域名。并且,攻击者还从某不知名的 CA 获得了一个 TLS 证书,然后托管了伪造的子域名网站,随后从访问该域名的 32 个账号中窃取了约 23 万美元的加密货币。这一 BGP 劫持持续了 3 个多小时后,亚马逊恢复了对该地址段的控制。

消息来源:ARS Technica
老王点评:无论是错误配置还是恶意欺诈,BGP 的脆弱性显露无疑。虽然也有一些补救措施,但是并没有根本上解决 BGP 安全问题,这是一个全行业的问题。

GNOME 43 发布

前两天,GNOME 43 发布了正式版本。它引入了一个重新设计的快速系统设置区域,一个新的 “设备安全” 管理区域,GNOME 文件管理器的各种改进,增强了 Mutter 合成器以更好地支持 Wayland,更多的应用程序已经从 GTK3 移植到 GTK4,以及整个桌面栈的许多其他变化。

消息来源:GNOME
老王点评:GNOME 和 KDE 作为 Linux 上最主要的两大桌面环境,虽然给人的感觉不是惊艳,但是却稳健的不断在改进。

史上最贵开发的游戏《星际公民》已筹集五亿美元

星际公民 Star Citizen 》游戏开发了十年,至今仍处于 Alpha 阶段,虽然现在也可以进行游戏了。它筹集的资金突破了五亿美元,是至今为止开发费用 最昂贵的游戏,远超其它开放世界 3A 游戏,如《赛博朋克 2077》等。它于 2012 年在 Kickstarter 上成功众筹,原计划 2014 年交付。但众筹结束后,该游戏以开发并销售游戏内虚拟物品的名义继续募资。2018 年它筹集到 2 亿美元,如今已突破 5 亿美元,

消息来源:RSI
老王点评:这莫非是一种“滚动式开发”的游戏?不过我看了图都觉得不错,有没有玩过的朋友来说说这游戏怎么样,值吗?

图片网站禁止上传 AI 生成的图像

过去几个月,自然语言图像生成模型如 DALL-E 产生了一批令人称奇的艺术图像,部分艺术家随后将这类 AI 图像上传到图像销售网站销售。但由于 AI 图像是在现有图像的基础上生成的,一些图片网站称,出于版权方面的担忧禁止了此类内容。Getty 图片社是最新一个做出类似决定的平台,而 Shutterstock 尚未禁止此类内容,但限制了对 AI 图像的搜索。

消息来源:Solidot
老王点评:我觉得更大的原因是,这类 AI 图片可能会断了这些图片销售网站的根吧。以后大家都用 AI 来生成,谁还买图片。这种阻挡只是螳臂当车,AI 图片肯定会迅速流行开。

微软将 systemd 引入 WSL

通过与 Canonical 深度合作,微软今日宣布了 Windows 中的 Linux 子系统 WSL2 的一项功能更新,它现可在兼容的 Linux 发行版(如 Ubuntu)中运行 systemd 来管理服务。为此,WSL2 做了若干重要修改,更改了 WSL 在启动时的行为方式,因此微软建议谨慎地将之应用于现有的 WSL 发行版。

消息来源:微软
老王点评:一直以来 systemd 没有进入 WSL,可以说既不意外,也有点意外。

人工智能(AI)和机器学习(ML)正在影响当今几乎每个行业。本文重点介绍了这些技术在我们日常生活中的各种使用方式,以及一些开源云平台如何实现其部署。

人工智能 artificial intelligence (AI)的目标是构建能够模仿人类认知的机器和自动化系统。在全球范围内, AI 正在以各种方式改变着社会、政治和经济。 AI 应用的例子包括 谷歌帮助 Google Help 、Siri、Alexa 和特斯拉等自动驾驶汽车。

如今, AI 正被广泛使用,以有效的方式解决各行各业的难题。它被用于医疗保健行业,以做出比人类更准确、更快速的诊断。医生可以使用 AI 来诊断疾病,并在患者病情恶化时得到提醒。

数据安全对每个企业都至关重要,网络攻击的数量也在不断增加。使用 AI ,可以提高数据的安全性。这方面的一个例子是集成智能机器人来识别软件错误和网络攻击。

Twitter、WhatsApp、Facebook 和 Snapchat 只是使用 AI 算法存储和管理数十亿个人资料的社交媒体平台中的一小部分。 AI 可以整理和筛选大量数据,以找到最新趋势、标签和各种各样人的需求。

Figure 1: Key applications of machine learning

旅游业越来越依赖 AI ,因为后者可以帮助完成各种与旅行相关的任务,包括为消费者预订酒店、航班和最佳路线。为了提供更好、更快的客户服务,由 AI 驱动的聊天机器人正被用于旅游业。

工具/平台链接
Streamlithttps://github.com/streamlit/streamlit
TensorFlowhttps://www.tensorflow.org/
PyTorchhttps://pytorch.org/
scikit-learnhttps://scikit-learn.org/
Apache Sparkhttps://spark.apache.org/
Torchhttp://torch.ch/
Hugging Facehttps://huggingface.co/
Kerashttps://keras.io/
TensorFlowJShttps://www.tensorflow.org/js
KNIMEhttps://www.knime.com/
Apache Mahouthttps://mahout.apache.org/
Accordhttp://accord-framework.net/
Shogunhttp://shogun-toolbox.org/
RapidMinerhttps://rapidminer.com/
Blockshttps://github.com/mila-iqia/blocks
TuriCreatehttps://github.com/apple/turicreate
Dopaminehttps://github.com/google/dopamine
FlairNLPhttps://github.com/flairNLP/flair

表 1: ML 的工具和框架

不同领域的机器学习

让软件应用程序和小工具自行响应和发展的所有技术和工具都称为 机器学习 machine learning (ML)。多亏了 ML 技术, AI 可以在没有真正被明确编程来执行所需操作的情况下进行学习。ML 算法不依赖于预定义的计算机指令,而是从样本输入中学习一个模式,然后完全基于学习到的模式来预测和执行任务。如果没有严格的算法可供选择, ML 可以成为救命稻草。它将通过分析以前的处理方式来选择新处理方式,然后将其付诸实施。ML 为各种行业的技术进步和以前无法想象的技术扫清了道路。如今,它被用于各种尖端技术 — 从预测算法到互联网电视直播。

一个值得注意的 ML 和 AI 技术是图像识别,它是一种对数字图像中的特征或项进行分类和检测的方法。分类和人脸识别是使用这种方法完成的。

Figure 2: Streamlit cloud for machine learning

将 ML 用于推荐系统是其最广泛使用和知名的应用之一。在当今的电子商务世界中,产品推荐是一种利用强大的 ML 技术的代表性工具。网站使用 AI 和 ML 来跟踪过去的购买、搜索趋势和购物车历史,然后根据这些数据生成产品推荐。

在医疗保健行业中使用 ML 算法引起了很多兴趣。通过使用 ML 算法,可以跨多个医院部门预测急诊室等待时间。员工轮班的详细信息、患者数据以及科室讨论和急诊室布局的记录都用于帮助创建算法。 ML 算法可用于检测疾病、计划治疗和预测。

用于 ML 的云平台的主要特点

  • 算法或特征提取
  • 关联规则挖掘
  • 基于大数据的预测分析
  • 分类、回归和聚类
  • 数据加载和转换
  • 数据准备、数据预处理和可视化
  • 降维
  • 分布式线性代数
  • 假设检验和核方法
  • 处理图像、音频、信号和视觉数据集
  • 模型选择和优化模块
  • 预处理和数据流编程
  • 推荐系统
  • 通过插件支持文本挖掘和图像挖掘
  • 可视化和绘图

基于云的 AI 和 ML 应用程序部署

AI 和 ML 的应用可以部署在云平台上。如今,许多云服务提供商使程序员能够构建模型以在其领域内进行有效的决策。

这些基于云的平台与预先训练的 ML 和 深度学习 deep learning (DL)模型集成在一起,无需任何编码或用少量的脚本即可在这些模型上部署应用程序。

Figure 3: Categories of ML deployments in Streamlit

Streamlit

Streamlit 让数据科学家和 ML 专家能够访问各种 ML 模型。它是开源的并且与云部署兼容。ML 模型可以在几分钟内准备好与数据集一起使用

Streamlit 提供一系列 ML 模型和多个类别的源代码,包括自然语言处理、地理、教育、计算机视觉等。

Figure 4: Hugging Face for machine learning

Hugging Face

这是另一个平台,为各种类别的 ML 和 AI 提供预先训练的模型和架构。许多企业巨头都在使用这个平台,包括 Facebook AI、微软、谷歌 AI、亚马逊网络服务和 Grammarly。

Hugging Face 中提供了许多预训练和部署就绪的模型,用于不同的应用程序,包括自然语言处理和计算机视觉。

使用 Hugging Face 中的 ML 模型可以执行以下任务:

  • 音频到音频处理
  • 自动语音识别
  • 计算机视觉
  • 填充蒙版
  • 图像分类
  • 图像分割
  • 物体检测
  • 问题应答
  • 句子相似度
  • 总结
  • 文本分类
  • 文本生成
  • 文本到语音翻译
  • 令牌分类
  • 翻译分类

Hugging Face 中可用的问题解决器经过优化且有效,有助于快速部署模型(图 5)。

Figure 5: Problem solvers and models in Hugging Face

这些基于云的平台对多个领域的研究人员、从业者和数据科学家非常有用,并简化了性能良好的实际应用程序的开发。


via: https://www.opensourceforu.com/2022/09/platforms-that-help-deploy-ai-and-ml-applications-on-the-cloud/

作者:Dr Kumar Gaurav 选题:lkxed 译者:Misite Bao 校对:wxy

本文由 LCTT 原创编译,Linux 中国 荣誉推出