标签 AI 下的文章

Audacity 现在配备了新的 AI 工具。

在过去的几年中,我们已经看到了 AI 的显著发展,包括将 AI 驱动的功能添加到各种流行的工具中。而且,我们在 2024 年 Linux 和开源预测 中已经提到了更多的人工智能。

这次是 Audacity,Linux 的最佳音频编辑之一,迎来了 AI。现在,用户可以通过利用 AI 的力量来增强其音频编辑体验。

让我们来看看这些迷人的功能都有哪些。

英特尔打造 AI 工具 ?️

英特尔公司推出了由 AI 驱动的处理语音音频和音乐的新功能。

这些功能是 OpenVino 插件套件的一部分。对于那些不知道的人来说,英特尔的 OpenVino 是一个 AI 框架,有助于加速深度学习模型。

值得注意的一个很酷但也很重要的方面是,所有这些功能在本地的 PC 上运行! 更具体地说,PC 的 CPU 或 GPU 将用于处理部分。

播客编辑

曾经想快速转录甚至翻译音频吗?

由 OpenAI 的 Whisper 支持的转录功能可以让用户做到这一点。

Transcription | Source: GitHub Intel

  • 它能根据给定的音频样本生成包含转录/翻译文本的新标签音轨。
  • 翻译将始终以英语产生输出,而转录将以与源音频相同的语言产生输出。
  • 目前,默认情况下仅支持 Whisper Base 模型。稍后可能会支持更多模型。

与现有的 “噪音去除”效果类似,“噪音抑制” 可帮助去除口语音频样本中不需要的背景噪音。

  • 由于它是由 AI 提供动力的,因此你可以期望此功能的效果优于噪音去除。
  • 目前,默认情况下仅支持 denseunet 模型。稍后可能会支持更多模型。

音乐生成

是的,你没看错:现在,你可以在机器内生成新音乐!

音乐生成 允许用户生成音乐片段。这要归功于一个名为 Riffusion 的开源项目,这是一个基于 Stable Diffusion 的音乐生成模型(一种流行的开源模型,用于生成图像。)

Music Generation | Source: GitHub Intel repo

  • 你通过给出文本提示并调整其他一些参数(例如持续时间)来生成音乐。
  • 在文本提示符中,你指定要生成的音乐流派,AI 将尽力在生成音乐时保持这种类型。
  • 你可以选择在默认的简单模式和可选的高级模式之间切换,以进行更多的控制,例如指定开始提示和结束提示。

此外,你甚至可以通过音乐风格混音,选择音乐曲目的一部分,对音乐进行混音!

音乐分离

如果你想为自己喜欢的歌曲创建自己的器乐曲目,该怎么办?也许还能与朋友来一场有趣的卡拉 OK 呢?

音乐分离使你可以将歌曲分为声音或乐器版本。提供了两种分离模式:

Music Separation. Source: github.com/intel/openvino-plugins-ai-audacity

  • 2-Stem 为人声和器乐制作两个新音轨。
  • 4-Stem 可生成四条新音轨,包括人声、鼓声、贝司声,最后一条是其他乐器声。

如何使用 AI 工具? ?

如果你是 Linux 用户,请等一等。

虽然该插件的 Windows 版本 可供下载,但其 Linux 对应版本暂时还不可用。

如果你仍然想尝试一下,则需要自己编译该项目。你可以参考此的官方说明

希望 Linux 构建很快到来!?

? 你觉得 Audacity 的这些新人工智能功能怎么样?请在评论中告诉我们你的想法!


via: https://news.itsfoss.com/audacity-ai-tools/

作者:Rishabh Moharir 选题:lujun9972 译者:geekpi 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

1 OpenAI 悄然删除禁止将 ChatGPT 用于 “军事和战争” 的禁令

在 1 月 10 日之前,OpenAI 的《使用政策》页面一直禁止“具有高身体伤害风险的活动”,包括 “武器开发” 及 “军事和战争”。而新政策保留了不得 “利用我们的服务伤害自己或他人” 的禁令,并以 “开发或使用武器” 来举例,但对 “军事和战争” 用途的全面禁止已不复存在。该公司表示,此次重写旨在使文件 “更清晰”、“更易读”,其中还包括许多其他实质性的语言和格式改动。

(插图:DA/1eb6f110-3d94-4c0c-84af-34e5ec2e1b64)

消息来源:Slashdot
老王点评:唉,AI 武器化似乎是不可避免的发展趋势,科技往往第一时间用在武器和战争上。

2 博通抛弃 VMware 云服务提供商

在收购了 VMware 之后,博通对 VMware 进行了一系列“手术”。不但将 VMware 的许可变为 订阅制,而且还对其合作伙伴关系进行了一系列大动作。博通准备终止 VMware 的渠道计划,只有一些被邀请的解决方案提供商/经销商会过渡到博通的渠道计划。并且,同时博通还通知 VMware 的云服务提供商,告知将于 4 月底终止他们销售基于 VMware 的云服务的伙伴计划。只有一些服务提供商将被邀请加入博通的合作伙伴计划,而没有被邀请加入的则陷入了恐慌,不知道其客户该怎么办。

(插图:DA/e82f9ab3-baf2-412a-b208-f0b9f7f45884)

消息来源:The Register
老王点评:被卖的公司往往被吃干吞净。

3 Linux 4.14 LTS 在六年后迎来生命终结

Linux 4.14 于 2017 年底首次亮相,但随着 Linux 4.14.336 的发布,它成为该系列的最后一个点版本。此版本中,只进行了少量的错误修复。LTS 内核维护者 Greg 说,“现在它已正式报废。请不要再使用这个版本的内核。”Linux 上游仍在维护的 LTS 内核有 Linux 4.19、5.4、5.10、5.15、6.1,以及最近作为 2023 LTS 内核的 6.6。Linux 4.19 将于今年年底到期,5.4 将于 2025 年到期,其余内核将于 2026 年底到期,只有两年支持期。

(插图:DA/20d496b2-c29c-433f-8a7e-3b2c7ddf2828)

消息来源:Phoronix
老王点评:随着这些支持六年的内核逐渐落幕,以后的内核也就支持两年。

1 Linux 内核开发者再次讨论从 C 语言转换为现代 C++ 语言

Linux 内核主要由 C 代码和汇编代码构成,但 Linux 内核邮件列表已重启讨论,探讨未来将 Linux 内核的 C 代码转换为 C++ 的可能性。早在 2018 年,红帽工程师 大卫·豪威尔斯 David Howells 就提出了一组 45 个补丁,将内核转换为 C++。这将允许主线内核使用内联模板函数、内联重载函数、类继承以及其他目前 Linux 内核的 C 代码不支持的功能。但该讨论没有进行下去,最终这些补丁在 Linux 内核邮件列表上停留了六年。昨天,长期从事 Linux 开发的 彼得·安文 H. Peter Anvin 用一篇长文重启了这个讨论。他认为,“C++ 已经有了长足的发展。……C++ 终于 ‘长大’ 了,对于操作系统内核所体现的嵌入式编程而言,它是一种更好的 C 语言。……我们最近提出的许多针对 gcc 扩展的要求,其实在标准 C++ 中很容易实现。”Linux 内核转向 C++ 的阻力之一是 Linus Torvalds 过去一直积极反对 C++。

(插图:DA/3ebf6893-7ebf-4901-8509-16c64ce7982d)

消息来源:Phoronix
老王点评:相关各方的讨论非常激烈,但无论如何,任何决定都应该通过广泛的讨论和不断的修正来进行。

2 新设备允许用户用舌头滚动屏幕

一种名为 MouthPad^ 的新设备可以让用户只用舌头就能滚动浏览智能手机,从而使触摸屏不再需要双手。它是安装在口腔顶部的类似于固定器的触控板,可以感知舌头的运动,让用户可以用舌头轻扫或点击来滚动、打字、打电话甚至下棋 —— “它就是你嘴里的鼠标”。该设备的目的是为残疾人士,尤其是手部残疾或瘫痪人士提供帮助。

(插图:DA/ec5efb61-7b22-41ed-97e3-b7d743a78798)

消息来源:NBC News
老王点评:目的是很好,但总感觉有点奇怪。

3 Brave Search 现在可以提供 AI 代码搜索

Brave 推出了 CodeLLM,这是一款集成到其搜索引擎中的人工智能工具,可提供编程查询结果,包括代码片段、逐步解释和引用。CodeLLM 是免费的,现在已集成到 Brave Search 中,用户无需切换应用即可访问。CodeLLM 建立在使用文本提示生成代码的 LLM Mixtral 之上。

(插图:DA/2cacb37f-574e-41ea-9d4e-2a260149f039)

消息来源:Tech Crunch
老王点评:以后程序员都不需要在 SO 上搜索代码了。

1 苹果公司要求开发者将 Vision Pro 应用称为“空间计算应用”

随着苹果公司的 Vision Pro VR/AR 头显将于 2 月 2 日上市,在该公司为 visionOS 开发者发布的指导中,要求开发者在提及 Vision Pro 应用程序时不要使用 AR 和 VR 术语,要将其称为 “空间计算应用程序”,而不要将应用体验描述为增强现实(AR)、虚拟现实(VR)、扩展现实(XR)或混合现实(MR)。

(插图:DA/8bde3f6c-df73-4055-8541-bc2e99d0051d)

消息来源:Engadget
老王点评:叫啥不重要,真能卖出去很多才行。

2 多邻国裁掉翻译人员,用 AI 替代

语言学习平台多邻国裁掉了大量从事翻译的合同工,因为它发现 AI 能在短时间内完成翻译,而且省钱。随着 AI 接管了课程的内容生成和翻译工作,留下的人主要是检查 AI 的内容确保其翻译质量。多邻国称它裁掉了 10% 的合同工,但表示这不是裁员,而是合同工在项目于 2023 年结束后离开了。

(插图:DA/65c0922f-9b05-40ea-8fd6-9d3a9a6a0944)

消息来源:PCMag
老王点评:看看,这些原本以为能一直干到老的工作都慢慢被 AI 取代了。

3 Linux 6.8 将提升 40% 多并发连接的 TCP 性能

正在开发中的 Linux 6.8 内核对核心网络代码进行了一些关键改进,在遇到多个并发网络连接时,这些改进最多可将 TCP 性能提高约 40%。新的补丁系列试图重组核心网络协议栈变量,以尽量减少数据传输阶段的缓存行消耗。具体来说,来自谷歌的开发人员研究了 TCP/IP 协议栈和 TCP 中的快速路径定义。

(插图:DA/4cf79d55-1340-4fca-8299-61de604cef88)

消息来源:Phoronix
老王点评:居然还能提升这么多,这是我没想到的,看来 Linux 的潜力还有很多。

1 OpenAI 称不用版权材料训练不出来 ChatGPT

OpenAI 在给英国上议院的文件中表示,如果不能访问受版权保护的内容,就无法建立像 ChatGPT 这样的人工智能系统。该公司表示,人工智能工具必须包含受版权保护的作品,以 “充分代表人类智慧和经验的多样性和广度”。OpenAI 认为,使用来自互联网的数据训练人工智能模型属于合理使用规则的范畴,该规则允许重新使用受版权保护的作品。另外,OpenAI 也宣布,网站可以从 2023 年 8 月开始阻止 OpenAI 的网络爬虫访问其数据。

(插图:DA/f7aafbbf-3d3e-4864-8ed0-56b86fd3d634)

消息来源:The Verge
老王点评:虽然是否属于版权法的合理使用还需要法律上的讨论,但我倾向于给予 AI 一个野蛮生长的机会。

2 美国去年仅净增长 700 个 IT 工作岗位

根据美国劳工统计局的数据分析,尽管美国 2023 年第四季度创造了超过 21,000 个 IT 工作岗位,但去年净增长的 IT 工作岗位仅为 700 个,而前一年则为 26.7 万个。目前,由于技能不匹配,有近 10 万个未填补的工作岗位和 10.1 万多名失业的 IT 专业人员。另外,尽管对拥有人工智能、安全、开发和区块链技能的人的需求仍然很旺盛,但入门级 IT 需求正在萎缩,入门级职位正在被人工智能取代。

(插图:DA/f5dee957-f727-414a-bfb9-18efdda5c06b)

消息来源:The Register
老王点评:上有经济不景气,下有 AI 追杀,IT 人真难。

3 确保 AI 安全的理论仍未就绪

美国国家标准与技术研究院(NIST)的计算机科学家 阿波斯托尔·瓦西列夫 Apostol Vassilev 表示,预测性和生成性人工智能系统仍然容易受到各种攻击。他说:“尽管人工智能和机器学习取得了重大进展,但这些技术很容易受到攻击。……确保人工智能算法安全的理论问题尚未解决。”他最近与其他人共同撰写的一篇论文试图对人工智能系统带来的安全风险进行分类,重点关注了四个具体的安全问题:规避攻击、中毒攻击、隐私攻击和滥用攻击。总的来说,结果并不乐观。论文最后指出,可信的人工智能目前需要在安全性与公平性和准确性之间做出权衡。

(插图:DA/3ea75ca9-198a-414c-8fc0-57b543c031d8)

消息来源:The Register
老王点评:AI 的安全也存在一个不可能三角吗?

1 Mozilla 已经将目光投向 Firefox 以外的领域

过去几年,Mozilla 不仅投资了 Mastodon 客户端和帮助识别虚假评论的浏览器扩展等初创公司,还推出了 Mozilla.ai,并在其董事会中增加了一批专注于人工智能的新董事。Mozilla 总裁 马克·苏尔曼 Mark Surman 在采访中说,Mozilla.ai “有一个广泛的任务,即寻找开源的、值得信赖的人工智能机会,并围绕这些机会建立一项业务。”他们的目标是如何利用不断增长的开源大型语言模型雪球,并找到一种既能加速雪球滚动,又能确保其滚动方向符合其目标和钱包。苏尔曼说 Mozilla 在人工智能方面“做的这一切,都是为了完成我们的使命。我认为,其中一些必须是纯粹的公共产品”。至于 Firefox,他表示,“Firfox 浏览器会更加保护你”。

(插图:DA/7fe9b88e-6668-4fa1-921e-21103939636c)

消息来源:Tech Crunch
老王点评:往好处看是 Mozilla 在寻求除了 Firefox 之外的收入来源,但从另外一个方面看,这是在其最重要的根本上溃败,战略性转移。

2 PyPy 项目转移到 GitHub

PyPy 项目是 Python 语言的实现之一,但运行速度快了约四倍。该项目已将其主要版本库和问题跟踪器转移到微软旗下的 GitHub,取代了 Mercurial。该项目的核心贡献者称,虽然他们觉得 Mercurial 是更好的版本控制系统,在命名分支模型和用户界面都更胜一筹,但“开源已经成了 GitHub 的代名词,我们太小了,无法改变这一点。……事实证明,不迁移到 GitHub 会阻碍贡献和问题报告。”该项目之前也曾移动过它的仓库,2010 年时它的代码放在 Atlassian Bitbucket 上。十年后,它转移到了 Mercurial 上。

(插图:DA/80b7ff0c-2f1d-42c0-8280-d599eae60800)

消息来源:Dev Class
老王点评:我认为 GitHub 成为开源的代名词是一件非常严重的事情,尤其是它还属于一个软件巨头。

3 随着人工智能的崛起,Web3 已不再受青睐

根据 Crunchbase 的最新数据,2023 年 Web3 初创公司的融资额比 2022 年下降了 73%。2023 年,Web3 初创公司融资额为 78 亿美元,而 2022 年为 215 亿美元。而根据 Dealroom 的数据,2023 年人工智能领域的融资额高达 178 亿美元。

(插图:DA/394ad7db-112f-49d0-9b69-0a94f006f1f5)

消息来源:INC
老王点评:不知道人工智能这一次是否能真正成为改变世界的浪潮,但目前看起来 Web3 还没到时机。