标签 翻译 下的文章

1 2023 年,GCC 仍然在为 COBOL 编译器开发新的功能

虽然现在不像 Rust 或其他语言那么流行,但对于 COBOL 爱好者和那些继续使用这种上世纪 50 年代编程语言维护代码库的人来说,GCC COBOL 编译器的树外支持在 2023 年底仍在继续。而且,ISO 发布了 COBOL 2023 规范,带来了异步消息传递、XOR 逻辑运算符、DELETE FILE 语句、布尔移位运算符、事务处理工具等功能。开发人员一直在努力支持该规范,并让他们的编译器支持通过越来越多的 COBOL 测试用例。

消息来源:Phoronix
老王点评:现在学 COBOL 还来得及去银行找份工作吗?

2 生成式 AI 的兴起引发了翻译技术的井喷式增长

数据提供商 Statista 预测,AI 翻译的全球市场将从 2023 年的约 50 亿美元增长到 2030 年的约 120 亿美元。在这一波 AI 翻译浪潮中,德国公司 DeepL 在 Google 和 Facebook 等强大竞争对手中间脱颖而出。DeepL 自 2017 年创办以来成长迅速,可能是过去 15 年翻译领域最成功的科技公司,今年 1 月它的估值达到了 10 亿美元。他们推出的 DeepL 是一个基于神经网络的在线翻译器。人工智能的进步为节省金钱和时间提供了可能,人工翻译只在需要时才介入。Gartner 预测,到 2025 年人类翻译者四分之一的工作量将是审阅和编辑机器翻译文本。

消息来源:《金融时报》
老王点评:我就说为什么 GPT 还没把 DeepL 打败,原来 DeepL 也是基于人工智能的,而且是专门针对场景优化过的。万能的 GPT 也不是每件事都能干到最好。

3 Google 支付 80 亿美元成为三星手机的默认应用程序

根据 Epic 在法庭上提供的信息,Google 同意在四年内向三星支付 80 亿美元,以使其应用程序在三星手机上成为默认设置。Google Play 收入的一半或更多来自三星设备,Google 和三星将分享应用商店的收入,以确保安卓移动设备预装 Google Play。

消息来源:The Hill
老王点评:随着对 Google 的各个诉讼案的审理,它和各大厂商的交易合作也随之被曝光。

谷歌工程师日常:一日一小时工作制

化名为 Devon 的谷歌工程师在接受《财富》杂志采访时透露,他的工作制度独树一帜:每天仅需为谷歌工作一小时。他通常在每天 9 点左右起床,完成洗漱和早餐后工作至 11 点,之后他会将精力转向自己的创业公司。尽管工作时长短,但他的年薪却高达 15 万美元。他认为,谷歌更希望能保留这些强大的人才,避免他们向竞争对手转投。在业界,这种被称为“penning”的情况并非罕见。

消息来源:《财富》
老王点评:虽然嫉妒让人热泪盈眶,但无论如何,只有那些能被雇主“金屋藏娇”的人才,才能享受如此待遇。

Meta 推出全能 AI 翻译模型:100 种语言,声音和文字互译

Meta 在大型语言模型与多模态技术领域一直走在前列。过去,Meta 已发布过处理语音图像、音乐的 AI 模型,还有一款因安全风险过大而无法公开代码的语音生成 AI 模型。近日,Meta 又推出一款名为 SeamlessM4T 的全功能多模态 AI 翻译模型。此模型不仅能处理文本和音频翻译,还具备声音和文字的互译能力,并且覆盖近 100 种语言。

消息来源:Facebook
老王点评:基于大型语言模型的驱动,加上多模态模型的基础,我们似乎可以预见,在不远的未来或许会出现无法区分人与 AI 的情况。这会让人想起互联网早期的名言:'在网上,无人知道你是不是一只狗。'

AI 策划的剧本,好莱坞说不

因抵制 AI 带来的威胁,数万名美国编剧工会成员在近几个月发起了罢工,以寻求更高的薪资和更长的合同。代表了 350 多家电影和电视制作公司的美国电影电视制片人联盟为了尽快结束罢工,作出了承诺:他们决不会把 AI 生成的剧本、对话或情节视为文学或原始材料,排除了 AI 获得任何写作荣誉的可能。也就是说,如果编剧对 AI 生成的材料进行修改,这些工作不会被认为是重写,他们可以获得全额报酬和荣誉。

消息来源:The Register
老王点评:一旦全篇剧本由 AI 创作,编剧的薪酬便可省下。进一步想象,AI 生成的面部、身体和嗓音可能会取代部分乃至全部演员的角色。看起来,被 AI 完全替代只是时间问题,也许比我们预期的要快。

本文收录了 LCTT 自创和选用的翻译词汇。

为什么要自创翻译词汇?在翻译过程中,我们发现一些非缩写的英语术语沿袭使用了英语单词/短语,而没有得体的、公认的、正式的对应中文翻译。我们认为,中英文混杂是对原生语言的一种污染(英文缩写除外,这是为了减少冗长的语句),按照本地化的宗旨,应该对这些词汇进行翻译,并在必要时创造新的词汇。故此,我们在几年的翻译中,逐渐推敲和形成了一些新的译法,并在我们翻译的文章中使用和推广。

对这些译法,我们尽量遵循“信达雅”的原则。但鉴于水平所及,肯定会有所不足,虽然也有不断的调整和改进,但仍希望得到大家的反馈和指正。

我们采用的方法是:

  • 音似:中文读音近似于英文原词
  • 意近:中文字的意思接近英文原意
  • 组词:根据上述两条组成新的词汇,以避免和原有词汇混淆

此外,需要说明的是,有些译法可能已经被其他人在别的地方更早提出,但限于我们的学识和搜索能力,并未发现和了解到,并非我们故意剽窃。

顺便说一句,2014 年对 “Shebang”(#!)一词翻译时,来自于 LCTT 早期重要贡献者 GOLinux 提出的 “释伴” 译法,是我们第一次创造新的翻译词汇,也是我们形成这样的想法的起点。

除了自创的翻译词汇外,这里还收录了一些选用的翻译词汇。有一些词汇存在多种译法,我们在翻译和使用过程中,采用了某个译法,在此列出以保持一致。

F

Fork:复刻

Fork 行为/操作广泛用于进程管理、版本管理和软件衍生方面。此词汇也长期缺乏确定的译法。

此前,提议者对 Fork 给出了 “复刻” 的译法。基本意思是,根据上游/父本复制一份,然后在此基础上进行修改,从而形成“衍生品”。

有趣的是,我们发现 GitHub 的 部分中文文档 中也采用了此译法,不知道是不是受到了我们的影响。

  • 提议者:wxy
  • 首次链接:</article-7877-1.html>

H

Here Document:现场文档

在编程领域,“here document” 是一个常见的术语,特指在脚本语言(如 Perl、Bash)中,能够直接在代码内部嵌入并处理一个数据块或文本串的技术。尽管传统上我们将它翻译为“嵌入式文档” 或不翻译,但这个译法似乎并不能完全地体现出原文的感觉和含义。

为了让这个概念变得更为直观和易理解,我们建议将 “here document” 翻译为 “现场文档”。“现场”相比于“嵌入式”,更好的传达了文档就在代码的当前位置,或代码“现场”的含义。这样的译法也与原文 “here document” 中 “here”(这里)的含义更为契合。我们希望这个译法能够在未来得到更广泛的使用和认可,让编程的世界因语言的精准而变得更美好。

PS., 该译法和解释得到了 ChatGPT 的建议和生成。

  • 提议者:wxy
  • 首次链接:</article-16298-1.html>

L

Live:立付

Live 原意多指“现场”、“实时”,在计算机环境中使用时也多引用此意。但对它的翻译就颇费神,因为无论是在 Live Patch,还是更多见的 Live USB/CD、Live Session,其实都不好翻译为“现场”、“实时”。

提议者之前曾经尝试创造了新的“临场”词汇,但是感觉有些不够达意。经过推敲,提议者再次推荐使用“立付”,在照顾发音的同时,取其“立时交付”之意。这样,Live USB/CD 可以译做 “立付 USB/CD”,Live Session 可以译做 “立付会话”。

而对于 Live Stream,提议者建议依旧翻译为“直播”、“实时流”。对于 Live Patch,还是采用 “热补丁” 这样的意译。

  • 提议者:wxy
  • 首次链接(临场):</article-12854-1.html>
  • 首次链接(立付):</article-15499-1.html>

Repo(Repository):代码仓库/软件仓库

Repository 主要用于两个场景,一个是用于版本管理的代码仓库,一个是用于分发软件/组件/制品的软件仓库。

鉴于两种场景的差异,建议在使用时,分别注明“代码仓库”或“软件仓库”,也可简称为 “代码仓”或“软件仓”。

S

Shebang [ʃɪ'bæŋ]:释伴

Shebang(也称为 Hashbang)是一个由井号和叹号构成的字符序列(#!),出现在脚本文件的第一行的前两个字符,后跟解释器路径,如:#!/bin/sh,这通常是 Linux 中 shell 脚本的标准起始行。

长期以来,Shebang 都没有正式的中文名称。提议者将其翻译为:“释伴”,即解释伴随行的简称,同时又是 Shebang 的音译。(关于这个词汇的翻译,在下面的首次链接中有其它的建议和讨论。)

  • 提议者:GoLinux
  • 首次链接:</article-3664-1.html>

Shell :交互界面

Shell 是 Unix/Linux 等系统的 shbash 等命令行的接口程序,包括 DOS/Windows 的 command.com/cmd.exe 等其实也属于此类,只是通常不这样称呼。

这个词汇也是一个一直没有翻译而径直使用的计算机词汇。我们也没有见到(找到)合适的翻译。但是我们在 LCTT 译者 CanYellow 翻译的一篇文章中见到他将其翻译为 “交互界面”,我们认为这是一种好的翻译。

  • 提议者:CanYellow
  • 首次链接:</article-15469-1.html>

说明

此文档会根据建议不断更新,其固定地址为: https://github.com/LCTT/TranslateProject/blob/master/Dict.md ,欢迎大家提交议题或拉取请求来完善它。

首个可以翻译无文字语言的口语翻译 AI

世界上大约 7000 种已知的语言中,40% 没有文字。这给现代机器学习翻译系统带来了问题,因为它们通常需要在翻译到新语言之前将口头语言转换为书面文字,并将文字还原为语音,但 Meta 公司已经通过其最新的 AI 进展解决了这个问题。这个通用语音翻译器(UST)正致力于开发实时的语音到语音的翻译。目前,该系统已经支持讲闽南话的人与讲英语的人交谈。

消息来源:Venture Beat
老王点评:Meta 要是不瞎搞,其实还是很厉害的,能做出很多很不错的技术的。不过,这个功能应该是为其元宇宙准备的。

GitHub Copilot 将微软引向版权风暴

上周,美国德克萨斯 A&M 大学教授 Tim Davis 发现,Copilot 在建议代码时会复制他拥有版权的稀疏矩阵转置代码。有律师宣布调查对 GitHub 提出版权索赔的可能性。以确定 GitHub 是否在开源代码上对 Copilot 进行了不当的训练,以及该工具是否在向用户推荐代码片段时不适当地发出了其他人的版权作品。Copilot 文档警告说,输出可能包含 “不良模式”,并将侵犯知识产权的责任放在 Copilot 的用户身上。

消息来源:The Register
老王点评:不知道微软会不会使用合规的代码重新训练它的 Copilot。

新的 USB-C 规范传输速率最高可达 120Gbps

USB-C 可以支持各种数据传输速率,从 USB 2.0 的 0.48Gbps 到 USB4、Thunderbolt 3/4 的40Gbps。USB-IF 发布了 USB4 2.0 规范,它增加了双向 80Gbps 带宽的支持,以及 120Gbps/40Gbps 的非对称速率的支持。

消息来源:ARS Technica
老王点评:USB 规范的名字已经晕菜了,只需要关注速率提升了。

Meta 的 “ 不落下任何语言 No Language Left Behind ” 是一个宏大的开源项目,旨在以最高准确度翻译语言。

meta

Meta(前身是 Facebook)在开源世界做出了不小的贡献。Meta 除了专注于 元宇宙 Metaverse 和其社交媒体平台外,还致力于各种研究和创新工作,比如 React(一个 JaveScript 库)。

现在,Meta 的研究人员决定开源一个叫 “ 不落下任何语言 No Language Left Behind ” 项目。

(LCTT 校注:这个直译项目名称不够好听,我来抛砖引玉,似可称做“无人独语”,读者有什么建议吗?)

Meta 试图不落下任何语言

目前,虽然世界上有大约 7000 个在使用中的语言,但大多数在线的内容都是以少数的流行语言来提供的,比如英语。这让许多不懂这些语言的人处于不利的地位。

虽然现存的许多翻译工具,但语法错误会让错误变得难以阅读和理解。另外,如果你想把内容翻译为一个不流行的语言(特别是非洲和亚洲的一些语言),翻译体验不会很好。

因此,Meta 正在开发有最高质量的翻译工具,可以帮助解决这一全球性的问题。

NLLB-200( 不落下任何语言 No Language Left Behind ) 是一个人工智能翻译模型,其可以翻译 200 多种语言。该模型在每种语言中的翻译结果是通过一个名为 FLORES-200 复杂数据集来确定和评估的。

正如 Meta 所说,NLLB 的翻译结果比以前的人工智能研究方法好 40% 。对于一些最不常见的语言,其翻译准确率甚至超过 70%。了不起的工作!

为了帮助开发项目和提高模型的翻译质量,Meta 向所有感兴趣的研究人员开放了源代码,包括 NLLB-200 模型、FLORES-200 数据库、模型训练和重建训练数据库的代码。

你可以在 GitHub 上找到源代码,并且可以在该项目的 博客 上了解它的更多信息。

对社会事业的鼓励

Meta 宣布向从事 联合国可持续发展目标 UN Sustainable Development Goals 任何领域工作和翻译非洲语言的非营利组织和研究人员提供高达 20 万美元的捐赠,也鼓励其他学术领域如语言学和机器翻译的研究人员申请。

项目的影响

尽管 Meta 主要打算在其数字平台上,特别是在“元宇宙”上使用 NLLB,但 NLLB 也有可能在其他领域产生巨大影响。

许多用户可以用他们的母语轻松地访问和阅读在线资源。项目开源后,社区应该能够帮助实现这个目标。

你对 Meta 的这个项目有什么看法?


via: https://news.itsfoss.com/meta-open-source-ai-model/

作者:Rishabh Moharir 选题:lkxed 译者:fenglyulin 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

OpenJDK 18 发布

Oracle 公司今天 正式发布了 Java 18 的参考实现 JDK/OpenJDK 18。OpenJDK 18 现在已经可以用于生产,它包括了一些新的功能,以及数百个较小的改进和一千多个错误修复。在 OpenJDK 18 中,UTF-8 最终成为了 Java SE API 的默认字符集。另一个值得注意的是,它包括了一个简单的 Web 服务器 Jwebserver,这是一个新的命令行工具,用于启动一个基于 Java 的最小的静态 Web 服务器。

老王点评:可真快,一转眼 Java 都 18 了。

一名 16 岁英国少年被疑似 Lapsus$ 黑客组织的主谋

彭博社报道,网络安全研究人员在调查 Lapsus$ 黑客组织针对微软和英伟达等科技公司的攻击时,发现这些攻击与一名住在英国牛津附近的 16 岁少年有关,他们认为这名少年是主谋。他的个人信息,包括他的地址和他父母的信息,被对手发布在网上。Lapsus$ 的另一名成员被怀疑是一名居住在巴西的青少年,很可能还有其他人参与了该组织的行动。

老王点评:真是“无畏”的少年,不过,可笑的是,一些世界级的大公司就这样被攻破了。

微软采用新的机器学习技术改善其 AI 翻译

微软宣布 基于其 Z-Code 项目对其翻译服务进行更新,该项目采用了“备用专家混合”的方法,这些新的模型在盲评中得分高出了 3% 到 15%。“混合专家”并不是一项全新的技术,但它在翻译方面特别有用。在其核心,该系统基本上将任务分解为多个子任务,然后将它们委托给更小、更专业的模型,这称为“专家”。然后,系统根据自己的预测,决定将哪个任务委托给哪个“专家”。

老王点评:讲实话,现在无论是谷歌还是微软的必应,其翻译质量还是一般,甚至有时候可笑。