分类 硬核观察 下的文章

研究发现更大的上下文对大语言模型来说意义不大

在大语言模型中,上下文窗口指的是模型在给定实例中可以处理和响应的文本长度。它可以被视为特定文本分析或聊天机器人对话的工作记忆。许多人都认为,语境窗口变大的趋势将继续提高 大语言模型的性能和在各种应用中的实用性。但根据一项最新研究,大语言模型往往无法访问和使用在较长的上下文窗口中提供给它们的相关信息。当相关信息出现在输入上下文的开头或结尾时,它的性能最佳;而当模型必须在长上下文中间获取相关信息时,性能就会明显下降。此外,随着输入上下文的长度增加,即使是明确的长上下文模型,性能也会大幅下降。

消息来源:Venture Beat
老王点评:可见我们对大语言模型内部到底发生了什么,还是一无所知。

谷歌敦促 Gmail 用户启用 “增强型安全浏览”

这项增强的安全功能已经存在了三年,但谷歌最近开始在 Gmail 收件箱中显示一条信息,建议人们打开 “增强安全浏览” 功能。如果谷歌认为你正在浏览的网站冒充你的银行等,你就会看到一个红色的警告屏幕。一般而言,开启这项安全功能是个好主意,虽然它会收集你的更多信息,但如果你本来就使用了 Gmail 等谷歌服务,其实它已经收集了足够多的信息。如果你开启了该功能,即使你没有登录谷歌账户,谷歌也会对你访问的网站了如指掌。它还会从你访问的网站上收集一些视觉图像,以扫描诈骗网站的特征。

消息来源:MSN
老王点评:你应该自己决定是否愿意放弃部分隐私来换取额外的安全保护,以防止常见的犯罪行为。

五年后,Cython 3.0 发布

Cython 是一种基于 Python 的编程语言和编译器,它可以编译输出原生代码,执行速度可能比 CPython 解释器快得多。它既可用于优化 Python 应用程序,也可用于创建 CPython 可使用的模块,从而在解释器中运行应用程序的主要部分时,编译性能关键的代码。Cython 至今已有 21 年历史。在接近五年的漫长时间后,Cython 3.0 发布,增加了许多新功能,现在支持 Python 3 的所有版本,但放弃了对 Python 2.6 的支持。但 Cython 2.x 和 Cython 3.0 之间的兼容性问题已经造成了一些问题,影响到了包括 AWS CLI 在内的一些重要项目。

消息来源:Dev Class
老王点评:觉得 Python 慢吗?那就编译好了。

社区批评 Meta 滥用“开源”来称呼其新大语言模型

Meta AI 宣称:“Llama 2 是我们的下一代开源 LLM,可用于研究和商业用途”。但事实上 Llama 2 并没有使用 OSI(开源计划)批准的许可证,也不符合 OSD(开源定义)。其社区协议禁止使用 Llama 2 训练其他语言模型;如果在月活用户超过 7 亿的应用程序或服务中使用该技术,比如那些大公司,则需要获得 Meta 的特殊许可。对于程序员来说,可能是否“开源”并不要紧,他们能够用它来搭建和研究就够了。对于 Meta 高层来说,“开源”被他们当成了一个营销用语,但是这显然会让人对“开源”一词产生混淆。

消息来源:The Register
老王点评:我不觉得 Meta 不知道什么是“开源”,但是这种草率编写的许可协议,显然代表了 Meta 既想借开源的模式打狼,又担心开源反而赔了孩子。这种首鼠两端的想法最后不会有好结果。

人工智能公司承诺将为人工智能生成内容打上水印

OpenAI、Alphabet、Meta、亚马逊和微软等七家主要的美国人工智能公司,承诺开发一个系统来 “标记” 文本、图像、音频、视频等所有形式的人工智能生成的内容,这样用户就能知道什么时候使用了这项技术。这种以技术方式嵌入内容的水印,会让用户更容易发现深度伪造的图像或音频。他们还承诺在发布新的人工智能系统前进行彻底地测试,并分享诸如如何降低风险等信息。

消息来源:路透社
老王点评:这真的能做到到么?或者说,这种水印能被其它人工智能系统去掉吧。更不要说还有开源的人工智能系统。

Cerebras 推出人工智能超级计算机网络

Cerebras 公司推出了 Condor Galaxy 项目,这是一个由九台相互连接的超级计算机组成的网络,专为人工智能模型训练而设计,总性能达到 36 FP16 ExaFLOP。其中第一台超级计算机 CG-1 是由 64 台 Cerebras CS-2 系统整合而成,有 5400 万个内核,能够为人工智能训练提供 4 ExaFLOP 的算力。它支持多达 6000 亿个参数的模型,其配置可扩展至支持多达 100 万亿个参数。其它几台将陆续建设。该公司 CEO 称,“许多云计算公司都宣布了耗资数十亿美元建造的大规模 GPU 集群,但这些集群却极难使用。将一个模型分布到数千个微小的 GPU 上,需要数十名具有罕见专业知识的人员花费数月的时间。CG-1 消除了这一挑战。建立一个生成式人工智能模型只需要几分钟,而不是几个月,而且一个人就能完成。”

消息来源:Anand Tech
老王点评:算力不是问题,将来的人工智能系统才是问题。这样大量训练出来的人工智能系统,真的能按照人们最善良的愿望去发展吗?

IMAX 电影播放仍然需要一台 21 年前的掌上电脑

在《奥本海默》上映之前,IMAX TikTok 官方账号发布的一段视频中,有一个小小的蓝银色 Palm 设备。它是在另一台设备上运行的 Palm Pilot 模拟器,安装在放置卷轴的机器旁边的白色柱子上。这个仿真的设备是 Palm m130,于 2002 年发布。它有一个两英寸的 160x160 显示屏,采用 33MHz 的摩托罗拉处理器,运行 Palm OS 4.1 系统。在 IMAX 影院中,该掌上电脑的工作是控制快转卷轴装置,多年来,在大多数 IMAX 影院里,似乎都有一个实体 m130。IMAX 为什么还要在 21 年前的设备上运行其系统?又为什么会选择在一台蹩脚的 Windows 平板电脑上简单地模拟这台 21 年前的设备呢?因为,放映员们已经习惯了它的存在。

消息来源:The Verge
老王点评:2000 年时,我用过早期 Palm,却没想到在二十几年后 Palm 仍然在用。

特斯拉开始生产可以媲美超算榜首的 Dojo 超级计算机

特斯拉在 2023 年第二季度财报中概述了大规模解决车辆自动驾驶问题所需的四大技术支柱:超大型真实世界数据集、神经网络训练、车辆硬件和车辆软件。特斯拉表示,它已经开始生产用于训练其自动驾驶车队的 Dojo 超级计算机,该计算机宣布于 2019 年。特斯拉已经拥有一台基于英伟达 GPU 的大型超级计算机,它是世界上最强大的超级计算机之一,但新的 Dojo 定制计算机使用的是特斯拉设计的芯片。此前,马斯克曾宣称,Dojo 的运算能力将达到 1 ExaFLOP。目前,据公开披露的信息,美国橡树岭国家实验室的超级计算机 Frontier 是全球首台达到 ExaFLOP 级别的计算机,也是唯一一台。

消息来源:The Verge
老王点评:虽然可能还需要一年时间,但是特斯拉能从芯片到贴片、托盘、机架,乃至于构成一个集群,其计算实力不容小觑。

AMI 固件中发现影响数百万计算机的严重漏洞

这些漏洞是在 AMI 为 BMC(底板管理控制器)制作的固件中发现的,BMC 是集成在服务器主板上的小型计算机,可以远程管理多台计算机。可以访问 Redfish 远程管理接口的本地或远程攻击者可以利用这些漏洞,导致未经授权的访问、远程代码执行和服务器的潜在物理损坏。这一漏洞使其能够在世界上一些最敏感的云环境中获得超级用户身份。在那里,攻击者可以安装勒索软件和间谍恶意软件,在受感染机器的最底层运行。成功的攻击者还可能对服务器造成物理损坏或无限期重启循环。

消息来源:Ars Technica
老王点评:在支持远程管理的固件上出现的安全漏洞,那才叫一个防不胜防。

现存最古老的发行版 Slackware 已经 30 岁了

本周,Slackware Linux 项目庆祝其成立 30 周年。Slackware 1.0 版本于 1993 年 7 月 16 日发布,它是目前仍在积极维护和开发的最古老的 Linux 发行版,虽然它不是第一个 Linux 发行版。最让人敬佩的是,其创始人至今仍在维护该项目。他说,“这真的是一段非凡的旅程,我在 1993 年开始时根本无法预料。”当前版本 Slackware 15 于 2021 年进入测试阶段,并于去年初发布。顺便说一句,MCC Interim Linux 可以说是第一个发行版,它的第一个候选版本 0.97 在 1991 年内核发布几个月后就出现了。Debian 比 Slackware 稍微年轻一点,是在 Slackware 发布两个月后发布的。

消息来源:The Register
老王点评:Slackware 是我用过的第一个 Linux 发行版,那应该是 1997 年或 1998 年。而我那时最喜欢的发行版是 Mandrake。

黑客之王凯文·米特尼克去世

凯文·米特尼克 Kevin Mitnick ,曾被称为 “世界头号通缉黑客”,于上周日去世,享年 59 岁。他曾因侵入和篡改公司计算机网络而入狱服刑,2000 年获释后开始了新的职业生涯,担任安全顾问、作家和公共演讲人。他最为人熟知的是 20 世纪 90 年代的疯狂犯罪,当时他从美国各地的电脑中窃取了成千上万的数据文件和信用卡号码。他利用自己的技能进入美国的电话和手机网络,破坏政府、企业和大学的计算机系统。1995 年,经过长达两年多的追捕,他被美国联邦调查局抓获。

消息来源:Engadget
老王点评:这是一个传奇,虽然是那种以破坏为目的的“黑客”,但依然是传奇的一生。

苹果正在开发自己的人工智能大模型

据报道,苹果正在开发自己的大语言模型以及类似 ChatGPT 的 AI 工具。苹果的大模型代号 “Ajax”,苹果还创建了一个聊天机器人服务,一些工程师称之为 “Apple GPT”。苹果有多个团队在 AI 项目上展开合作,它已成为苹果的一大重要工作。苹果员工表示这项工作基本上是对 Bard、ChatGPT 的复制,并不包含任何新功能或新技术。苹果正在积极改进模型,但目前没有向消费者发布的计划。

消息来源:彭博社
老王点评:苹果在这一点上已经大大落后,不知道什么时候它的 Siri 才可以变聪明。

Meta 发布新大语言模型,可免费商用,采用特别的“开源”方式

Meta 周二发布了 Llama 2:这是一套经过预训练和微调的基于文本的人工智能模型,有三种不同的规模,分别包含 70 亿、130 亿和 700 亿个参数。与之前的 LLaMA 模型不同的是,任何人都可以申请下载 Llama 2,开发人员可以用它来构建商业产品或服务,以及开展有趣的项目。Meta 表示,不会对访问或使用其开发的模型收费,而是通过向其他公司开放该技术,如与微软和亚马逊合作,在 Azure 和 AWS 上提供该模型。值得注意的是,Llama 2 采用了专门的 许可证,有一些独特的限制,因此不符合“开源”的定义。除了常见的免责声明外,开发人员不能利用其输出结果来改进其他类型的大型语言模型。以及,如果将 Llama 2 用于支持那些拥有超过 7 亿月活跃用户的应用程序的大公司,必须申请使用 Meta 技术的特殊许可。

消息来源:The Register
老王点评:虽然不是规范定义的“开源”软件,但至少是开放的。值得注意但是,从 LLaMA 到 Llama 2,Meta 都采用了非同寻常的“开源”方式,这或许是 Meta 既想利用开源的优势,又有一些不确定的担忧。也许人工智能领域需要一种独特的开放许可证。

美国启动物联网安全标签计划

该计划的正式名称为《美国网络信任标识》,旨在帮助美国人确保他们购买的互联网连接设备具有强大的网络安全保护措施,可防范网络攻击。长期以来,物联网一直被认为是网络安全的薄弱环节。符合该标准的设备将要求具有唯一且强大的默认密码、保护存储和传输的数据、提供定期的安全更新以及具备事故检测能力等。

消息来源:Tech Crunch
老王点评:越来越多的物联网设备,其实是埋在信息社会底层的空洞,你不知道它什么时候就会导致塌陷。

印度大部分外包程序员将在两年内因人工智能而消失

Stability AI 公司的 CEO 表示,印度的大多数外包程序员将在未来一两年内失业。不过他认为,在法国等受《劳动法》保护较强的国家受到这种影响的可能性较小。他重申了他之前的说法,五年后将 “不再有程序员”,不过,他也说明,他指的是传统意义上的程序员。他说,“当你把编程这件事从错误测试、单元测试到构思进行解构时,人工智能可以做到这一点,而且做得更好。但这不是自动完成的,而是人工智能‘辅助驾驶’完成的。”

消息来源:CNBC
老王点评:其实也不用特别慌,就像计算器、计算机出现,并没有让原来的财务和文员失业一样,只是如果你掌握不了新工具,那这种“古典程序员”被淘汰也是自然的。

Wayland 正在成为 Linux 图形用户界面的首选方式

越来越多的证据表明,Wayland 显示服务器可能很快就会取代 X11,成为 Linux 上最常用的 GUI 方式。比如,为苹果芯片 Mac 开发 Linux 的团队表示,他们没有足够的人力来开发 X.org 支持。被许多 Linux 应用程序和桌面使用的 Gtk 工具包的开发者说,下一个版本可能会 放弃 对 X11 的支持。Budgie 桌面的下一个版本将只支持 Wayland。KDE 6 会话 默认使用 Wayland。甚至还有人尝试让 Wayland 在 OpenBSD 上运行,而它已经可以在 FreeBSD 上使用了。

消息来源:The Register
老王点评:再想想 X.org 多少年 没有 实际开发 在进行了,连 董事会选举 都差点凑不够人。所以,是时候全面转向 Wayland 了。当然,Wayland 自己还有一些问题需要解决。

安装量超百万的 WordPress 安全插件明文记录密码

All-In-One Security(AIOS)是一款安装量超过了百万的增强 WordPress 安全性的插件,在其 5 月发布的 v5.1.9 中引入了一个错误,用户登录使用 AIOS 的网站后会以明文方式记录其密码,并将其存储在管理员可访问数据库中。上周释出的 v5.2.0 修复了该问题,并从数据库里删除了相关数据。在公告中,他们还给出了一些安全建议,其中包括已被认为是糟糕的安全实践“定期修改密码”——因为这会事实上迫使用户使用弱密码。微软认为这种做法 “古老而过时”。

消息来源:Ars Technica
老王点评:无论如何,不用明文存储密码都是最起码的安全常识。从这一点和该插件开发方给出的安全建议看,他们或许并没有真正的安全意识。

网站建设公司提供创建整个网站的人工智能工具

Wix 是网站建设领域的老牌公司。该公司发布的新人工智能网站生成工具可以让 Wix 用户描述他们的意图,并生成一个包含主页、内页、文本和图片的网站,并可以包括活动、预订等特定业务板块。在一个类似聊天机器人的界面中,该工具会询问一系列有关网站和业务性质的问题,并尝试将其转化为定制的网站模板。Wix 认为客户不会特别在意花时间定制网站外观的方方面面。

消息来源:Tech Crunch
老王点评:很多年前,开发一个网站是一件艰巨的工作,而现在,通过新的工具,开发一个网站可能就像快餐一样简单。