标签 GPT-4 下的文章

了解 Llama 2 和 GPT-4 之间的主要区别,它们是自然语言处理的领先巨头。揭示它们的优势、劣势以及它们如何塑造语言技术的未来。

在撰写内容时,有两个关键因素至关重要,“ 困惑度 perplexity ”和“ 爆发性 burstiness ”。困惑度衡量文本的复杂程度。而爆发性则比较句子的变化程度。人类倾向于以较大的爆发性写作,例如长句或复杂句与短句并存。人工智能生成的句子往往更加均一。

在自然语言处理领域,Llama 2 和 GPT-4 是两个杰出的参与者,吸引了研究人员和爱好者的关注。这些大型语言模型展示出独特的功能和特点。

虽然 GPT-4 由 OpenAI 已经发布一段时间,但 Meta 与微软合作推出了 Llama 2,这是 LLaMa 扩展语言模型的改进版本。

让我们深入探讨这两个模型之间的关键区别,以了解它们的特点之所在。

Llama 2:简单易用

Llama 2 是其前身 LLaMa 的升级版本,以其简洁高效的特点震撼了科技界。尽管它支持的语言范围较窄,仅包括 20 种语言,但其性能令人印象深刻,可以与 GPT-4、Claude 或 Bard 等重量级模型相媲美。令人惊讶的是,尽管参数比 GPT-3 模型少,但 Llama 2 可以在单个 GPU 上高效运行,使其成为各种应用的更便捷选择。

Llama 2 真正的特点是它专门训练于公开可获得的数据集,使其对研究人员和开发人员更加可用。更为引人注目的是,尽管仅在 1,000 个精确提示的相对较小数据集上进行训练,它依然实现了有竞争力的结果。

GPT-4

在 2023 年 3 月,OpenAI 自豪地推出了其最新的创作——GPT-4,这一力作轰动了语言模型领域。GPT-4 在许多任务中表现卓越,包括专业医学和法律考试,展示了其多功能和高水平的能力。

GPT-4 的一个显著特点是相对于之前的版本,它能够扩展最大输入长度。这个增强功能使其能够处理更加广泛和复杂的语言数据,为自然语言理解和生成开辟了新的可能性。

此外,GPT-4 拥有广泛的语言支持,支持 26 种语言。这种多样的语言能力扩大了其在全球范围内的覆盖和适用性,使其成为多语言项目和应用的首选。

区别:Llama 2 与 GPT-4

在比较 Llama 2 和 GPT-4 时,我们可以看到两个模型都有各自独特的优缺点。Llama 2 以其简洁高效的特点脱颖而出,尽管其数据集较小且语言支持有限,但其表现卓越。其易用性和有竞争力的结果使其成为某些应用的有力选择。

另一方面,GPT-4 在各种任务上的出色表现和广泛的语言支持使其成为更复杂和多样化项目的强大选择。然而,关于其模型架构和训练数据集的详细信息缺乏,还有一些问题尚待回答。

下表显示了两个模型的一些基准分数(以及其他热门模型):

基准测试 样本数 Shot GPT-3.5GPT-4PaLMPaLM-2-LLlama 2
MMLU (5 样本)7078.386.186.4
TriviaQA (1 样本)69.33337.581.4
Natural Questions (1 样本)68.937.552.385
GSM8K (8 样本)8556.556.887
HumanEval (0 样本)48.19256.751.2
BIG-Bench Hard (3 样本)29.356.826.229.9

常见问题解答

1、Llama 2 和 GPT-4 的主要区别是什么?

主要区别在于设计和性能。Llama 2 注重简洁高效,而 GPT-4 具有扩展的输入长度和广泛的语言支持。

2、哪个模型更适合多语言模型?

GPT-4 适用于多语言项目,因为它支持 26 种语言,为全球应用提供了更广泛的范围。

3、Llama 2 可以运行在单个 GPU 上吗?

是的,Llama 2 可以在单个 GPU 上有效运行,使其成为各种应用的实用选择。

4、Llama 2 支持多少种语言?

Llama 2 支持 20 种语言,虽然比 GPT-4 稍少,但仍覆盖了相当广泛的语言范围。

5、GPT-4 是否有可用的基准测试?

不幸的是,没有提及 GPT-4 的具体基准测试,因此对其性能还有一些问题没有答案。

结论

Llama 2 和 GPT-4 代表了自然语言处理领域的前沿进展。尽管数据集较小,Llama 2 以其简洁性、易用性和有竞争力的性能令人印象深刻。另一方面,GPT-4 的多功能性、高水平和广泛的语言支持使其成为处理复杂项目的杰出选择。这两个模型对自然语言处理的发展做出了重要贡献,为语言技术在我们生活中发挥更加重要的作用铺平了道路。

基准测试参考:

(题图:MJ/60e112f7-3399-49fd-9157-c6b03de5efea)


via: https://www.debugpoint.com/llama-2-vs-gpt-4/

作者:Arindam 选题:lkxed 译者:ChatGPT 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

OpenAI 宣布 GPT-4,事实性评估得分提高 40%

正如上周微软德国 CTO 披露 的那样,OpenAI 今天发布了 GPT-4。它与 GPT-3 的一个主要区别是它是一个大型多模态模型,而不是大型语言模型,它的输入输出不再局限于文本,可以是图像和视频。GPT-4 的参数数量未知,可能会比 GPT-3 的 1750 亿个参数要多,但其数据训练集仍然停留在 2021 年 9 月。OpenAI 称,当任务的复杂性达到足够的阈值,GPT-4 优势就会非常明显,在测试中的表现远胜于前代。OpenAI 称它在律师考试中的得分能进入前 10%;在生物奥林匹克竞赛和 GRE 写作中能接近满分,不过在有的测试中结果并不好,比如在 AP 英语语言和写作中的得分只有 2 分。目前 GPT-4 还没有开放公众使用。

消息来源:The Register
老王点评:都听说了吧,今天 GPT-4 的消息已经刷屏。它和一些 AI 的区别就像是鸥翼门的 Model X 和垃圾箱的区别。

Kali Linux 发布防御安全发行版 Purple

用于渗透测试、安全审计和网络安全研究的发行版 Kali Linux 项目发布了一个专门用于防御的版本 Kali Purple。开发者表示这代表着一个新的时代,Kali 不再是进攻用,它还能防御了。Kali Purple 提供了逾百种安全防御工具。

消息来源:Kali
老王点评:这让我想起来一个古老的成语“自相矛盾”,到底是矛锋利呢,还是盾坚固呢?

经过近二十年的等待,GNOME 44 带来了图片缩略图

GNOME 44 发布了候选发布版,预计将出现在即将发布的 Ubuntu 23.04 和 Fedora 38 中。除了从 GTK3 迁移到 GTK4 之外,它还支持 Wayland 的针对每个显示器设置不同的缩放比例,仅此一项就可以让用户从 X11 切换到 Wayland。除了新功能之外,GNOME 44 还恢复了一些从旧版本中删除的功能,其中一些是用户已经要求了很久的。比如恢复了 GNOME 43 中删除的文件夹展开,因为文件应用的侧边栏中没有树状视图,它曾经有一个,但多年前就被删除了。甚至还恢复了 2004 年就要求的图像文件的缩略图预览。

消息来源:The Register
老王点评:看起来 GNOME 更重视用户的呼声了。

微软称多模态的 GPT-4 将在下周发布

在 3 月 9 日举行的一场 AI 活动中,微软德国公司的 CTO Andreas Braun 随意地提到,“我们将在下周推出 GPT-4,它将是一个多模态模型,能够提供完全不同的可能性,比如支持视频。”微软是 OpenAI 的合作伙伴,前两天刚刚 介绍 了其多模态模型 Kosmos-1。在 ChatGPT 正式发布之前,GPT-4 已经经过几个月的测试和微调,几乎已经准备就绪。

消息来源:Heise
老王点评:看来 GPT-4 的变化主要不是一昧的爆参数数量,而是将其从单模态的文本变成了支持文本、视频等多模态方式。

研究发现固态硬盘比机械硬盘更可靠

云存储供应商 Backblaze 发布年度报告,披露其固态硬盘的年度故障率(AFR)为 0.98%,而机械磁盘为 1.64%。该公司公布机械硬盘的 AFR 已经有好几年了,这是它首次公布固态硬盘的 AFR 数字。不过,这次的数据只是基于其不到 3000 块的固态硬盘的数据,置信空间还比较宽。

消息来源:Blocks & Files
老王点评:也就是说,固态磁盘已经很可靠了。

字节跳动发布了开放系统固件 CloudFW 2.0

字节跳动本周在北京举办了 CloudFW 开放系统固件研讨会,他们在会上推出了 CloudFW 2.0,采用 Coreboot 来取代 UEFI。字节跳动将 CloudFW 2.0 宣传为 “业内首个将 x86 服务器上的全栈式开放系统固件产品化的固件解决方案”。

在此次研讨会上还 披露,由于字节跳动这样的大客户,联想现在正在以某种方式支持 LinuxBoot。开源的 LinuxBoot 采用 Linux 内核取代了大部分的 UEFI DXE 模块,这引起了许多超大规模的企业的兴趣。

消息来源:Phoronix
老王点评:很高兴看到中国互联网公司也支持开源硬件。

微软准备将 GPT-4 接入到必应搜索引擎

据称,微软正在努力将 OpenAI 的 ChatGPT 的更快版本(被称为 GPT-4)在未来几周内纳入它的必应搜索引擎。整合后,必应将使用 GPT-4 来回答搜索查询。GPT-4 和 ChatGPT 的主要区别在于速度,不像 ChatGPT 有时需要长达几分钟的时间来形成回应。通过使用 GPT-4,必应将能够为用户提供人性化的答案,而不是仅仅显示一个链接列表。

消息来源:Tech Crunch
老王点评:GPT-4 就准备这样悄悄亮相了?这条新闻有点不确定,或许是一个内测版 GPT-4?

Twitter API 将不再提供免费访问

Twitter 宣布,从 2 月 9 日开始它的 API 将不再支持免费访问,使用其 API 将必须付费。但其尚未披露付费计划。上个月 Twitter 修改了 API 规则,明确禁止 了开发者利用其 API 开发第三方客户端,大部分第三方 Twitter 客户端已经被 杀死 了。成千上万的开发者还使用 Twitter API 建立了有关天气和信息的机器人,这些都是有趣的业余项目,但在新的政策下,这些机器人都面临关闭。该公司还没有澄清它是否也计划终止对研究人员的免费 API 使用。

消息来源:Tech Crunch

老王点评:马某这是杀鸡取卵,着急还清他的收购贷款啊。还好,现在一些去中心化的 Twitter 替代品已经开始出现,除了长毛象,这两天还有个 Damus 开始刷屏票圈。

夹带个私货,已经开始测试 Damus 的朋友可以加 Ξ:///硬核老王: npub123eqjqdz2g5yw4vvz3ea6ws2ma0xls42jx3nqtzp4lcdk4jyh0zqwg426f

AI 图像合成模型会“记忆”一点点训练图像

研究发现利用对抗性攻击,可以从“稳定扩散”等潜在扩散人工智能图像合成模型中提取一小部分训练图像。它挑战了图像合成模型不记忆其训练数据的观点,以及训练数据如果不被披露就可能保持隐私的观点。研究人员在他们测试的 35 万张高概率记忆图片中只提取到 94 个直接匹配和 109 个感知近似匹配,记忆率大约为 0.03%。另外,他们发现 “记忆” 是近似的,因为人工智能模型不能产生训练图像完全相同的精确副本。

消息来源:Ars Technica
老王点评:虽然这个比例非常小,但是如果在大量使用的情况下,可能会带来一些监管和隐私的问题。也就是说,人们希望 AI 图像合成可以做到 “意会” 而不是 “拼合”。

C++ 之父认为 Rust 的安全性并不优于 C++

C++ 之父 Bjarne 最近发布了一篇文章,号召认真思考 “安全” 问题;然后做一些明智的事情。Bjarne 对 NSA 关于软件内存安全的报告做出了回应,因为该报告将 C 和 C++ 排除在安全之外。Bjarne 不认为报告中任何一种 “安全” 语言的选择在他所关心的使用范围内比 C++ 优越。他认为,在 NSA 的文件中,“‘安全’仅限于内存安全,而忽略了语言可能(以及将)被用来违反某种形式的安全和保障的十几种其他方式。”

消息来源:Slashdot
老王点评:确实,安全缺陷本来不是 C++ 或者大部分流行的编程语言的一部分,编程的人才是安全漏洞的引入者。问题是,Rust 可以通过语言本身的机制来避免这些本可以避免的安全漏洞。

OpenAI 说 GPT-4 的 100 万亿参数数量是“胡说”

OpenAI 的 CEO 澄清了一些关于 GPT-4 的流言。他说 GPT-4 的发布没有确定的时间框架,“它会在某个时间点出现,当我们有信心能够安全和负责任地完成它时”。并称那张比较了 GPT-3(1750 亿)和 GPT-4(100 万亿)中的参数数量的图表“完全是胡说”。而对于通用人工智能(AGI),他说,“人们在乞求失望,他们会失望的……我们没有一个真正的 AGI。”他也认为 ChatGPT 将杀死谷歌的预测是错误的,“我确实认为搜索有一个变化,可能会在某个时候到来 —— 但变化短期内不会像人们想象的那样剧烈。”

消息来源:The Verge
老王点评:看到 OpenAI 的创始人还如此清醒,这很好。我也为我之前传播的那张错误的参数对比图道歉。

GitHub 将停止支持 Subversion

GitHub 宣布将于 2024 年 1 月 8 日停止支持 Subversion(SVN)。GitHub 是在 2010 年的愚人节这天宣布支持 Subversion 版本控制系统(一度被视为玩笑),当时集中式版本控制系统是主流,分布式版本控制系统如 Git 还是一个新人,还没有迹象显示它将统治世界。通过在 GitHub 后端原生支持 Subversion,GitHub 让用户能更容易迁移到 Git。今天 Git 在开发者中的使用比例高达 94%,Subversion 的使用比例越来越少。

消息来源:Solidot
老王点评:谁能想到,当年流行的 Subversion 等版本控制系统都被 Git 所取代了。想想,Linus 真是天命之子啊。