标签 Facebook 下的文章

我把自己的社交网络写进 FOAF 文件,这就是变革之始。—— 互联网之父蒂姆·伯纳斯·李(2007)

FOAF 标准( 朋友的朋友 Friend of a Friend ),是一个可以追溯到本世纪初的网络标准,目前它基本上已经不再使用了,或者说被人们忘记了,亦或者说已经被取代了 [1] 。它暗示了,假如 Facebook 没有征服世界的话,FOAF 将会定义我们今天所用的社交网络。不过在开始探讨这一网络标准之前,我想先来谈一谈纽约地铁。

目前,纽约地铁的唯一管理机构是 大都会运输署 Metropolitan Transportation Agency (简称 MTA)。MTA 垄断了纽约市的地铁交通。在纽约乘地铁必须先从 MTA 购买车票,否则属于非法行为。也就是说,MTA 在地铁行业没有任何竞争对手。

不过,以前可不是这样。说起来可能有些让人吃惊,纽约市的地铁交通曾由两家企业相互竞争,共同运营。 跨区捷运公司 Inter-borough Rapid Transit Company (IRT)的势力范围是穿过曼哈顿的线路, 布鲁克林-曼哈顿运输股份有限公司 Brooklyn-Manhattan Transit Corporation (BMT)管理的则是布鲁克林区内的线路,其中也有部分线路延伸到了曼哈顿。1932 年,纽约市开通使用了自己的服务,称为独立地铁系统,与 IRT 和 BMT 展开竞争,所以当时纽约共有三家不同公司控制着市内地铁交通。

可能会有人觉得这样的地铁运营效率不高。事实上也确是如此。由于 IRT 和 BMT 投入使用的列车宽度不同,所以在不同的运营系统之间建造换乘站十分困难。此外,乘客换乘时还需向不同的运营商支付费用,这就意味着在换乘站至少要设置两个不同的检票区域。后来,纽约市于 1940 年接管了 IRT 和 BMT,将整个纽约市的地铁交通置于一家运营商的管理之下,不过由于此前分而治之而造成的效率低下问题时至今日依然存在:能在 BMT 的线路上(如 A、C、E 号线)运行的列车无法在 IRT 的线路上(如 1、2、3 号线)运行,因为 IRT 的线路隧道比较窄。因此,MTA 不得不同时管理这两种互不兼容的列车系统,由此带来的支出可能远比世界上其他单一隧道宽度的地铁系统要多得多。

IRT 和 BMT 之间的竞争所造成的历史遗留问题告诉我们,地铁系统本身就趋向于垄断经营。相比较于两家运营商相互竞争,只有一家运营商更能解决问题。乘客们虽然失去了选择的余地,但再也不用担心带了一张地铁卡却忘记了另一张的问题。

那么,地铁和社交网络又有什么关系呢?我在想,Facebook 是否和 MTA 一样都有自然垄断的属性呢?事实上,无论是自然垄断还是非自然垄断,Facebook 貌似确有垄断能力。当然它垄断的不是社交媒体本身(我在 Twitter 上面花的时间更多),而是垄断了与现实中认识的人之间的线上联系。Facebook 能够垄断所谓的“社交图谱”;如果我不用担心会失去与别人的联系方式,那我明天就会卸载 Facebook。我对 Facebook 对我身上的这种垄断权力感到非常气愤。不过,我却不会生 MTA 的气,即便从字面上和隐喻上来讲,纽约市地铁都是一堆焚烧着的、火舌乱窜的垃圾。说到底,我愤怒是因为我觉得不同于 MTA 的自然垄断,Facebook 的垄断属于非自然垄断。

我的意思是,如今 Facebook 之所以能拥有所有人的社交数据,因为它碰巧是第一个做大做强、确立巨头地位的社交平台,而不是因为其他社交平台难以或者无法与之竞争。不过,难道真是因为这样吗?许多事实告诉我们,原因并非如此。Facebook 仅仅是先入为主,还是它提供的服务真的比其他社交平台要好?如果你想联系老朋友,只有 Facebook 这一个平台的话,不会方便许多吗?在一个有几个 “Facebook” 相互竞争的情况下,如果你和你男朋友 Facebook 上面的感情状态都显示“交往中”,但是他始终没来得及更新他在 VisageBook 上的感情状态,那上面现在还显示着他和他大学前任的关系,那么这种情况意味着什么呢?人们信任的又是哪个社交网站呢?如果社交网站有很多,难道在填写信息上面不会很耗时间吗?

过去几年,由于中心化社交网络的缺陷暴露出来,许多人尝试构建去中心化的平台。基于开放标准,去中心化平台有望建立互通的社交网络生态(比如 Fediverse)。可惜的是,其中没有一个平台能够取代主流社交网络。一个比较明显的原因是 网络效应 network effects 的力量:既然每个人都在用 Facebook,那么任何想要放弃 Facebook 的人都将会付出巨大的代价。有人会说,这一点恰恰证明了社交网络属于自然垄断行业。但我想说,Facebook、Twitter 等平台是自己选择封闭起来的。此外,鉴于人们已经设想出社交网络的互通性,并且付诸实践,那么封闭的社交平台引发的网络效应就无法证明社交网络具有自然垄断属性。

因此,在我看来,真正的问题是:之所以 Facebook 等平台到现在仍是主流社交网络,仅仅是因为网络效应,还是说与只有一家运营商的地铁系统一样,单一的主流社交网络效率更高?

最后,这些问题让我想起了 FOAF。尽管人们似乎已经忘记了 FOAF 标准,但是早在 Facebook 出现之前,人们就尝试使用 FOAF 建立开放的、去中心化的社交网络。如果过去有哪个去中心化社交网络有机会早于 Facebook 占领如今它驻守的阵地,那只可能是 FOAF。考虑到世界上大部分人都有 Facebook 账号,而且了解 FOAF 的人相对较少,我们是否可以得到如下结论:同地铁一样,社交网络也有中心化和自然垄断的性质;亦或者,FOAF 项目说明,尽管去中心化社交网络可行,但由于其他原因,无法获得人们的广泛支持。

早期社交媒体的未来

FOAF 项目诞生于 2000 年,旨在建立一套表示个人身份以及人与人之间关系的通用标准。在今天看来,这一雄心勃勃的项目可能会让人感到惊讶,但是在上世纪末本世纪初,这样的想法再寻常不过了。当时 网络 Web (当时人们仍然这样称呼它)刚刚击败了 美国在线 America Online Prodigy) 等封闭系统。这让人很自然地想到,计算机领域的创新发展必须要保持开放、基于标准,而且这也正是网络的特点。

许多人认为,网络下一场重头戏会是 语义网 Semantic Web 。我有篇文章介绍了关于语义网概念与运行原理的设想,所以这里不再赘述。但是我会简单谈谈推动人们研究语义网技术的愿景,因为 FOAF 标准正是这一愿景在社交网络方面的应用。

一篇题为 《 谷歌如何击败亚马逊和易贝,朝着语义网进军 How Google beat Amazon and Ebay to the Semantic Web 》 的文章很好地描绘了语义网这一崇高理想。文章写于 2002 年,作者是 Paul Ford。这篇文章设想了 2002 年至 2009 年的情景:通过使用语义网,谷歌取代了亚马逊和易贝,成为电商平台主导者。文章指出,在未来,如果你想买东西,比如说一把二手的马丁吉他,可以在谷歌中输入 buy:martin guitar。根据你的邮编,谷歌会告诉你附近哪些人在卖马丁吉他。谷歌之所以可以获取卖家及其吉他的信息,是因为它可以读取资源描述框架标记语言(RDF),该语言是语义网的核心技术,用于描述资源之间的关系。人们可以将 RDF 内容嵌入网页,能实现很多用途,比如给要卖的东西打广告。Ford 预测,随着使用这种方式搜索和售卖商品的人数增加,亚马逊和易贝将失去它们在电商领域近乎垄断的地位。如果可以搜索全网,又有谁会执着于某个封闭的数据库呢?Ford 写道,即便是谷歌,最终也会失势。因为理论上,任何一个人都可以检索网络,查阅 RDF,提供类似于谷歌的搜索功能。起码,如果谷歌打算对语义网上的每笔交易按一定比例收取费用,以此盈利,那么以后随着相关竞争越来越激烈,谷歌的抽成比例很有可能会被迫降低。

Ford 所设想的未来是将 RDF 应用于电商领域,不过 RDF 更振奋人心的地方在于,它或许可以应用于各个领域。RDF 标准以及一系列相关标准,一旦得到广泛应用,被认为可以掀开基于数据库的软件服务的发展,如同 HTML 为文档出版带来新的发展契机一般。

RDF 以及其他语义网技术似乎准备立刻接管的另一个领域是社交网络。FOAF 项目最初的名字是“ RDF 网络环 RDF Web Ring ”,是语义网发展的产物,旨在实现语义网的设想。FOAF 自诞生之初就被人们看好,有人甚至认为,FOAF 必定会淘汰掉其他社交网站。2004 年《卫报》的一篇文章这样介绍该项目:

最初是 1996 年,SixDegrees 开始运营;接着是去年,出现了 Friendster;上周是 Orkut;下周 Flickr 也会登上舞台。这些网站不胜枚举,都是为了建立社交网络。如今,它们处在互联网发展的最前沿。但是,如果它们无法提供更实质性的好处,在 FOAF 标准得到广泛应用之后,它们就会很难存活下去。 [2]

文章继续指出,社交网络面临的最大问题就是社交网站数量过多。这就需要一种能够将所有这些网站连接起来的手段。可行方案就是 FOAF ,它终将变革整个社交网络。

根据该文章,FOAF 可将不同的社交网站紧密连接起来,实现途径有三个要点:

  • FOAF 将创建机器可读的社交数据格式,可为各个社交网站识别读取,避免让用户在不同的网站上重复输入信息。
  • FOAF 标准下, 联系人 Contacts (个人信息管理程序)可生成上述格式的文件,供用户在各社交网站使用。
  • FOAF 标准下,这种机器可读的文件可寄放在个人主页上,可为各社交网站读取。这样一来,用户只需将修改过的信息推到自己的主页,其他平台就会同步更新。

在今天可能难以想象,但在 2004 年,至少在熟悉技术的网民和技术专栏记者看来,当时社交网络并不算少,但是每个网络的用户群体都很小。考虑到这个问题,虽然对现在的我们来说很陌生,我们就会明白为什么需要建立单一标准是有意义的,这个标准可以使网络的激增不再是一个负担。

FOAF 规范

根据 FOAF 项目官网现有的介绍,FOAF 是“一种计算机语言,用于生成与人相关的各种条目的字典,条目以结构化数据的形式储存”。2000 年,FOAF 的创始人 Dan Brickley 和 Libby Miller 发表了一份关于该项目目标的文件,给出了不同的解释,强调了 FOAF 的最终目标:作为工具,FOAF 可让计算机像人类一样读取用户主页的个人信息 [3] 。FOAF 将会“帮助网络提供当前只有中心化平台才能提供的服务” [4] 。通过为个人以及人际关系定义一个标准词汇,FOAF 可以理解用户输入的内容,比如“找找今天推荐的医院医疗人员”,或者“找找曾与我合作撰写过文件的人最近发表的文章”。

由于 FOAF 是标准化的词汇表,所以该项目最重要的成果莫过于 FOAF 规范。FOAF 规范规定了 RDF 类 和 RDF 属性(这里我不再解释什么是 RDF,如果感兴趣可查阅 我关于语义网的文章)。RDF 的类由 FOAF 规范规定,表示要描述的对象,比如人(Person 类)和组织(Organization 类)。RDF 属性由 FOAF 规范规定,表示针对不同对象所做的逻辑声明。例如,一个人可以有一个名字(givenName 属性)、一个姓氏(familyName 属性),可能还有人格类型(myersBriggs 属性)以及与他人的距离或者位置信息(based_near 属性)。FOAF 规范的思想是,这些类和属性要足以表示人们在个人主页上显示的身份信息和朋友信息。(LCTT 译注:Myers–Briggs 即迈尔斯布里格斯类型指标,是一种人格类型理论模型。)

FOAF 规范给出了一份 FOAF 文档的范例。该实例的格式是 XML,不过也可以使用 JSON 等格式进行编写:

<foaf:Person rdf:about="#danbri" xmlns:foaf="http://xmlns.com/foaf/0.1/">
  <foaf:name>Dan Brickley</foaf:name>
  <foaf:homepage rdf:resource="http://danbri.org/" />
  <foaf:openid rdf:resource="http://danbri.org/" />
  <foaf:img rdf:resource="/images/me.jpg" />
</foaf:Person>

这份 FOAF 文件对一个人进行了描述,他的名字叫做 Dan Brickley(该规范的作者之一),他的主页在 http://danbri.org,他还有个叫做“open ID”的东西,还有一张图片在 /images/me.jpg —— 估计是 Brickley 的主页地址的相对链接。FOAF 的元素名称都会有 foaf: 前缀,表示它们是 FOAF 命名空间的一部分。相应地,RDF 的元素名称前面也都会有 rdf:

为了说明 FOAF 不限于 XML 格式,这里从维基百科摘取了一个相似的例子,格式为 JSON-LD [5]

{
  "@context": {
    "name": "http://xmlns.com/foaf/0.1/name",
    "homepage": {
      "@id": "http://xmlns.com/foaf/0.1/workplaceHomepage",
      "@type": "@id"
    },
    "Person": "http://xmlns.com/foaf/0.1/Person"
  },
  "@id": "https://me.example.com",
  "@type": "Person",
  "name": "John Smith",
  "homepage": "https://www.example.com/"
}

上面这份 FOAF 文件也描述了一个人,他的名字叫 John Smith,他的主页在 www.example.com

理解 FOAF 原理的最好方法可能就是体验一下 FOAF-a-matic,一个在线生成 FOAF 文档的工具。你可以在工具页面的表单里输入自己的相关信息,创建表示自己的 FOAF 文档(XML 格式)。FOAF-a-matic 说明了 FOAF 是如何避免在注册不同社交网站账号时重复输入社交信息的麻烦:如果每个社交网站都可以读取 FOAF,你只需要在没有注册过帐号的网站上引用你在 FOAF-a-matic 生成的 FOAF 文档,就可以注册一个新帐号了。

下面这个实例是我用 FOAF-a-matic 生成的稍微复杂一些的例子,表示我自己:

<rdf:RDF
      xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
      xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
      xmlns:foaf="http://xmlns.com/foaf/0.1/"
      xmlns:admin="http://webns.net/mvcb/">
  <foaf:PersonalProfileDocument rdf:about="">
    <foaf:maker rdf:resource="#me"/>
    <foaf:primaryTopic rdf:resource="#me"/>
    <admin:generatorAgent rdf:resource="http://www.ldodds.com/foaf/foaf-a-matic"/>
    <admin:errorReportsTo rdf:resource="mailto:[email protected]"/>
  </foaf:PersonalProfileDocument>
  <foaf:Person rdf:ID="me">
    <foaf:name>Sinclair Target</foaf:name>
    <foaf:givenname>Sinclair</foaf:givenname>
    <foaf:family_name>Target</foaf:family_name>
    <foaf:mbox rdf:resource="mailto:[email protected]"/>
    <foaf:homepage rdf:resource="sinclairtarget.com"/>
    <foaf:knows>
      <foaf:Person>
        <foaf:name>John Smith</foaf:name>
        <foaf:mbox rdf:resource="mailto:[email protected]"/>
        <rdfs:seeAlso rdf:resource="www.example.com/foaf.rdf"/>
      </foaf:Person>
    </foaf:knows>
  </foaf:Person>
</rdf:RDF>

本例中,主要信息之前有很多其他内容,用于设置文档使用的各种 XML 命名空间。其中就有文档生成工具的信息,这样用户就能明白出了问题要向谁进行反馈。foaf:Person 元素给出了我的名字、电子邮箱和主页。其中嵌套了 foaf:knows 元素,说明我有个叫 John Smith 的朋友。

该例还体现了 FOAF 文档的另外一个重要功能:相互关联。还记得之前 John Smith 的例子吗?他的主页在 www.example.com。在我的这个例子中,我将 John Smith 列在了 foaf:person 元素里,上一级元素是 foaf:knows,表示我认识的人。此外,我还加入了 rdfs:seeAlso 元素,放了 John Smith 主页的 FOAF 文档链接。由于加入了这一链接,程序在读取我的 FOAF 文档时,就能根据该链接读取他的 FOAF 文档,查找到更多关于 John Smith 的信息。在之前 John Smith 的 FOAF 文档里,John 并没有提供任何有关朋友的信息(包括我在内),这意味着程序无法确定我们两人之间的朋友关系。但如果他加入了朋友信息,程序在读取我的文档之后,不仅会发现我,也会发现 John、他的朋友、他的朋友的朋友,以此类推,直到程序穷尽我和 John 各自的社交图谱。

对于使用过 Facebook 的人来说这似乎很熟悉,也就是说,这个功能对你来说也应该很熟悉。FOAF 没有 foaf:wall 属性和 foaf:poke 属性,无法完美复制 Facebook 的功能。很明显,FOAF 也没有漂亮的蓝色界面,无法为用户提供可视化的 FOAF 社交网络,它只是一个词汇表。不过,Facebook 的核心功能(我认为这正是 Facebook 垄断能力的关键)在这里是以分布式的方式提供的。在 FOAF 标准下,好友可以将 FOAF 文档上传至个人主页,数字化展示他们真实的社交图谱,用户无需将个人数据的控制权交给 Facebook 这样一个中心化的数据库。要知道,由于对用户个人数据管理不当,扎克伯格大多数时间都在国会委员会前在向公众道歉。

暂时搁置的 FOAF

浏览 FOAF 项目主页,你会发现在页面的右上角,有一张喜剧动画《 飞出个未来 Futurama 》主角弗莱躺在休眠舱内的图片。这张图片是《飞出个未来》试播剧集的剧照,讲的是弗莱在 1999 年不小心跌进了低温休眠舱,直到 2999 年才再次苏醒过来的故事。我曾和 Brickley 在 Twitter 上简短地聊了一下,他告诉我,挂这张图片是为了告诉人们,未来 FOAF 项目目前“处于停滞状态”,尽管他希望将来有机会恢复这个项目,继续探索 21 世纪初关于网络运作方式的设想。

FOAF 从未像《卫报》期望的那般彻底改变社交网络。一些社交网站选择支持 FOAF 标准,比如 LiveJournal 和 MyOpera [6] 。FOAF 甚至还在 2004 年 霍华德·迪恩 Howard Dean 竞选总统时发挥了一定作用:一群博主和程序员合力搭建起了一个将网站连接起来的网络,称其为“ 迪恩空间 DeanSpace ”,帮助迪恩竞选,并在网站上使用 FOAF 记录迪恩的支持者和帮助迪恩竞选的志愿者 [7] 。不过,今天人们了解到 FOAF 主要还是因为它是 RDF 应用最为广泛的词汇表之一,而 RDF 正是现代网络的一个重要标准。如果在今天还能用到 FOAF 的话,可能就是谷歌“ 知识面板 knowledge panels ”所用技术的原型。知识面板是在用谷歌搜索时,出现在搜索结果右侧的一小块内容,会提供搜索关键词的基本信息。谷歌为推行其知识面板,使用了语义网项目的“后继者” schema.org 项目发布的词汇表 [8] schema.org 用来描述人物的词汇表似乎有着 FOAF 的影子,两者的目的大多也是相同的。

那么,为什么 FOAF 还是失败了呢?为什么人们都在用 Facebook 呢?且不提 FOAF 只是一个简单的标准,没有 Facebook 那么丰富的功能,如果 FOAF 发展势头保持下去,很有可能就会出现相关软件和应用,带来像 Facebook 那样的体验。问题是,在 Facebook 还未发展到能与之分庭抗礼之时,FOAF 这股分布式社交网络的新生力量为什么没能得到广泛应用呢?

恐怕这个问题可能没有唯一的答案,不过非要我说的话,我觉得最关键的一点是,只有在每个人都有个人网站的情况下,FOAF 才有意义。在上世纪末本世纪初,人们理所当然地觉得网络最终会出现这种情况,因为就我所知,互联网的早期用户多是高产的博客写手、参政的技术专家,他们都希望能有个自己的平台。但是,现实情况却是,普通用户并不愿意学习怎么搭建和运营网站。FOAF 允许你掌控自己的社交信息并将其推送到各类社交网络上,省去了到处注册账号的麻烦。如果你已经有了储存社交信息的个人网站,那么这个想法应该很诱人。但实际上,相比较于买域名、折腾 XML 文档,大多数人觉得填写信息、注册 Facebook 账号来得更容易些。

那么,这与我最初的问题(Facebook 是否属于自然垄断)有什么相关呢?我不得不承认,FOAF 的案例说明,社交网络 的确 拥有自然垄断属性。

其实,关于用户不愿管理自己的数据这一问题,本身并没有那么重要,因为通过让普通用户在熟悉技术的用户所设置的节点上储存个人信息,Mastodon) 等现代分布式社交网络已经解决了这个问题。这也表明,人们多么不愿意折腾复杂的东西。对去中心化社交网络来说,这无疑是个坏消息,因为相较于中心化网络,去中心化网络更为复杂,用户对此再清楚不过了。

对于 FOAF:如果我要写一个能读取个人网站上 FOAF 数据的程序,假设 Sally 的 FOAF 文档提到了 John Smith,说他的主页是 example.com;Sue 的 FOAF 文档也提到了 John Smith,说他的主页是 example.net。在这种情况下,我应该怎么办呢?到底是只有一个 John Smith 而他正好有两个主页呢,还是这两个 John Smith 是不同的人呢?如果两个 FOAF 文档中 John Smith 的邮箱都是 [email protected],又该怎么办呢?这种身份问题是 FOAF 的软肋。在一封 2003 年的邮件里,Brickley 写道,由于不存在而且可能也不应该存在一个“全球性的身份识别系统”,FOAF 采取的方法只能是“多元的” [9] 。FOAF 用户的邮件地址和主页地址等部分属性具有特殊性,因为邮件地址和主页地址都是独一无二的。因此,这些内容不可能相同的属性可以将人们的多个 FOAF 文档合并起来(用 Libby Miller 的话来说,“挤”在一起)。不过这些特殊属性不存在所谓优先级的说法,所以前面 John Smith 的问题还是不好解决。换句话说,是该相信主页,判定他们不是同一个人呢?还是要相信邮件地址,判定他们是同一个人呢?我真的能够在不干扰到用户的前提下,写出一个程序,解决这类问题吗?

Facebook 拥有单一的数据库,不用顾虑政治性问题,有条件创建“全球性的身份识别系统”,给每个人发行独一无二的身份 ID,于是问题就迎刃而解了。

如果人们真的在乎对自己数据的持有权和掌控权,单是因为复杂难解应该不足以导致分布式社交网络的失败。但是 FOAF 的失败表明,人们从未重视过对自己数据的掌控权。正如一位博主所说,“所谓‘用户想要拥有自己的数据’只不过是一个想法,和实际应用没有关系” [10] 。如果用户对控制的重视程度不足以承受额外的复杂性,如果中心化系统比去中心化系统更为简单易用,如果中心化系统有发展为封闭系统的趋向,借此取得成功,从而享受网络效应带来的巨大效益,那么社交网络确实属于自然垄断。

即便如此,我认为地铁系统的案例和社交网络的案例仍存在不同之处。我可以欣然接受 MTA 对地铁交通的垄断,因为我希望地铁系统本身就应该是长期垄断行业。如果纽约地铁只有一家运营商,那么它只能是政府,至少在名义上,政府比没有竞争对手的私企更加负责。但是我却不希望社交网络属于自然垄断。地铁建好了基本上就是一成不变的,但数字世界却在不断演变发展。在今天,分布式社交网络也许比中心化网络更加复杂,就好比带两张地铁卡总是比只带一张要麻烦的多。不过,在未来,互联网会发生根本性变革,那时分布式技术将会更易于使用。

如果未来果真如此,FOAF 可能会作为建立分布式社交网络的第一次尝试为人们记住。在企业大型数据库所驱动的中心化网络时代结束之后,分布式网络将会得到人们的长期青睐。

如果你喜欢这篇文章,欢迎关注推特 @TwoBitHistory,也可通过 RSS 馈送 订阅,获取更多最新文章。


  1. 请注意,这里我没有用“消亡”一词。 ↩︎
  2. Jack Schofield, “Let’s be Friendsters,” The Guardian, February 19, 2004, accessed January 5, 2020, https://www.theguardian.com/technology/2004/feb/19/newmedia.media. ↩︎
  3. Dan Brickley and Libby Miller, “Introducing FOAF,” FOAF Project, 2008, accessed January 5, 2020, https://web.archive.org/web/20140331104046/http://www.foaf-project.org/original-intro. ↩︎
  4. 同上。 ↩︎
  5. Wikipedia contributors, “JSON-LD,” Wikipedia: The Free Encyclopedia, December 13, 2019, accessed January 5, 2020, https://en.wikipedia.org/wiki/JSON-LD. ↩︎
  6. “Data Sources,” FOAF Project Wiki, December 11 2009, accessed January 5, 2020, https://web.archive.org/web/20100226072731/http://wiki.foaf-project.org/w/DataSources. ↩︎
  7. Aldon Hynes, “What is Dean Space?”, Extreme Democracy, accessed January 5, 2020, http://www.extremedemocracy.com/chapters/Chapter18-Hynes.pdf. ↩︎
  8. “Understand how structured data works,” Google Developer Portal, accessed January 5, 2020, https://developers.google.com/search/docs/guides/intro-structured-data. ↩︎
  9. tef, “Why your distributed network will not work,” Progamming is Terrible, January 2, 2013, https://programmingisterrible.com/post/39438834308/distributed-social-network. ↩︎
  10. Dan Brickley, “Identifying things in FOAF,” rdfweb-dev Mailing List, July 10, 2003, accessed on January 5, 2020, http://lists.foaf-project.org/pipermail/foaf-dev/2003-July/005463.html. ↩︎

via: https://twobithistory.org/2020/01/05/foaf.html

作者:Two-Bit History 选题:lujun9972 译者:aREversez 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

Facebook 创始人年轻时也曾宣誓捍卫用户隐私

2003 年 Slashdot 曾经 报道,哈佛大学新生扎克伯格和加州理工新生丹吉洛开发了一个系统,可以分析用户的音乐播放列表并学习人们的收听模式。这个制作播放列表的软件是他们的高中毕业项目。这篇帖子引起了微软和其他公司的注意,有公司给出了一份接近一百万美元的报价,但他们拒绝了。有趣的是,在该帖子的一个评论中,后来成为 Facebook 创始人的扎克伯格曾发誓要保护用户隐私,“除了你之外,你的音乐收听数据都不会提供给其他任何人。我们希望利用大量的数据来帮助分析,但你的个人数据将永远不会被其他人看到。”而后来成为 Quora 联合创始人和 CEO 的丹吉洛,也补充说,“我不会向人们发送垃圾邮件。我保证。”

消息来源:Slashdot
老王点评:曾经的年轻人都怀着淳朴的理想,然而成为巨龙之后,都喜欢珠宝。

研究人员发布可以本地运行的 Copilot 替代品

GitHub Copilot 是最近几个在 AI 帮助下生成编程代码建议的工具之一,但在许可证方面和该软件向微软公司发送遥测数据方面存在一些争议。美国纽约大学的一位研究人员开源了一个 Copilot 的替代品 FauxPilot,它可以在本地运行,而不会将数据发送回微软。FauxPilot 不使用 Codex,它依靠的是 Salesforce 的 CodeGen 模型。但该模型也是在 GitHub 所有的公共代码上训练的,因此许可证问题并没有得到解决。当然,你可以使用这个可以本地运行的 AI 模型专门针对某类许可证进行学习,或许针对你自己希望重复使用的代码进行学习。

消息来源:The Register
老王点评:如果计算量可以承受,我想这个开源的 AI 工具或许在某些开发组织里面发挥作用。

OpenSUSE 考虑移除 Reiserfs 文件系统

20 多年前,Reiserfs 首次引入 SUSE 时,它是当时领先的文件系统,首次为 Linux 引入了日志保护。但在 Reiserfs 作者因谋杀罪而入狱后,该文件系统的开发就停滞了。ReiserFS 一度是 SUSE 的默认文件系统。Reiserfs 现在缺乏用户期望拥有的很多功能,SUSE 的开发者制定了在 SUSE 滚动版中立即移除 Reiserfs 的计划,稳定版也将在几个版本后移除支持。而 Linux 内核从 5.18 开始正在逐渐弃用 ReiserFS,并计划在 2025 年完全删除相关代码。

消息来源:Phoronix
老王点评:本来颇有希望的一个文件系统,却中途崩沮。从某种意义上说,现在的很多开源项目还相当依赖其灵魂人物,一旦遇到“被卡车撞了”这样的意外,如果没有及时引起社区关注和接手,很可能就随同夭折了。

Facebook 和 Instagram 或将在欧洲关闭

由于担心美国的监控行为,欧洲法院于 2020 年废除了一项名为“隐私保护”的欧盟-美国数据流动协议。在其裁决中,它还使美国公司用来向美国转移个人数据的另一个法律工具,即标准合同条款(SCC)更难使用。爱尔兰数据保护委员会周四通知其同行,它将阻止 Facebook 将用户数据从欧洲发送到美国。这一草拟的决定意味着 Facebook 也被迫停止依赖 SCC。Meta 公司曾多次警告说,这样的决定将使其在欧洲的包括 Facebook 和 Instagram 在内的许多服务关闭。

消息来源:Politico
老王点评:欧洲人,别怕,你看我们没有这种东西,不是也有别的嘛 :<

Chrome 优化后台页面处理策略,提升笔记本电池时间

Chrome 是耗能大户,因此在笔记本电脑上非常影响电池使用时间。Chrome 在最新的版本中增加了一个新的“快速强化节流”策略。该功能可以在 10 秒后停止后台页面加载 JavaScript 元素,而之前的限制是 5 分钟,并且它将限制唤醒定时任务,最多每分钟 1 次。谷歌称,这有望延长电池使用时长,当所有标签都被隐藏和静止时,CPU 占用有 10% 的改善。该功能过段时间才会进入稳定通道。

消息来源:Tech Radar
老王点评:感觉浏览器技术和 Web 技术无止境啊,Chrome 能占有这么大的市场,可见并非侥幸。

推特每天删除上百万个垃圾账户

之前,马斯克威胁要停止 440 亿美元的收购推特的交易,除非该公司拿出证据,证明垃圾机器人账户占看到广告的用户中不到 5%。推特在周四的一次简报会中说,推特每天删除超过 100 万个垃圾账户。该公司重申,人工审查人员随机检查了数千个账户,并使用公共和私人数据的组合,以计算该比例,在接受广告服务的用户中,垃圾账户远低于 5%。

消息来源:路透社
老王点评:虽然我认为马斯克在玩弄花招,但是要说推特只有 5% 的垃圾机器人账号,我是不信的。

Docker 成为双料独角兽,估值 21 亿美元

消息称,这家长期走入困境的容器化公司今天宣布了 1.05 亿美元的 C 轮融资,使其融资总额达到 1.63 亿美元,公司估值为 21 亿美元。在这次转机之前,Docker 的日子似乎已经屈指可数了,2019 年,Docker 陷入困境,不得不出售其企业部门,更换 CEO,并将自己重新定位为一个开发者平台。两年后,其年度经常性收入增长了 4 倍,达到 5000 万美元以上。Docker 说,近年来它拥有超过 56,000 个商业客户,其中包括超过 70% 的财富 100 强公司、10 家顶级技术公司中的 9 家。

老王点评:我还真以为 Docker 公司就这样消亡了,这样看起来似乎还有不错的未来。

Facebook 因算法漏洞持续半年推送劣质内容

消息称,Facebook 的动态消息由于排序算法存在重大漏洞,过去 6 个月一直推送“劣质”内容,抬高了虚假、暴力信息的权重。虚假信息本来是经过事实核查员审查过的,应该早早得到抑制,但这些信息却四处传播,持续发酵。最终,半年后工程师找到了问题症结。

老王点评:比起通过算法被动接受内容,我觉得主动选择内容更合理。

Chrome 推出新的用户追踪系统

消息称,Chrome 是唯一仍支持第三方 Cookie 的浏览器,在推出 FLoC 用户跟踪系统以取代它失败后,谷歌在其 Canary 测试通道推出了新的 FLEDGE 技术。这个新的 API 允许浏览器基于谷歌创建的广泛主题,建立它认为你感兴趣的东西。该 API 与浏览器直接耦合,似乎没有任何方法可以完全关闭它,唯一的手段可能是不断地从你的个人数据库中删除所有的“兴趣”。谷歌称,在 Chrome 中建立用户跟踪和广告系统是强制性的。

老王点评:显然,谷歌并不热衷于任何威胁其主要赚钱工具的举措。

2046 年的互联网会是什么样子?

以提供“网站时光机”著称的互联网档案馆最近开发了一个未来时光机: Wayforward Machine ,它可以直接“快进”到 2046 年。当然,这只是一个对当前充斥这广告、隐私盗取的互联网的讽刺。

老王点评:你可以在其中输入 URL,然后按回车看看你访问的网站将来会是什么样子?

Facebook 禁用了“一键取关”工具

一位开发了一个让人们自动取消关注 Facebook 上的朋友和团体的工具的开发者说,他的作品已经被这家社交网站永久禁止了。Facebook 允许用户单独取消关注,从而将他们的内容从 Facebook 的算法控制的“消息提要”中删除。而该工具将这一过程自动化,瞬间抹去用户的“新闻源”。作者称,我没有失去什么,因为我仍然可以通过直接进入我最喜欢的朋友页面和群组看到他们。但我却获得了惊人的控制力,我不再被诱惑着向下滚动无限的内容。一夜之间,我的“Facebook 瘾”变得可控了。Facebook 称他创建的软件使用户互动自动化,违反了该网站的服务条款。

老王点评:虽然说干脆删掉 Facebook App 是最好的,但是你这个“一键取关”工具让 Facebook 情何以堪。

谷歌数据中心尝试转向主线内核

谷歌数据中心产品系统运行的内核被称为 Prodkernel,它是基于较旧版本的 Linux 内核,加上谷歌打上的大约 9000 个补丁,补丁包括各种内部 API、硬件支持、性能优化,以及其它必要的微调。每隔两年左右时间,这些补丁会移植到较新版本的内核。但是谷歌发现这种工作模式面临越来越大的挑战。为了解决这个问题,谷歌发起了一个新的内核项目 Project Icebreaker。

老王点评:事实证明,关起门来发展私有分支在 Linux 内核发展迅猛的今天,已经越来越不可行。

Facebook 宕机 6 小时,工程师一度无法远程和现场排除故障

美国东部时间周一上午 11:30 左右,Facebook 旗下的主要应用,包括 Facebook、Instagram、WhatsApp、Messenger 等从互联网上全部消失了 6 个小时左右。据 外界分析,是 Facebook 错误的 BGP 更新导致了问题,并因此阻止了对工程师们远程访问,无法及时进行恢复工作。不仅如此,其内部通信平台 Workplace 也因而下线,使他们之间难以及时联络。甚至工程师们无法接触到受影响的服务器,因为他们的数字身份认证系统同时也停止了工作。

根据 Facebook 二季度的财报,其每小时大约收入 1330 万美元,这意味着该事故导致 Facebook 至少损失了 8000 万美元的收入。并因此导致该公司股票被抛售,股票价格下跌了近 5%。据估计,该事故对全球经济总影响成本约为 9.68 亿美元。

老王点评:网络出问题时,一般都把锅丢给 DNS,但是其实更大的锅往往是 BGP 的,这个协议屡屡造成超大规模的网络问题。

Windows 11 正式发布,微软解释为何限制硬件

微软表示,符合 Windows 11 升级条件的现有 Windows 10 设备将从今天开始能够升级。

关于 Windows 11 最大的争议来自于其对硬件的硬性要求:需要较新的 CPU 和 TPM 2.0。微软对此解释称,“保证所有用户的计算机包含 TPM 也意味着可以确保每个应用程序开发人员现在都可以在硬件中存储证书和密钥。更多的应用程序可以默认支持无密码;更多的应用可以进行数据加密;更多的应用程序可以有零信任保护,因为我们已经有了基于虚拟化的能力来报告他们的完整性。”

此外,关于在 Windows 11 中默认开启的“基于虚拟化的安全”(VBS)功能,微软解释说,“我们从 Windows 10 中学到的是,如果你让安全设定变得可有可无,人们就不会把它们打开。这是一个很大的教训。有鉴于此,我们在 Windows 11 中将默认保护用户的安全。”他们在 Windows 11 中采用了和云计算相同的做法,即使有人获得了最高级别的权限,他们仍然无法读取独立的虚拟机中的内容。

老王点评:虽然我部分认同微软的安全观点,但是我觉得有一层微软没说的意思是,他们想推动人们买新的硬件。

Android 12 正式发布

谷歌宣布,已经将 Android 12 源代码推送到 Android 开源项目(AOSP),这也意味着 Android 12 正式发布。接下来的几周内到今年晚些之后,从 Pixel 开始,三星、一加、OPPO、realme、传音、vivo、小米等品牌设备将陆续升级 Android 12。Android 12 提供了更快、更高效的系统性能,改进了应用程序启动时间并优化了 I/O,以加快应用程序加载速度。此外,还提供了重新设计的小部件,更新了通知设计等界面变化。

老王点评:看来今天都是大消息,不过 Android 12 的影响要几个月甚至更长才能推送到终端用户。