GitHub 发布的文章

又是一年,GitHub 例行发布了 2017 年度的章鱼猫观察报告。以下我们撷取此报告中一些有趣的结果分享给大家。

数百万的开发人员使用 GitHub 来共享代码和构建业务。在这里你可以完成你的工作、打造新的技术、贡献给开源项目等等。历史已经证明,当好奇的人聚集到一起工作,一些美好的事情就会随之而来:工作进行得更快、新的想法涌现,从根本上改变了我们建立软件的方式。

为了庆祝这贡献和辉煌的一年, 让我们回顾一下 2017 年的项目、人员和团队。

十年千万,遍及全球

过去这十年,GitHub 各项数据已经超过了百万级,甚至千万级。在 2017 年,GitHub 社区有 2400 万开发者工作于 6700 万个仓库上,就连这些开发者组成的组织都达到了 150 万个。

而这些开发者遍及全球:亚洲 710 万,北美 590 万,欧洲 530 万,等等。

这一年,忙碌的一年

人们在 2500 万个公开仓库上分享代码。从 2016 年 9 月到现在的一年间:

  • 公开仓库的提交数达到了 1 亿个
  • 活跃仓库有 2530 万个(“活跃”指该仓库有公开的活动,比如提交、星标、讨论等)
  • 活跃 工单 issue 有 1250 万个,关闭(解决)了 6880 万个工单,对工单进行了 140 万次讨论

  • 新 PR ( 拉取请求 pull request )有 130 万个,

  • 第 1 亿个 PR 被合并,这是一个 OpenShift 的文档更新
  • 对代码进行了 62 万次审查
  • 最流行的表情符是:点赞(720 万)
  • 新加入 670 万开发者,其有 100 万的开发者来自美国,69 万来自中国

    • 这些新加入的开发者发起了 120 万个 PR,410 万人创建了其第一个仓库,
    • 19 万人没有提交任何代码而只是复刻和星标了仓库
  • 创建了 45 万个组织

    • 这其中包括 Python 的开发也迁移到了 GitHub

编程语言,各就其位

通过 PR 所使用的语言,可以发现最流行的语言是——JavaScript!而 Python 取代了 Java 成为了第二名。很高兴 Ruby 和 PHP 分别能取得第四、第五名。其余的名次和去年相差不大。

项目排名,众望所归

从这些活跃的仓库中,我们找出了 10 大 复刻 fork 数最多的仓库。人工智能方向的 TensorFlow 项目夺得桂冠,前端方向的 BootStrap 是第二。尤雨溪的 vuejs 排名第六,恰恰比排名第七的 Facebook 的 react 的复刻数高一点,很难说这与今年 Facebook 对 react 的许可证问题有没有关系。而 Linus 的 Linux 项目敬陪末座,作为这样庞大的一个项目,已经相当了不起了。

(这里没有包括 MOOC 课程,一个 Coursera 的 R 语言课程有数千的复刻数,以此判断,至少有十万学生开始学习该课程了)

而以贡献者来说,微软的 vscode 项目的贡献者最多,几乎是排在第二名的 react-native 的两倍。这一方面证明了社区对 vscode 的喜爱,另外一方面也证明了微软在开源方面的重注投入。

得到最多代码评议的项目是 Typescript 的一个类型定义库 DefinitelyTyped,第二名才是炙手可热的 Kubernetes

当然,已经赢得了容器编排系统之战的 Kerbernetes 取得讨论最多的排名一点也不令人意外,它的讨论数量的零头就和第二名 origin 差不多,而这个 OpenShift 下的 Origin 项目,也是一个 Kubernetes 项目——面向开发者的企业版 Kubernetes 发行版。

企业版,大公司多用

GitHub 虽然对个人的公开使用提供免费的服务,当然,如果你想放私有仓库,是要交费的。而 GitHub 对于或大或小的企业来说,更适用的是其企业版。

  • 美国前一百个最大的公司(按收入)有一半在使用 GitHub 企业版
  • 虽然美国是使用 GitHub 企业版最多的国家,但是也有 1/4 的客户来自其它国家
  • 不仅仅是软件和互联网行业在使用 GitHub 企业版(占 22%),金融服务、商业服务也占比较高

感谢你,让我们期待 2018 年的章鱼猫报告!

GitHub 又发布了一年一度的章鱼猫观察报告。在这个报告中,分别对开源和社区做了一些有趣的统计,现将其中一些有趣的数据和趋势撷取出来分享给大家。完整的报告请移步此处

GitHub 上最流行的开源项目

让阿波罗 11 号登月的代码开源课程,过去十二个月中,GitHub 上又涌现了一大批开源项目。以下是最流行的(得到星标最多)项目:

最流行的开源项目

其中使用最多的开源许可证是:MITApache-2.0GNU General Public License v3.0

GitHub 上最爱用的编程语言

GitHub 上存放的开源项目使用了多达 316 种不同的编程语言,其中在过去十二月中提交的 PR( 拉取请求 Pull Request ,用于向项目提交补丁) 使用最多的前 15 种编程语言是(其中的数字是 PR 数量):

PR 中最流行的 15 种语言

PR 中最流行的语言居然是 JavaScript,是因为 JavaScript 比较容易么?而且 JavaScript、C# 和 Go 语言的 PR 增长率达到了两倍,甚至,Swift 和 TypeScript 虽然总量不多,但是增长率达到了 3.5 倍。

贡献者的活跃程度

活跃 Active ”是指有过代码提交、写了备注、被星标和 问题汇报 issue 等行为。

这十二个月以来,有 580 万以上的活跃用户、33 万以上的活跃组织、1.9 亿以上的活跃仓库、1 千万以上的活跃问题汇报。

贡献者 contributors ”是指对项目/仓库推送了代码、对打开或评论了问题和 PR 的人,按照贡献者对项目和组织进行排名:

开源贡献者最多的前十个仓库

其中贡献者最多的仓库是 Font-Awesome 项目,这是一个图标字体的项目,不太理解为何有这么多的贡献者。其次是 dockernpm

开源贡献者最多的组织

开源贡献者最多的组织是微软,超过了 Facebook、docker,以及谷歌。看来微软这一年确实是在开源方面下了死力。

被最多分支的仓库

仓库被 分支 fork 的越多代表了对它感兴趣、甚至会参与到开发中的人越多。这个排名第一的 datasharing 是个啥项目,我去看看——居然是一篇文章……好吧,让我看看第二个 Spoon-Knife,这,是章鱼猫的一个教人如何分支仓库的例子……那么第三个 ProgrammingAssignment2 ,哎,也是一个课程上用的例子……

好吧,我收回之前对分支的看法,就不能有个“正常”点的仓库嘛?

还好,第四 bootstrap 和第五 tensorflow 都是比较正常的开源项目。总之,项目流行不流行,不要看分支数量了。

被最多用户评审过代码的仓库

这里的 代码评审者 reviewers 指的是对修改过的代码进行过评论的人,这也代表贡献者对仓库的关注度。好吧。我除了对第一名 homebrew 有点不解,其它的几名都觉得还算正常。

GitHub 的新增用户

GitHub 已经有超过 520 万的用户和超 30 万的组织。这十二月以来,有超过 81 万的人发起了人生第一个 PR,更有 280 万人创造了他自己的第一个仓库。

新用户注册增长最多的国家

而中国,是新用户注册增长最多的国家,基本上翻了一番。

GitHub 上的组织

GitHub 上已经有超过 8 千万的 PR,而这些 PR 中有超过 85% 的来自于组织。在 GitHub 上以组织形式活动的除了商业性组织以外,很多大公司也在其企业的开发中采用了 GitHub Enterprise ,其中不乏财富50强里面公司。

总结

报告就解读到这里,详细的图文并茂的报告,请移步 GitHub