分类技术下的文章

用 Pandoc 生成一篇调研论文

Kiko Fernandez-reyes 发布于 2018-11-01
另请参阅: 技术,Markdown, LaTeX, Pandoc
评论

学习如何用 Markdown 管理章节引用、图像、表格以及更多。

这篇文章对于使用 Markdown 语法做一篇调研论文进行了一个深度体验。覆盖了如何创建和引用章节、图像（用 Markdown 和 LaTeX）和参考书目。我们也讨论了一些棘手的案例和为什么使用 LaTex 是一个正确的做法。

调研

调研论文一般包括对章节、图像、表格和参考书目的引用。Pandoc 本身并不能交叉引用这些，但是它能够利用 pandoc-crossref 过滤器来完成自动编号和章节、图像、表格的交叉引用。

让我们从重写原本以 LaTax 撰写的一个教育调研报告的例子开始，然后用 Markdown（和一些 LaTax）、Pandoc 和 Pandoc-crossref 重写。

添加并引用章节

要想章节被自动编号，必须使用 Markdown H1 标题编写。子章节使用 H2-H4 子标题编写（通常不需要更多级别了）。例如一个章节的标题是 “Implementation”，写作 # Implementation {#sec: implementation}，然后 Pandoc 会把它转化为 3. Implementation（或者转换为相应的章节编号）。Implementation 这个标题使用了 H1 并且声明了一个 {#sec: implementation} 的标签，这是作者用于引用该章节的标签。要想引用一个章节，输入 @ 符号并跟上对应章节标签，使用方括号括起来即可： [@ sec:implementation]

在这篇论文中, 我们发现了下面这个例子：

we lack experience (consistency between TAs, [@sec:implementation]).

Pandoc 转换：

we lack experience (consistency between TAs, Section 4).

章节被自动编号（这在本文最后的 Makefile 当中说明）。要创建无编号的章节，输入章节的标题并在最后添加 {-}。例如：### Designing a game for maintainability {-} 就以标题 “Designing a game for maintainability”，创建了一个无标号的章节。

添加并引用图像

添加并引用一个图像，跟添加并引用一个章节和添加一个 Markdown 图片很相似：

![Scatterplot matrix](data/scatterplots/RScatterplotMatrix2.png){#fig:scatter-matrix}

上面这一行是告诉 Pandoc，有一个标有 Scatterplot matrix 的图像以及这张图片路径是 data/scatterplots/RScatterplotMatrix2.png。{#fig:scatter-matrix} 表明了用于引用该图像的名字。

这里是从一篇论文中进行图像引用的例子：

The boxes "Enjoy", "Grade" and "Motivation" ([@fig:scatter-matrix]) ...

Pandoc 产生如下输出：

The boxes "Enjoy", "Grade" and "Motivation" (Fig. 1) ...

添加及引用参考书目

大多数调研报告都把引用放在一个 BibTeX 的数据库文件中。在这个例子中，该文件被命名为 biblio.bib，它包含了论文中所有的引用。下面是这个文件的样子：

@inproceedings{wrigstad2017mastery,
    Author =       {Wrigstad, Tobias and Castegren, Elias},
    Booktitle =    {SPLASH-E},
    Title =        {Mastery Learning-Like Teaching with Achievements},
    Year =         2017
}

@inproceedings{review-gamification-framework,
  Author =       {A. Mora and D. Riera and C. Gonzalez and J. Arnedo-Moreno},
  Publisher =    {IEEE},
  Booktitle =    {2015 7th International Conference on Games and Virtual Worlds
                  for Serious Applications (VS-Games)},
  Doi =          {10.1109/VS-GAMES.2015.7295760},
  Keywords =     {formal specification;serious games (computing);design
                  framework;formal design process;game components;game design
                  elements;gamification design frameworks;gamification-based
                  solutions;Bibliographies;Context;Design
                  methodology;Ethics;Games;Proposals},
  Month =        {Sept},
  Pages =        {1-8},
  Title =        {A Literature Review of Gamification Design Frameworks},
  Year =         2015,
  Bdsk-Url-1 =   {http://dx.doi.org/10.1109/VS-GAMES.2015.7295760}
}

...

第一行的 @inproceedings{wrigstad2017mastery, 表明了出版物的类型（inproceedings），以及用来指向那篇论文的标签（wrigstad2017mastery）。

引用这篇题为 “Mastery Learning-Like Teaching with Achievements” 的论文, 输入：

the achievement-driven learning methodology [@wrigstad2017mastery]

Pandoc 将会输出：

the achievement- driven learning methodology [30]

这篇论文将会产生像下面这样被标号的参考书目：

引用文章的集合也很容易：只要引用使用分号 ; 分隔开被标记的参考文献就可以了。如果一个引用有两个标签 —— 例如： SEABORN201514 和 gamification-leaderboard-benefits—— 像下面这样把它们放在一起引用：

Thus, the most important benefit is its potential to increase students' motivation
and engagement [@SEABORN201514;@gamification-leaderboard-benefits].

Pandoc 将会产生：

Thus, the most important benefit is its potential to increase students’ motivation
and engagement [26, 28]

问题案例

一个常见的问题是所需项目与页面不匹配。不匹配的部分会自动移动到它们认为合适的地方，即便这些位置并不是读者期望看到的位置。因此在图像或者表格接近于它们被提及的地方时，我们需要调节一下那些元素放置的位置，使得它们更加易于阅读。为了达到这个效果，我建议使用 figure 这个 LaTeX 环境参数，它可以让用户控制图像的位置。

我们看一个上面提到的图像的例子：

![Scatterplot matrix](data/scatterplots/RScatterplotMatrix2.png){#fig:scatter-matrix}

然后使用 LaTeX 重写：

\begin{figure}[t]
\includegraphics{data/scatterplots/RScatterplotMatrix2.png}
\caption{\label{fig:matrix}Scatterplot matrix}
\end{figure}

在 LaTeX 中，figure 环境参数中的 [t] 选项表示这张图用该位于该页的最顶部。有关更多选项，参阅 LaTex/Floats, Figures, and Captions 这篇 Wikibooks 的文章。

产生一篇论文

到目前为止，我们讲了如何添加和引用（子）章节、图像和参考书目，现在让我们重温一下如何生成一篇 PDF 格式的论文。要生成 PDF，我们将使用 Pandoc 生成一篇可以被构建成最终 PDF 的 LaTeX 文件。我们还会讨论如何以 LaTeX，使用一套自定义的模板和元信息文件生成一篇调研论文，以及如何将 LaTeX 文档编译为最终的 PDF 格式。

很多会议都提供了一个 .cls 文件或者一套论文应有样式的模板；例如，它们是否应该使用两列的格式以及其它的设计风格。在我们的例子中，会议提供了一个名为 acmart.cls 的文件。

作者通常想要在他们的论文中包含他们所属的机构，然而，这个选项并没有包含在默认的 Pandoc 的 LaTeX 模板（注意，可以通过输入 pandoc -D latex 来查看 Pandoc 模板）当中。要包含这个内容，找一个 Pandoc 默认的 LaTeX 模板，并添加一些新的内容。将这个模板像下面这样复制进一个名为 mytemplate.tex 的文件中：

pandoc -D latex > mytemplate.tex

默认的模板包含以下代码：

$if(author)$
\author{$for(author)$$author$$sep$ \and $endfor$}
$endif$
$if(institute)$
\providecommand{\institute}[1]{}
\institute{$for(institute)$$institute$$sep$ \and $endfor$}
$endif$

因为这个模板应该包含作者的联系方式和电子邮件地址，在其他一些选项之间，我们更新这个模板以添加以下内容（我们还做了一些其他的更改，但是因为文件的长度，就没有包含在此处）：

latex
$for(author)$
    $if(author.name)$
        \author{$author.name$}
        $if(author.affiliation)$
            \affiliation{\institution{$author.affiliation$}}
        $endif$
        $if(author.email)$
            \email{$author.email$}
        $endif$
    $else$
        $author$
    $endif$
$endfor$

要让这些更改起作用，我们还应该有下面的文件：

main.md 包含调研论文
biblio.bib 包含参考书目数据库
acmart.cls 我们使用的文档的集合
mytemplate.tex 是我们使用的模板文件（代替默认的）

让我们添加论文的元信息到一个 meta.yaml 文件：

---
template: 'mytemplate.tex'
documentclass: acmart
classoption: sigconf
title: The impact of opt-in gamification on `\\`{=latex} students' grades in a software design course
author:
- name: Kiko Fernandez-Reyes
  affiliation: Uppsala University
  email: [email protected]
- name: Dave Clarke
  affiliation: Uppsala University
  email: [email protected]
- name: Janina Hornbach
  affiliation: Uppsala University
  email: [email protected]
bibliography: biblio.bib
abstract: |
  An achievement-driven methodology strives to give students more control over their learning with enough flexibility to engage them in deeper learning. (more stuff continues)

include-before: |
      \` ``{=latex}
      \copyrightyear{2018}
      \acmYear{2018}
      \setcopyright{acmlicensed}
      \acmConference[MODELS '18 Companion]{ACM/IEEE 21th International Conference on Model Driven Engineering Languages and Systems}{October 14--19, 2018}{Copenhagen, Denmark}
      \acmBooktitle{ACM/IEEE 21th International Conference on Model Driven Engineering Languages and Systems (MODELS '18 Companion), October 14--19, 2018, Copenhagen, Denmark}
      \acmPrice{XX.XX}
      \acmDOI{10.1145/3270112.3270118}
      \acmISBN{978-1-4503-5965-8/18/10}

      \begin{CCSXML}
      <ccs2012>
      <concept>
      <concept_id>10010405.10010489</concept_id>
      <concept_desc>Applied computing~Education</concept_desc>
      <concept_significance>500</concept_significance>
      </concept>
      </ccs2012>
      \end{CCSXML}

      \ccsdesc[500]{Applied computing~Education}

      \keywords{gamification, education, software design, UML}
      \` ``
figPrefix:
  - "Fig."
  - "Figs."
secPrefix:
  - "Section"
  - "Sections"
...

这个元信息文件使用 LaTeX 设置下列参数：

template 指向使用的模板（mytemplate.tex）
documentclass 指向使用的 LaTeX 文档集合（acmart）
classoption 是在 sigconf 的案例中，指向这个类的选项
title 指定论文的标题
author 是一个包含例如 name、affiliation 和 email 的地方
bibliography 指向包含参考书目的文件（biblio.bib）
abstract 包含论文的摘要
include-before 是这篇论文的具体内容之前应该被包含的信息；在 LaTeX 中被称为前言。我在这里包含它去展示如何产生一篇计算机科学的论文，但是你可以选择跳过
figPrefix 指向如何引用文档中的图像，例如：当引用图像的 [@fig:scatter-matrix] 时应该显示什么。例如，当前的 figPrefix 在这个例子 The boxes "Enjoy", "Grade" and "Motivation" ([@fig:scatter-matrix])中，产生了这样的输出：The boxes "Enjoy", "Grade" and "Motivation" (Fig. 3)。如果这里有很多图像，目前的设置表明它应该在图像号码旁边显示 Figs.
secPrefix 指定如何引用文档中其他地方提到的部分（类似之前的图像和概览）

现在已经设置好了元信息，让我们来创建一个 Makefile，它会产生你想要的输出。Makefile 使用 Pandoc 产生 LaTeX 文件，pandoc-crossref 产生交叉引用，pdflatex 构建 LaTeX 为 PDF，bibtex 处理引用。

Makefile 已经展示如下：

all: paper

paper:
        @pandoc -s -F pandoc-crossref --natbib meta.yaml --template=mytemplate.tex -N \
         -f markdown -t latex+raw_tex+tex_math_dollars+citations -o main.tex main.md
        @pdflatex main.tex &> /dev/null
        @bibtex main &> /dev/null
        @pdflatex main.tex &> /dev/null
        @pdflatex main.tex &> /dev/null

clean:
        rm main.aux main.tex main.log main.bbl main.blg main.out

.PHONY: all clean paper

Pandoc 使用下面的标记：

-s 创建一个独立的 LaTeX 文档
-F pandoc-crossref 利用 pandoc-crossref 进行过滤
--natbib 用 natbib （你也可以选择 --biblatex）对参考书目进行渲染
--template 设置使用的模板文件
-N 为章节的标题编号
-f 和 -t 指定从哪个格式转换到哪个格式。-t 通常包含格式和 Pandoc 使用的扩展。在这个例子中，我们标明的 raw_tex+tex_math_dollars+citations 允许在 Markdown 中使用 raw_tex LaTeX。 tex_math_dollars 让我们能够像在 LaTeX 中一样输入数学符号，citations 让我们可以使用这个扩展。

要从 LaTeX 产生 PDF，按来自bibtex 的指导处理参考书目：

@pdflatex main.tex &> /dev/null
@bibtex main &> /dev/null
@pdflatex main.tex &> /dev/null
@pdflatex main.tex &> /dev/null

脚本用 @ 忽略输出，并且重定向标准输出和错误到 /dev/null ，因此我们在使用这些命令的可执行文件时不会看到任何的输出。

最终的结果展示如下。这篇文章的库可以在 GitHub 找到：

结论

在我看来，研究的重点是协作、思想的传播，以及在任何一个恰好存在的领域中改进现有的技术。许多计算机科学家和工程师使用 LaTeX 文档系统来写论文，它对数学提供了完美的支持。来自社会科学的研究人员似乎更喜欢 DOCX 文档。

当身处不同社区的研究人员一同写一篇论文时，他们首先应该讨论一下他们将要使用哪种格式。然而如果包含太多的数学符号，DOCX 对于工程师来说不会是最简便的选择，LaTeX 对于缺乏编程经验的研究人员来说也有一些问题。就像这篇文章中展示的，Markdown 是一门工程师和社会科学家都很轻易能够使用的语言。

via: https://opensource.com/article/18/9/pandoc-research-paper

作者：Kiko Fernandez-Reyes 选题：lujun9972 译者：dianbanjiu 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

重启和关闭 Linux 系统的 6 个终端命令

Prakash Subramanian 发布于 2018-11-01
另请参阅: 技术,关机, 重启
评论

在 Linux 管理员的日程当中，有很多需要执行的任务，其中就有系统的重启和关闭。

对于 Linux 管理员来说，重启和关闭系统是其诸多风险操作中的一例，有时候，由于某些原因，这些操作可能无法挽回，他们需要更多的时间来排查问题。

在 Linux 命令行模式下我们可以执行这些任务。很多时候，由于熟悉命令行，Linux 管理员更倾向于在命令行下完成这些任务。

重启和关闭系统的 Linux 命令并不多，用户需要根据需要，选择合适的命令来完成任务。

以下所有命令都有其自身特点，并允许被 Linux 管理员使用.

建议阅读：

系统重启和关闭之始，会通知所有已登录的用户和进程。当然，如果使用了时间参数，系统将拒绝新的用户登入。

执行此类操作之前，我建议您坚持复查，因为您只能得到很少的提示来确保这一切顺利。

下面陈列了一些步骤：

确保您拥有一个可以处理故障的控制台，以防之后可能会发生的问题。 VMWare 可以访问虚拟机，而 IPMI、iLO 和 iDRAC 可以访问物理服务器。
您需要通过公司的流程，申请修改或故障的执行权直到得到许可。
为安全着想，备份重要的配置文件，并保存到其他服务器上.
验证日志文件（提前检查）
和相关团队交流，比如数据库管理团队，应用团队等。
通知数据库和应用服务人员关闭服务，并得到确定答复。
使用适当的命令复盘操作，验证工作。
最后，重启系统。
验证日志文件，如果一切顺利，执行下一步操作，如果发现任何问题，对症排查。
无论是回退版本还是运行程序，通知相关团队提出申请。
对操作做适当守候，并将预期的一切正常的反馈给团队

使用下列命令执行这项任务。

shutdown、halt、poweroff、reboot 命令：用来停机、重启或切断电源
init 命令：是 “initialization” 的简称，是系统启动的第一个进程。
systemctl 命令：systemd 是 Linux 系统和服务器的管理程序。

方案 1：如何使用 shutdown 命令关闭和重启 Linux 系统

shutdown 命令用于断电或重启本地和远程的 Linux 机器。它为高效完成作业提供多个选项。如果使用了时间参数，系统关闭的 5 分钟之前，会创建 /run/nologin 文件，以确保后续的登录会被拒绝。

通用语法如下：

# shutdown [OPTION] [TIME] [MESSAGE]

运行下面的命令来立即关闭 Linux 机器。它会立刻杀死所有进程，并关闭系统。

# shutdown -h now

-h：如果不特指 -halt 选项，这等价于 -poweroff 选项。

另外我们可以使用带有 -halt 选项的 shutdown 命令来立即关闭设备。

# shutdown --halt now
或者
# shutdown -H now

-H, --halt：停止设备运行

另外我们可以使用带有 poweroff 选项的 shutdown 命令来立即关闭设备。

# shutdown --poweroff now
或者
# shutdown -P now

-P, --poweroff：切断电源（默认）。

如果您没有使用时间选项运行下面的命令，它将会在一分钟后执行给出的命令。

# shutdown -h
Shutdown scheduled for Mon 2018-10-08 06:42:31 EDT, use 'shutdown -c' to cancel.

[email protected]#
Broadcast message from [email protected] (Mon 2018-10-08 06:41:31 EDT):

The system is going down for power-off at Mon 2018-10-08 06:42:31 EDT!

其他的登录用户都能在中断中看到如下的广播消息：

[[email protected] ~]$
Broadcast message from [email protected] (Mon 2018-10-08 06:41:31 EDT):

The system is going down for power-off at Mon 2018-10-08 06:42:31 EDT!

对于使用了 -halt 选项：

# shutdown -H
Shutdown scheduled for Mon 2018-10-08 06:37:53 EDT, use 'shutdown -c' to cancel.

[email protected]#
Broadcast message from [email protected] (Mon 2018-10-08 06:36:53 EDT):

The system is going down for system halt at Mon 2018-10-08 06:37:53 EDT!

对于使用了 -poweroff 选项：

# shutdown -P
Shutdown scheduled for Mon 2018-10-08 06:40:07 EDT, use 'shutdown -c' to cancel.

[email protected]#
Broadcast message from [email protected] (Mon 2018-10-08 06:39:07 EDT):

The system is going down for power-off at Mon 2018-10-08 06:40:07 EDT!

可以在您的终端上敲击 shutdown -c 选项取消操作。

# shutdown -c

Broadcast message from [email protected] (Mon 2018-10-08 06:39:09 EDT):

The system shutdown has been cancelled at Mon 2018-10-08 06:40:09 EDT!

其他的登录用户都能在中断中看到如下的广播消息：

[[email protected] ~]$
Broadcast message from [email protected] (Mon 2018-10-08 06:41:35 EDT):

The system shutdown has been cancelled at Mon 2018-10-08 06:42:35 EDT!

添加时间参数，如果你想在 N 秒之后执行关闭或重启操作。这里，您可以为所有登录用户添加自定义广播消息。例如，我们将在五分钟后重启设备。

# shutdown -r +5 "To activate the latest Kernel"
Shutdown scheduled for Mon 2018-10-08 07:13:16 EDT, use 'shutdown -c' to cancel.

[root@vps138235 ~]#
Broadcast message from [email protected] (Mon 2018-10-08 07:08:16 EDT):

To activate the latest Kernel
The system is going down for reboot at Mon 2018-10-08 07:13:16 EDT!

运行下面的命令立即重启 Linux 机器。它会立即杀死所有进程并且重新启动系统。

# shutdown -r now

-r, --reboot：重启设备。

方案 2：如何通过 reboot 命令关闭和重启 Linux 系统

reboot 命令用于关闭和重启本地或远程设备。reboot 命令拥有两个实用的选项。

它能够优雅的关闭和重启设备（就好像在系统菜单中惦记重启选项一样简单）。

执行不带任何参数的 reboot 命令来重启 Linux 机器。

# reboot

执行带 -p 参数的 reboot 命令来关闭 Linux 机器电源。

# reboot -p

-p, --poweroff：调用 halt 或 poweroff 命令，切断设备电源。

执行带 -f 参数的 reboot 命令来强制重启 Linux 设备（这类似按压机器上的电源键）。

# reboot -f

-f, --force：立刻强制中断，切断电源或重启。

方案 3：如何通过 init 命令关闭和重启 Linux 系统

init（“initialization” 的简写）是系统启动的第一个进程。

它将会检查 /etc/inittab 文件并决定 linux 运行级别。同时，允许用户在 Linux 设备上执行关机或重启操作. 这里存在从 0 到 6 的七个运行等级。

建议阅读：

如何检查 Linux 上所有运行的服务

执行以下 init 命令关闭系统。

# init 0

0：停机 – 关闭系统。

运行下面的 init 命令重启设备：

# init 6

6：重启 – 重启设备。

方案 4：如何通过 halt 命令关闭和重启 Linux 系统

halt 命令用来切断电源或关闭远程 Linux 机器或本地主机。中断所有进程并关闭 cpu。

# halt

方案 5：如何通过 poweroff 命令关闭和重启 Linux 系统

poweroff 命令用来切断电源或关闭远程 Linux 机器或本地主机。 poweroff 很像 halt，但是它可以关闭设备硬件（灯和其他 PC 上的其它东西）。它会给主板发送 ACPI 指令，然后信号发送到电源，切断电源。

# poweroff

方案 6：如何通过 systemctl 命令关闭和重启 Linux 系统

systemd 是一款适用于所有主流 Linux 发型版的全新 init 系统和系统管理器，而不是传统的 SysV init 系统。

systemd 兼容与 SysV 和 LSB 初始化脚本。它能够替代 SysV init 系统。systemd 是内核启动的第一个进程，并持有序号为 1 的进程 PID。

建议阅读：

chkservice – 一款终端下系统单元管理工具

它是一切进程的父进程，Fedora 15 是第一个适配安装 systemd （替代了 upstart）的发行版。

systemctl 是命令行下管理 systemd 守护进程和服务的主要工具（如 start、restart、stop、enable、disable、reload & status）。

systemd 使用 .service 文件而不是 SysV init 使用的 bash 脚本。 systemd 将所有守护进程归与自身的 Linux cgroups 用户组下，您可以浏览 /cgroup/systemd 文件查看该系统层次等级。

# systemctl halt
# systemctl poweroff
# systemctl reboot
# systemctl suspend
# systemctl hibernate

via: https://www.2daygeek.com/6-commands-to-shutdown-halt-poweroff-reboot-the-linux-system/

作者：Prakash Subramanian 选题：lujun9972 译者：cyleft 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

用 350 行代码从零开始，将 Lisp 编译成 JavaScript

Gil Mizrahi 发布于 2018-10-31
另请参阅: 软件开发,编译器
评论

我们将会在本篇文章中看到从零开始实现的编译器，将简单的类 LISP 计算语言编译成 JavaScript。完整的源代码在这里。

我们将会：

自定义语言，并用它编写一个简单的程序
实现一个简单的解析器组合器
为该语言实现一个解析器
为该语言实现一个美观的打印器
为我们的用途定义 JavaScript 的一个子集
实现代码转译器，将代码转译成我们定义的 JavaScript 子集
把所有东西整合在一起

开始吧！

1、定义语言

Lisp 族语言最迷人的地方在于，它们的语法就是树状表示的，这就是这门语言很容易解析的原因。我们很快就能接触到它。但首先让我们把自己的语言定义好。关于我们语言的语法的范式（BNF）描述如下：

program ::= expr
expr ::= <integer> | <name> | ([<expr>])

基本上，我们可以在该语言的最顶层定义表达式并对其进行运算。表达式由一个整数（比如 5）、一个变量（比如 x）或者一个表达式列表（比如 (add x 1)）组成。

整数对应它本身的值，变量对应它在当前环境中绑定的值，表达式列表对应一个函数调用，该列表的第一个参数是相应的函数，剩下的表达式是传递给这个函数的参数。

该语言中，我们保留一些内建的特殊形式，这样我们就能做一些更有意思的事情：

let 表达式使我们可以在它的 body 环境中引入新的变量。语法如下：

let ::= (let ([<letarg>]) <body>)
letargs ::= (<name> <expr>)
body ::= <expr>

lambda 表达式：也就是匿名函数定义。语法如下：

lambda ::= (lambda ([<name>]) <body>)

还有一些内建函数： add、mul、sub、div 和 print。

让我们看看用我们这门语言编写的入门示例程序：

(let
  ((compose
    (lambda (f g)
      (lambda (x) (f (g x)))))
  (square
    (lambda (x) (mul x x)))
  (add1
    (lambda (x) (add x 1))))
  (print ((compose square add1) 5)))

这个程序定义了 3 个函数：compose、square 和 add1。然后将计算结果的值 ((compose square add1) 5) 输出出来。

我相信了解这门语言，这些信息就足够了。开始实现它吧。

在 Haskell 中，我们可以这样定义语言：

type Name = String

data Expr
  = ATOM Atom
  | LIST [Expr]
    deriving (Eq, Read, Show)

data Atom
  = Int Int
  | Symbol Name
    deriving (Eq, Read, Show)

我们可以解析用该语言用 Expr 定义的程序。而且，这里我们添加了新数据类型 Eq、Read 和 Show 等实例用于测试和调试。你能够在 REPL 中使用这些数据类型，验证它们确实有用。

我们不在语法中定义 lambda、let 或其它的内建函数，原因在于，当前情况下我们没必要用到这些东西。这些函数仅仅是 LIST （表达式列表）的更加特殊的用例。所以我决定将它放到后面的部分。

一般来说你想要在抽象语法中定义这些特殊用例 —— 用于改进错误信息、禁用静态分析和优化等等，但在这里我们不会这样做，对我们来说这些已经足够了。

另一件你想做的事情可能是在语法中添加一些注释信息。比如定位：Expr 是来自哪个文件的，具体到这个文件的哪一行哪一列。你可以在后面的阶段中使用这一特性，打印出错误定位，即使它们不是处于解析阶段。

练习 1：添加一个 Program 数据类型，可以按顺序包含多个 Expr
练习 2：向语法树中添加一个定位注解。

2、实现一个简单的解析器组合库

我们要做的第一件事情是定义一个嵌入式领域专用语言 Embedded Domain Specific Language （EDSL），我们会用它来定义我们的语言解析器。这常常被称为解析器组合库。我们做这件事完全是出于学习的目的，Haskell 里有很好的解析库，在实际构建软件或者进行实验时，你应该使用它们。megaparsec 就是这样的一个库。

首先我们来谈谈解析库的实现的思路。本质上，我们的解析器就是一个函数，接受一些输入，可能会读取输入的一些或全部内容，然后返回解析出来的值和无法解析的输入部分，或者在解析失败时抛出异常。我们把它写出来。

newtype Parser a
  = Parser (ParseString -> Either ParseError (a, ParseString))

data ParseString
  = ParseString Name (Int, Int) String

data ParseError
  = ParseError ParseString Error

type Error = String

这里我们定义了三个主要的新类型。

第一个，Parser a 是之前讨论的解析函数。

第二个，ParseString 是我们的输入或携带的状态。它有三个重要的部分：

Name: 这是源的名字
(Int, Int): 这是源的当前位置
String: 这是等待解析的字符串

第三个，ParseError 包含了解析器的当前状态和一个错误信息。

现在我们想让这个解析器更灵活，我们将会定义一些常用类型的实例。这些实例让我们能够将小巧的解析器和复杂的解析器结合在一起（因此它的名字叫做 “解析器组合器”）。

第一个是 Functor 实例。我们需要 Functor 实例，因为我们要能够对解析值应用函数从而使用不同的解析器。当我们定义自己语言的解析器时，我们将会看到关于它的示例。

instance Functor Parser where
  fmap f (Parser parser) =
    Parser (\str -> first f <$> parser str)

第二个是 Applicative 实例。该实例的常见用例是在多个解析器中实现一个纯函数。

instance Applicative Parser where
  pure x = Parser (\str -> Right (x, str))
  (Parser p1) <*> (Parser p2) =
    Parser $
      \str -> do
        (f, rest)  <- p1 str
        (x, rest') <- p2 rest
        pure (f x, rest')

（注意：我们还会实现一个 Monad 实例，这样我们才能使用符号）

第三个是 Alternative 实例。万一前面的解析器解析失败了，我们要能够提供一个备用的解析器。

instance Alternative Parser where
  empty = Parser (`throwErr` "Failed consuming input")
  (Parser p1) <|> (Parser p2) =
    Parser $
      \pstr -> case p1 pstr of
        Right result -> Right result
        Left  _      -> p2 pstr

第四个是 Monad 实例。这样我们就能链接解析器。

instance Monad Parser where
  (Parser p1) >>= f =
    Parser $
     \str -> case p1 str of
       Left err -> Left err
       Right (rs, rest) ->
         case f rs of
           Parser parser -> parser rest

接下来，让我们定义一种的方式，用于运行解析器和防止失败的助手函数：

runParser :: String -> String -> Parser a -> Either ParseError (a, ParseString)
runParser name str (Parser parser) = parser $ ParseString name (0,0) str

throwErr :: ParseString -> String -> Either ParseError a
throwErr ps@(ParseString name (row,col) _) errMsg =
  Left $ ParseError ps $ unlines
    [ "*** " ++ name ++ ": " ++ errMsg
    , "* On row " ++ show row ++ ", column " ++ show col ++ "."
    ]

现在我们将会开始实现组合器，这是 EDSL 的 API，也是它的核心。

首先，我们会定义 oneOf。如果输入列表中的字符后面还有字符的话，oneOf 将会成功，否则就会失败。

oneOf :: [Char] -> Parser Char
oneOf chars =
  Parser $ \case
    ps@(ParseString name (row, col) str) ->
      case str of
        []     -> throwErr ps "Cannot read character of empty string"
        (c:cs) ->
          if c `elem` chars
          then Right (c, ParseString name (row, col+1) cs)
          else throwErr ps $ unlines ["Unexpected character " ++ [c], "Expecting one of: " ++ show chars]

optional 将会抛出异常，停止解析器。失败时它仅仅会返回 Nothing。

optional :: Parser a -> Parser (Maybe a)
optional (Parser parser) =
  Parser $
    \pstr -> case parser pstr of
      Left _ -> Right (Nothing, pstr)
      Right (x, rest) -> Right (Just x, rest)

many 将会试着重复运行解析器，直到失败。当它完成的时候，会返回成功运行的解析器列表。many1 做的事情是一样的，但解析失败时它至少会抛出一次异常。

many :: Parser a -> Parser [a]
many parser = go []
  where go cs = (parser >>= \c -> go (c:cs)) <|> pure (reverse cs)

many1 :: Parser a -> Parser [a]
many1 parser =
  (:) <$> parser <*> many parser

下面的这些解析器通过我们定义的组合器来实现一些特殊的解析器：

char :: Char -> Parser Char
char c = oneOf [c]

string :: String -> Parser String
string = traverse char

space :: Parser Char
space = oneOf " \n"

spaces :: Parser String
spaces = many space

spaces1 :: Parser String
spaces1 = many1 space

withSpaces :: Parser a -> Parser a
withSpaces parser =
  spaces *> parser <* spaces

parens :: Parser a -> Parser a
parens parser =
     (withSpaces $ char '(')
  *> withSpaces parser
  <* (spaces *> char ')')

sepBy :: Parser a -> Parser b -> Parser [b]
sepBy sep parser = do
  frst <- optional parser
  rest <- many (sep *> parser)
  pure $ maybe rest (:rest) frst

现在为该门语言定义解析器所需要的所有东西都有了。

练习：实现一个 EOF（end of file/input，即文件或输入终止符）解析器组合器。

3、为我们的语言实现解析器

我们会用自顶而下的方法定义解析器。

parseExpr :: Parser Expr
parseExpr = fmap ATOM parseAtom <|> fmap LIST parseList

parseList :: Parser [Expr]
parseList = parens $ sepBy spaces1 parseExpr

parseAtom :: Parser Atom
parseAtom = parseSymbol <|> parseInt

parseSymbol :: Parser Atom
parseSymbol = fmap Symbol parseName

注意到这四个函数是在我们这门语言中属于高阶描述。这解释了为什么 Haskell 执行解析工作这么棒。在定义完高级部分后，我们还需要定义低级别的 parseName 和 parseInt。

我们能在这门语言中用什么字符作为名字呢？用小写的字母、数字和下划线吧，而且名字的第一个字符必须是字母。

parseName :: Parser Name
parseName = do
  c  <- oneOf ['a'..'z']
  cs <- many $ oneOf $ ['a'..'z'] ++ "0123456789" ++ "_"
  pure (c:cs)

整数是一系列数字，数字前面可能有负号 -：

parseInt :: Parser Atom
parseInt = do
  sign <- optional $ char '-'
  num  <- many1 $ oneOf "0123456789"
  let result = read $ maybe num (:num) sign of
  pure $ Int result

最后，我们会定义用来运行解析器的函数，返回值可能是一个 Expr 或者是一条错误信息。

runExprParser :: Name -> String -> Either String Expr
runExprParser name str =
  case runParser name str (withSpaces parseExpr) of
    Left (ParseError _ errMsg) -> Left errMsg
    Right (result, _) -> Right result

练习 1 ：为第一节中定义的 Program 类型编写一个解析器
练习 2 ：用 Applicative 的形式重写 parseName
练习 3 ：parseInt 可能出现溢出情况，找到处理它的方法，不要用 read。

4、为这门语言实现一个更好看的输出器

我们还想做一件事，将我们的程序以源代码的形式打印出来。这对完善错误信息很有用。

printExpr :: Expr -> String
printExpr = printExpr' False 0

printAtom :: Atom -> String
printAtom = \case
  Symbol s -> s
  Int i -> show i

printExpr' :: Bool -> Int -> Expr -> String
printExpr' doindent level = \case
  ATOM a -> indent (bool 0 level doindent) (printAtom a)
  LIST (e:es) ->
    indent (bool 0 level doindent) $
      concat
        [ "("
        , printExpr' False (level + 1) e
        , bool "\n" "" (null es)
        , intercalate "\n" $ map (printExpr' True (level + 1)) es
        , ")"
        ]

indent :: Int -> String -> String
indent tabs e = concat (replicate tabs "  ") ++ e

练习：为第一节中定义的 Program 类型编写一个美观的输出器

好，目前为止我们写了近 200 行代码，这些代码一般叫做编译器的前端。我们还要写大概 150 行代码，用来执行三个额外的任务：我们需要根据需求定义一个 JS 的子集，定义一个将我们的语言转译成这个子集的转译器，最后把所有东西整合在一起。开始吧。

5、根据需求定义 JavaScript 的子集

首先，我们要定义将要使用的 JavaScript 的子集：

data JSExpr
  = JSInt Int
  | JSSymbol Name
  | JSBinOp JSBinOp JSExpr JSExpr
  | JSLambda [Name] JSExpr
  | JSFunCall JSExpr [JSExpr]
  | JSReturn JSExpr
    deriving (Eq, Show, Read)

type JSBinOp = String

这个数据类型表示 JavaScript 表达式。我们有两个原子类型 JSInt 和 JSSymbol，它们是由我们这个语言中的 Atom 转译来的，我们用 JSBinOp 来表示二元操作，比如 + 或 *，用 JSLambda 来表示匿名函数，和我们语言中的 lambda expression（lambda 表达式） 一样，我们将会用 JSFunCall 来调用函数，用 let 来引入新名字，用 JSReturn 从函数中返回值，在 JavaScript 中是需要返回值的。

JSExpr 类型是对 JavaScript 表达式的 抽象表示。我们会把自己语言中表达式的抽象表示 Expr 转译成 JavaScript 表达式的抽象表示 JSExpr。但为了实现这个功能，我们需要实现 JSExpr ，并从这个抽象表示中生成 JavaScript 代码。我们将通过递归匹配 JSExpr 实现，将 JS 代码当作 String 来输出。这和我们在 printExpr 中做的基本上是一样的。我们还会追踪元素的作用域，这样我们才可以用合适的方式缩进生成的代码。

printJSOp :: JSBinOp -> String
printJSOp op = op

printJSExpr :: Bool -> Int -> JSExpr -> String
printJSExpr doindent tabs = \case
  JSInt    i     -> show i
  JSSymbol name  -> name
  JSLambda vars expr -> (if doindent then indent tabs else id) $ unlines
    ["function(" ++ intercalate ", " vars ++ ") {"
    ,indent (tabs+1) $ printJSExpr False (tabs+1) expr
    ] ++ indent tabs "}"
  JSBinOp  op e1 e2  -> "(" ++ printJSExpr False tabs e1 ++ " " ++ printJSOp op ++ " " ++ printJSExpr False tabs e2 ++ ")"
  JSFunCall f exprs  -> "(" ++ printJSExpr False tabs f ++ ")(" ++ intercalate ", " (fmap (printJSExpr False tabs) exprs) ++ ")"
  JSReturn expr      -> (if doindent then indent tabs else id) $ "return " ++ printJSExpr False tabs expr ++ ";"

练习 1 ：添加 JSProgram 类型，它可以包含多个 JSExpr ，然后创建一个叫做 printJSExprProgram 的函数来生成代码。
练习 2 ：添加 JSExpr 的新类型：JSIf，并为其生成代码。

6、实现到我们定义的 JavaScript 子集的代码转译器

我们快做完了。这一节将会创建函数，将 Expr 转译成 JSExpr。

基本思想很简单，我们会将 ATOM 转译成 JSSymbol 或者 JSInt，然后会将 LIST 转译成一个函数调用或者转译的特例。

type TransError = String

translateToJS :: Expr -> Either TransError JSExpr
translateToJS = \case
  ATOM (Symbol s) -> pure $ JSSymbol s
  ATOM (Int i)    -> pure $ JSInt i
  LIST xs -> translateList xs

translateList :: [Expr] -> Either TransError JSExpr
translateList = \case
  []     -> Left "translating empty list"
  ATOM (Symbol s):xs
    | Just f <- lookup s builtins ->
      f xs
  f:xs ->
    JSFunCall <$> translateToJS f <*> traverse translateToJS xs

builtins 是一系列要转译的特例，就像 lambada 和 let。每一种情况都可以获得一系列参数，验证它是否合乎语法规范，然后将其转译成等效的 JSExpr。

type Builtin  = [Expr] -> Either TransError JSExpr
type Builtins = [(Name, Builtin)]

builtins :: Builtins
builtins =
  [("lambda", transLambda)
  ,("let", transLet)
  ,("add", transBinOp "add" "+")
  ,("mul", transBinOp "mul" "*")
  ,("sub", transBinOp "sub" "-")
  ,("div", transBinOp "div" "/")
  ,("print", transPrint)
  ]

我们这种情况，会将内建的特殊形式当作特殊的、非第一类的进行对待，因此不可能将它们当作第一类函数。

我们会把 Lambda 表达式转译成一个匿名函数：

transLambda :: [Expr] -> Either TransError JSExpr
transLambda = \case
  [LIST vars, body] -> do
    vars' <- traverse fromSymbol vars
    JSLambda vars' <$> (JSReturn <$> translateToJS body)

  vars ->
    Left $ unlines
      ["Syntax error: unexpected arguments for lambda."
      ,"expecting 2 arguments, the first is the list of vars and the second is the body of the lambda."
      ,"In expression: " ++ show (LIST $ ATOM (Symbol "lambda") : vars)
      ]

fromSymbol :: Expr -> Either String Name
fromSymbol (ATOM (Symbol s)) = Right s
fromSymbol e = Left $ "cannot bind value to non symbol type: " ++ show e

我们会将 let 转译成带有相关名字参数的函数定义，然后带上参数调用函数，因此会在这一作用域中引入变量：

transLet :: [Expr] -> Either TransError JSExpr
transLet = \case
  [LIST binds, body] -> do
    (vars, vals) <- letParams binds
    vars' <- traverse fromSymbol vars
    JSFunCall . JSLambda vars' <$> (JSReturn <$> translateToJS body) <*> traverse translateToJS vals
   where
    letParams :: [Expr] -> Either Error ([Expr],[Expr])
    letParams = \case
      [] -> pure ([],[])
      LIST [x,y] : rest -> ((x:) *** (y:)) <$> letParams rest
      x : _ -> Left ("Unexpected argument in let list in expression:\n" ++ printExpr x)

  vars ->
    Left $ unlines
      ["Syntax error: unexpected arguments for let."
      ,"expecting 2 arguments, the first is the list of var/val pairs and the second is the let body."
      ,"In expression:\n" ++ printExpr (LIST $ ATOM (Symbol "let") : vars)
      ]

我们会将可以在多个参数之间执行的操作符转译成一系列二元操作符。比如：(add 1 2 3) 将会变成 1 + (2 + 3)。

transBinOp :: Name -> Name -> [Expr] -> Either TransError JSExpr
transBinOp f _ []   = Left $ "Syntax error: '" ++ f ++ "' expected at least 1 argument, got: 0"
transBinOp _ _ [x]  = translateToJS x
transBinOp _ f list = foldl1 (JSBinOp f) <$> traverse translateToJS list

然后我们会将 print 转换成对 console.log 的调用。

transPrint :: [Expr] -> Either TransError JSExpr
transPrint [expr] = JSFunCall (JSSymbol "console.log") . (:[]) <$> translateToJS expr
transPrint xs     = Left $ "Syntax error. print expected 1 arguments, got: " ++ show (length xs)

注意，如果我们将这些代码当作 Expr 的特例进行解析，那我们就可能会跳过语法验证。

练习 1 ：将 Program 转译成 JSProgram
练习 2 ：为 if Expr Expr Expr 添加一个特例，并将它转译成你在上一次练习中实现的 JSIf 条件语句。

7、把所有东西整合到一起

最终，我们将会把所有东西整合到一起。我们会：

读取文件
将文件解析成 Expr
将文件转译成 JSExpr
将 JavaScript 代码发送到标准输出流

我们还会启用一些用于测试的标志位：

--e 将进行解析并打印出表达式的抽象表示（Expr）
--pp 将进行解析，美化输出
--jse 将进行解析、转译、并打印出生成的 JS 表达式（JSExpr）的抽象表示
--ppc 将进行解析，美化输出并进行编译

main :: IO ()
main = getArgs >>= \case
  [file] ->
    printCompile =<< readFile file
  ["--e",file] ->
    either putStrLn print . runExprParser "--e" =<< readFile file
  ["--pp",file] ->
    either putStrLn (putStrLn . printExpr) . runExprParser "--pp" =<< readFile file
  ["--jse",file] ->
    either print (either putStrLn print . translateToJS) . runExprParser "--jse" =<< readFile file
  ["--ppc",file] ->
    either putStrLn (either putStrLn putStrLn) . fmap (compile . printExpr) . runExprParser "--ppc" =<< readFile file
  _ ->
    putStrLn $ unlines
      ["Usage: runghc Main.hs [ --e, --pp, --jse, --ppc ] <filename>"
      ,"--e     print the Expr"
      ,"--pp    pretty print Expr"
      ,"--jse   print the JSExpr"
      ,"--ppc   pretty print Expr and then compile"
      ]

printCompile :: String -> IO ()
printCompile = either putStrLn putStrLn . compile

compile :: String -> Either Error String
compile str = printJSExpr False 0 <$> (translateToJS =<< runExprParser "compile" str)

大功告成。将自己的语言编译到 JS 子集的编译器已经完成了。再说一次，你可以在这里看到完整的源文件。

用我们的编译器运行第一节的示例，产生的 JavaScript 代码如下：

$ runhaskell Lisp.hs example.lsp
(function(compose, square, add1) {
  return (console.log)(((compose)(square, add1))(5));
})(function(f, g) {
  return function(x) {
    return (f)((g)(x));
  };
}, function(x) {
  return (x * x);
}, function(x) {
  return (x + 1);
})

如果你在自己电脑上安装了 node.js，你可以用以下命令运行这段代码：

$ runhaskell Lisp.hs example.lsp | node -p
36
undefined

最终练习 : 编译有多个表达式的程序而非仅编译一个表达式。

via: https://gilmi.me/blog/post/2016/10/14/lisp-to-js

作者：Gil Mizrahi 选题：oska874 译者：BriFuture 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

如何在 Linux 中一次重命名多个文件

SK 发布于 2018-10-31
另请参阅: 技术,mv, mmv
评论

你可能已经知道，我们使用 mv 命令在类 Unix 操作系统中重命名或者移动文件和目录。但是，mv 命令不支持一次重命名多个文件。不用担心。在本教程中，我们将学习使用 Linux 中的 mmv 命令一次重命名多个文件。此命令用于在类 Unix 操作系统中使用标准通配符批量移动、复制、追加和重命名文件。

在 Linux 中一次重命名多个文件

mmv 程序可在基于 Debian 的系统的默认仓库中使用。要想在 Debian、Ubuntu、Linux Mint 上安装它，请运行以下命令：

$ sudo apt-get install mmv

我们假设你在当前目录中有以下文件。

$ ls
a1.txt a2.txt a3.txt

现在，你想要将所有以字母 “a” 开头的文件重命名为以 “b” 开头的。当然，你可以在几秒钟内手动执行此操作。但是想想你是否有数百个文件想要重命名？这是一个非常耗时的过程。这时候 mmv 命令就很有帮助了。

要将所有以字母 “a” 开头的文件重命名为以字母 “b” 开头的，只需要运行：

$ mmv a\* b\#1

让我们检查一下文件是否都已经重命名了。

$ ls
b1.txt b2.txt b3.txt

如你所见，所有以字母 “a” 开头的文件（即 a1.txt、a2.txt、a3.txt）都重命名为 b1.txt、b2.txt、b3.txt。

解释

在上面的例子中，第一个参数（a\*）是 “from” 模式，第二个参数是 “to” 模式（b\#1）。根据上面的例子，mmv 将查找任何以字母 “a” 开头的文件名，并根据第二个参数重命名匹配的文件，即 “to” 模式。我们可以使用通配符，例如用 *、? 和 [] 来匹配一个或多个任意字符。请注意，你必须转义使用通配符，否则它们将被 shell 扩展，mmv 将无法理解。

“to” 模式中的 #1 是通配符索引。它匹配 “from” 模式中的第一个通配符。 “to” 模式中的 #2 将匹配第二个通配符（如果有的话），依此类推。在我们的例子中，我们只有一个通配符（星号），所以我们写了一个 #1。并且，# 符号也应该被转义。此外，你也可以用引号括起模式。

你甚至可以将具有特定扩展名的所有文件重命名为其他扩展名。例如，要将当前目录中的所有 .txt 文件重命名为 .doc 文件格式，只需运行：

$ mmv \*.txt \#1.doc

这是另一个例子。我们假设你有以下文件。

$ ls
abcd1.txt abcd2.txt abcd3.txt

你希望在当前目录下的所有文件中将第一次出现的 “abc” 替换为 “xyz”。你会怎么做呢？

很简单。

$ mmv '*abc*' '#1xyz#2'

请注意，在上面的示例中，模式被单引号括起来了。

让我们检查下 “abc” 是否实际上被替换为 “xyz”。

$ ls
xyzd1.txt xyzd2.txt xyzd3.txt

看到没？文件 abcd1.txt、abcd2.txt 和 abcd3.txt 已经重命名为 xyzd1.txt、xyzd2.txt 和 xyzd3.txt。

mmv 命令的另一个值得注意的功能是你可以使用 -n 选项打印输出而不是重命名文件，如下所示。

$ mmv -n a\* b\#1
a1.txt -> b1.txt
a2.txt -> b2.txt
a3.txt -> b3.txt

这样，你可以在重命名文件之前简单地验证 mmv 命令实际执行的操作。

有关更多详细信息，请参阅 man 页面。

$ man mmv

更新：Thunar 文件管理器

Thunar 文件管理器默认具有内置批量重命名选项。如果你正在使用 Thunar，那么重命名文件要比使用 mmv 命令容易得多。

Thunar 在大多数 Linux 发行版的默认仓库库中都可用。

要在基于 Arch 的系统上安装它，请运行：

$ sudo pacman -S thunar

在 RHEL、CentOS 上:

$ sudo yum install thunar

在 Fedora 上:

$ sudo dnf install thunar

在 openSUSE 上:

$ sudo zypper install thunar

在 Debian、Ubuntu、Linux Mint 上:

$ sudo apt-get install thunar

安装后，你可以从菜单或应用程序启动器中启动批量重命名程序。要从终端启动它，请使用以下命令：

$ thunar -B

批量重命名方式如下。

单击“+”，然后选择要重命名的文件列表。批量重命名可以重命名文件的名称、文件的后缀或者同时重命名文件的名称和后缀。 Thunar 目前支持以下批量重命名：

插入日期或时间
插入或覆盖
编号
删除字符
搜索和替换
大写或小写

当你从选项列表中选择其中一个条件时，你将在“新名称”列中看到更改的预览，如下面的屏幕截图所示。

选择条件后，单击“重命名文件”选项来重命名文件。

你还可以通过选择两个或更多文件从 Thunar 中打开批量重命名器。选择文件后，按 F2 或右键单击并选择“重命名”。

嗯，这就是本次的所有内容了。希望有所帮助。更多干货即将到来。敬请关注！

祝快乐！

via: https://www.ostechnix.com/how-to-rename-multiple-files-at-once-in-linux/

作者：SK 选题：lujun9972 译者：Flowsnow 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

理解 Linux 链接（一）

Paul Brown 发布于 2018-10-31
另请参阅: 技术,链接
评论

链接是可以将文件和目录放在你希望它们放在的位置的另一种方式。

除了 cp 和 mv 这两个我们在本系列的前一部分中详细讨论过的，链接是可以将文件和目录放在你希望它们放在的位置的另一种方式。它的优点是可以让你同时在多个位置显示一个文件或目录。

如前所述，在物理磁盘这个级别上，文件和目录之类的东西并不真正存在。文件系统是为了方便人类使用，将它们虚构出来。但在磁盘级别上，有一个名为分区表 partition table 的东西，它位于每个分区的开头，然后数据分散在磁盘的其余部分。

虽然有不同类型的分区表，但是在分区开头的那个表包含的数据将映射每个目录和文件的开始和结束位置。分区表的就像一个索引：当从磁盘加载文件时，操作系统会查找表中的条目，分区表会告诉文件在磁盘上的起始位置和结束位置。然后磁盘头移动到起点，读取数据，直到它到达终点，您看：这就是你的文件。

硬链接

硬链接只是分区表中的一个条目，它指向磁盘上的某个区域，表示该区域已经被分配给文件。换句话说，硬链接指向已经被另一个条目索引的数据。让我们看看它是如何工作的。

打开终端，创建一个实验目录并进入：

mkdir test_dir
cd test_dir

使用 touch 创建一个文件：

touch test.txt

为了获得更多的体验（？），在文本编辑器中打开 test.txt 并添加一些单词。

现在通过执行以下命令来建立硬链接：

ln test.txt hardlink_test.txt

运行 ls，你会看到你的目录现在包含两个文件，或者看起来如此。正如你之前读到的那样，你真正看到的是完全相同的文件的两个名称： hardlink_test.txt 包含相同的内容，没有填充磁盘中的任何更多空间（可以尝试使用大文件来测试），并与 test.txt 使用相同的 inode：

$ ls -li *test*
16515846 -rw-r--r-- 2 paul paul 14 oct 12 09:50 hardlink_test.txt
16515846 -rw-r--r-- 2 paul paul 14 oct 12 09:50 test.txt

ls 的 -i 选项显示一个文件的 “inode 数值”。“inode” 是分区表中的信息块，它包含磁盘上文件或目录的位置、上次修改的时间以及其它数据。如果两个文件使用相同的 inode，那么无论它们在目录树中的位置如何，它们在实际上都是相同的文件。

软链接

软链接，也称为符号链接 symlink ，它与硬链接是不同的：软链接实际上是一个独立的文件，它有自己的 inode 和它自己在磁盘上的小块地方。但它只包含一小段数据，将操作系统指向另一个文件或目录。

你可以使用 ln 的 -s 选项来创建一个软链接：

ln -s test.txt softlink_test.txt

这将在当前目录中创建软链接 softlink_test.txt，它指向 test.txt。

再次执行 ls -li，你可以看到两种链接的不同之处：

$ ls -li
total 8
16515846 -rw-r--r-- 2 paul paul 14 oct 12 09:50 hardlink_test.txt
16515855 lrwxrwxrwx 1 paul paul 8 oct 12 09:50 softlink_test.txt -> test.txt
16515846 -rw-r--r-- 2 paul paul 14 oct 12 09:50 test.txt

hardlink_test.txt 和 test.txt 包含一些文本并且字面上占据相同的空间。它们使用相同的 inode 数值。与此同时，softlink_test.txt 占用少得多，并且具有不同的 inode 数值，将其标记为完全不同的文件。使用 ls 的 -l 选项还会显示软链接指向的文件或目录。

为什么要用链接？

它们适用于带有自己环境的应用程序。你的 Linux 发行版通常不会附带你需要应用程序的最新版本。以优秀的 Blender 3D 设计软件为例，Blender 允许你创建 3D 静态图像以及动画电影，人人都想在自己的机器上拥有它。问题是，当前版本的 Blender 至少比任何发行版中的自带的高一个版本。

幸运的是，Blender 提供可以开箱即用的下载。除了程序本身之外，这些软件包还包含了 Blender 需要运行的复杂的库和依赖框架。所有这些数据和块都在它们自己的目录层次中。

每次你想运行 Blender，你都可以 cd 到你下载它的文件夹并运行：

./blender

但这很不方便。如果你可以从文件系统的任何地方，比如桌面命令启动器中运行 blender 命令会更好。

这样做的方法是将 blender 可执行文件链接到 bin/ 目录。在许多系统上，你可以通过将其链接到文件系统中的任何位置来使 blender 命令可用，就像这样。

ln -s /path/to/blender_directory/blender /home/<username>/bin

你需要链接的另一个情况是软件需要过时的库。如果你用 ls -l 列出你的 /usr/lib 目录，你会看到许多软链接文件一闪而过。仔细看看，你会看到软链接通常与它们链接到的原始文件具有相似的名称。你可能会看到 libblah 链接到 libblah.so.2，你甚至可能会注意到 libblah.so.2 相应链接到原始文件 libblah.so.2.1.0。

这是因为应用程序通常需要安装比已安装版本更老的库。问题是，即使新版本仍然与旧版本（通常是）兼容，如果程序找不到它正在寻找的版本，程序将会出现问题。为了解决这个问题，发行版通常会创建链接，以便挑剔的应用程序相信它找到了旧版本，实际上它只找到了一个链接并最终使用了更新的库版本。

有些是和你自己从源代码编译的程序相关。你自己编译的程序通常最终安装在 /usr/local 下，程序本身最终在 /usr/local/bin 中，它在 /usr/local/bin 目录中查找它需要的库。但假设你的新程序需要 libblah，但 libblah 在 /usr/lib 中，这就是所有其它程序都会寻找到它的地方。你可以通过执行以下操作将其链接到 /usr/local/lib：

ln -s /usr/lib/libblah /usr/local/lib

或者如果你愿意，可以 cd 到 /usr/local/lib：

cd /usr/local/lib

然后使用链接：

ln -s ../lib/libblah

还有几十个案例证明软链接是有用的，当你使用 Linux 更熟练时，你肯定会发现它们，但这些是最常见的。下一次，我们将看一些你需要注意的链接怪异。

通过 Linux 基金会和 edX 的免费 “Linux 简介”课程了解有关 Linux 的更多信息。

via: https://www.linux.com/blog/intro-to-linux/2018/10/linux-links-part-1

作者：Paul Brown 选题：lujun9972 译者：MjSeven 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

命令行：增强版

Remy Sharp 发布于 2018-10-30
另请参阅: 技术,命令行, 终端
1 条评论

我不确定有多少 Web 开发者能完全避免使用命令行。就我来说，我从 1997 年上大学就开始使用命令行了，那时的 l33t-hacker 让我着迷，同时我也觉得它很难掌握。

过去这些年我的命令行本领在逐步加强，我经常会去搜寻工作中能用的更好的命令行工具。下面就是我现在使用的用于增强原有命令行工具的列表。

怎么忽略我所做的命令行增强

通常情况下我会用别名将新的增强的命令行工具覆盖原来的命令（如 cat 和 ping）。

如果我需要运行原来的命令的话（有时我确实需要这么做），我会像下面这样来运行未加修改的原始命令。（我用的是 Mac，你的用法可能不一样）

$ \cat # 忽略叫 "cat" 的别名 - 具体解释: https://stackoverflow.com/a/16506263/22617
$ command cat # 忽略函数和别名

bat > cat

cat 用于打印文件的内容，如果你平时用命令行很多的话，例如语法高亮之类的功能会非常有用。我首先发现了 ccat 这个有语法高亮功能的工具，然后我发现了 bat，它的功能有语法高亮、分页、行号和 git 集成。

bat 命令也能让我在（多于一屏的）输出里使用 / 搜索（和用 less 搜索功能一样）。

title=

我将别名 cat 指到了 bat 命令：

alias cat='bat'

安装指引

prettyping > ping

ping 非常有用，当我碰到“糟了，是不是 X 挂了？/我的网不通了？”这种情况下我最先想到的工具就是它了。但是 prettyping（“prettyping” 可不是指“pre typing”）在 ping 的基础上加了友好的输出，这可让我感觉命令行友好了很多呢。

title=

我也将 ping 用别名链接到了 prettyping 命令：

alias ping='prettyping --nolegend'

安装指引

fzf > ctrl+r

在终端里，使用 ctrl+r 将允许你在命令历史里反向搜索使用过的命令，这是个挺好的小技巧，尽管它有点麻烦。

fzf 这个工具相比于 ctrl+r 有了巨大的进步。它能针对命令行历史进行模糊查询，并且提供了对可能的合格结果进行全面交互式预览。

除了搜索命令历史，fzf 还能预览和打开文件，我在下面的视频里展示了这些功能。

为了这个预览的效果，我创建了一个叫 preview 的别名，它将 fzf 和前文提到的 bat 组合起来完成预览功能，还给上面绑定了一个定制的热键 ctrl+o 来打开 VS Code：

alias preview="fzf --preview 'bat --color \"always\" {}'"
# 支持在 VS Code 里用 ctrl+o 来打开选择的文件
export FZF_DEFAULT_OPTS="--bind='ctrl-o:execute(code {})+abort'"

安装指引

htop > top

top 是当我想快速诊断为什么机器上的 CPU 跑的那么累或者风扇为什么突然呼呼大做的时候首先会想到的工具。我在生产环境也会使用这个工具。讨厌的是 Mac 上的 top 和 Linux 上的 top 有着极大的不同（恕我直言，应该是差的多）。

不过，htop 是对 Linux 上的 top 和 Mac 上蹩脚的 top 的极大改进。它增加了包括颜色输出，键盘热键绑定以及不同的视图输出，这对理解进程之间的父子关系有极大帮助。

一些很容易上手的热键：

P —— 按 CPU 使用率排序
M —— 按内存使用排序
F4 —— 用字符串过滤进程（例如只看包括 node 的进程）
space —— 锚定一个单独进程，这样我能观察它是否有尖峰状态

title=

在 Mac Sierra 上 htop 有个奇怪的 bug，不过这个 bug 可以通过以 root 运行来绕过（我实在记不清这个 bug 是什么，但是这个别名能搞定它，有点讨厌的是我得每次都输入 root 密码。）：

alias top="sudo htop" # 给 top 加上别名并且绕过 Sierra 上的 bug

安装指引

diff-so-fancy > diff

我非常确定我是几年前从 Paul Irish 那儿学来的这个技巧，尽管我很少直接使用 diff，但我的 git 命令行会一直使用 diff。diff-so-fancy 给了我代码语法颜色和更改字符高亮的功能。

title=

在我的 ~/.gitconfig 文件里我用了下面的选项来打开 git diff 和 git show 的 diff-so-fancy 功能。

[pager]
    diff = diff-so-fancy | less --tabs=1,5 -RFX
    show = diff-so-fancy | less --tabs=1,5 -RFX

安装指引

fd > find

尽管我使用 Mac，但我绝不是 Spotlight 的粉丝，我觉得它的性能很差，关键字也难记，加上更新它自己的数据库时会拖慢 CPU，简直一无是处。我经常使用 Alfred，但是它的搜索功能也不是很好。

我倾向于在命令行中搜索文件，但是 find 的难用在于很难去记住那些合适的表达式来描述我想要的文件。（而且 Mac 上的 find 命令和非 Mac 的 find 命令还有些许不同，这更加深了我的失望。）

fd 是一个很好的替代品（它的作者和 bat 的作者是同一个人）。它非常快而且对于我经常要搜索的命令非常好记。

几个上手的例子：

$ fd cli # 所有包含 "cli" 的文件名
$ fd -e md # 所有以 .md 作为扩展名的文件
$ fd cli -x wc -w # 搜索 "cli" 并且在每个搜索结果上运行 `wc -w`

title=

安装指引

ncdu > du

对我来说，知道当前磁盘空间被什么占用了非常重要。我用过 Mac 上的 DaisyDisk，但是我觉得那个程序产生结果有点慢。

du -sh 命令是我经常会运行的命令（-sh 是指结果以“汇总”和“人类可读”的方式显示），我经常会想要深入挖掘那些占用了大量磁盘空间的目录，看看到底是什么在占用空间。

ncdu 是一个非常棒的替代品。它提供了一个交互式的界面并且允许快速的扫描那些占用了大量磁盘空间的目录和文件，它又快又准。（尽管不管在哪个工具的情况下，扫描我的 home 目录都要很长时间，它有 550G）

一旦当我找到一个目录我想要“处理”一下（如删除，移动或压缩文件），我会使用 cmd + 点击 iTerm2 顶部的目录名字的方法在 Finder 中打开它。

title=

还有另外一个叫 nnn 的替代选择，它提供了一个更漂亮的界面，它也提供文件尺寸和使用情况，实际上它更像一个全功能的文件管理器。

我的 du 是如下的别名：

alias du="ncdu --color dark -rr -x --exclude .git --exclude node_modules"

选项说明：

--color dark 使用颜色方案
-rr 只读模式（防止误删和运行新的 shell 程序）
--exclude 忽略不想操作的目录
安装指引

tldr > man

几乎所有的命令行工具都有一个相伴的手册，它可以被 man <命令名> 来调出，但是在 man 的输出里找到东西可有点让人困惑，而且在一个包含了所有的技术细节的输出里找东西也挺可怕的。

这就是 TL;DR 项目（LCTT 译注：英文里“文档太长，没空去读”的缩写）创建的初衷。这是一个由社区驱动的文档系统，而且可以用在命令行上。就我现在使用的经验，我还没碰到过一个命令没有它相应的文档，你也可以做贡献。

title=

一个小技巧，我将 tldr 的别名链接到 help（这样输入会快一点……）

alias help='tldr'

安装指引

ack || ag > grep

grep 毫无疑问是一个强力的命令行工具，但是这些年来它已经被一些工具超越了，其中两个叫 ack 和 ag。

我个人对 ack 和 ag 都尝试过，而且没有非常明显的个人偏好，（也就是说它们都很棒，并且很相似）。我倾向于默认只使用 ack，因为这三个字符就在指尖，很好打。并且 ack 有大量的 ack --bar 参数可以使用！（你一定会体会到这一点。）

ack 和 ag 默认都使用正则表达式来搜索，这非常契合我的工作，我能使用类似于 --js 或 --html 这种标识指定文件类型搜索。（尽管 ag 比 ack 在文件类型过滤器里包括了更多的文件类型。）

两个工具都支持常见的 grep 选项，如 -B 和 -A 用于在搜索的上下文里指代“之前”和“之后”。

title=

因为 ack 不支持 markdown（而我又恰好写了很多 markdown），我在我的 ~/.ackrc 文件里加了以下定制语句：

--type-set=md=.md,.mkd,.markdown
--pager=less -FRX

安装指引：ack，ag
关于 ack & ag 的更多信息

jq > grep 及其它

我是 jq 的忠实粉丝之一。当然一开始我也在它的语法里苦苦挣扎，好在我对查询语言还算有些使用心得，现在我对 jq 可以说是每天都要用。（不过从前我要么使用 grep 或者使用一个叫 json 的工具，相比而言后者的功能就非常基础了。）

我甚至开始撰写一个 jq 的教程系列（有 2500 字并且还在增加），我还发布了一个网页工具和一个 Mac 上的应用（这个还没有发布。）

jq 允许我传入一个 JSON 并且能非常简单的将其转变为一个使用 JSON 格式的结果，这正是我想要的。下面这个例子允许我用一个命令更新我的所有 node 依赖。（为了阅读方便，我将其分成为多行。）

$ npm i $(echo $(\
    npm outdated --json | \
    jq -r 'to_entries | .[] | "\(.key)@\(.value.latest)"' \
))

上面的命令将使用 npm 的 JSON 输出格式来列出所有过期的 node 依赖，然后将下面的源 JSON 转换为：

{
    "node-jq": {
        "current": "0.7.0",
        "wanted": "0.7.0",
        "latest": "1.2.0",
        "location": "node_modules/node-jq"
    },
        "uuid": {
        "current": "3.1.0",
        "wanted": "3.2.1",
        "latest": "3.2.1",
        "location": "node_modules/uuid"
    }
}

转换结果为：

[email protected]
[email protected]

上面的结果会被作为 npm install 的输入，你瞧，我的升级就这样全部搞定了。（当然，这里有点小题大做了。）

很荣幸提及一些其它的工具

我也在开始尝试一些别的工具，但我还没有完全掌握它们。（除了 ponysay，当我打开一个新的终端会话时，它就会出现。）

ponysay > cowsay
csvkit > awk 及其它
noti > display notification
entr > watch

你有什么好点子吗？

上面是我的命令行清单。你的呢？你有没有试着去增强一些你每天都会用到的命令呢？请告诉我，我非常乐意知道。

via: https://remysharp.com/2018/08/23/cli-improved

作者：Remy Sharp 选题：lujun9972 译者：DavidChenLiang 校对：pityonline, wxy

本文由 LCTT 原创编译，Linux中国荣誉推出