$\LaTeX{}$ 的基本概念(一)
本文主体内容来自一份 (不太) 简短的 LATEX2ε 介绍。
欢迎使用 \(\LaTeX{}\)!本文开头介绍了\(\LaTeX{}\)的来源,然后介绍了\(\LaTeX{}\)源代码的写法,编译\(\LaTeX{}\)源代码生成文档的方法,以及理解接下来的章节的一些必要知识。
概述
\(\TeX\)
\(\TeX{}\) 是高德纳 (Donald E.~Knuth) 为排版文字和数学公式而开发的软件。1977 年,正在编写《计算机程序设计艺术》的高德纳意识到每况愈下的排版质量将影响其著作的发行,为扭转这种状况,他着手开发 \(\TeX{}\),发掘当时刚刚用于出版工业的数字印刷设备的潜力。1982 年,高德纳发布 \(\TeX{}\) 排版引擎,而后在 1989 年又为更好地支持 8-bit 字符和多语言排版而予以改进。\(\TeX{}\) 以其卓越的稳定性、跨平台能力和几乎没有 bug 的特性而著称。它的版本号不断趋近于 \(\pi\),当前为 3.141592653。
\(\LaTeX{}\)
\(\LaTeX{}\) 是一种使用 \(\TeX{}\) 程序作为排版引擎的格式,可以粗略地将它理解成是对 \(\TeX{}\) 的一层封装。 \(\LaTeX{}\) 最初的设计目标是分离内容与格式,以便作者能够专注于内容创作而非版式设计,并能以此得到高质量排版的作品。\(\LaTeX{}\) 起初由 Leslie Lamport 博士开发,目前由 \(\LaTeX{}\) 工作组1进行维护。
\(\LaTeX{}\) 的优缺点
\(\LaTeX{}\) 的一些优点:
- 具有专业的排版输出能力,产生的文档看上去就像“印刷品”一样。
- 具有方便而强大的数学公式排版能力,无出其右者。
- 绝大多数时候,用户只需专注于一些组织文档结构的基础命令,无需(或很少)操心文档的版面设计。
- 很容易生成复杂的专业排版元素,如脚注、交叉引用、参考文献、目录等。
- 强大的可扩展性。世界各地的人开发了数以千计的 \(\LaTeX{}\) 宏包用于补充和扩展 \(\LaTeX{}\) 的功能。
- 能够促使用户写出结构良好的文档——而这也是 \(\LaTeX{}\) 存在的初衷。
- \(\LaTeX{}\) 和 \(\TeX{}\) 及相关软件是跨平台、免费、开源的。
\(\LaTeX{}\) 的缺点:
- 入门门槛高。
- 不容易排查错误。\(\LaTeX{}\) 作为一个依靠编写代码工作的排版工具,其使用的宏语言比 C++ 或 Python 等语言在错误排查方面困难得多。它虽然能够提示错误,但不提供调试的机制,有时错误提示还很难理解。
- 不容易定制样式。\(\LaTeX{}\) 提供了一个基本上良好的样式,为了让用户不去关注样式而专注于文档结构。但如果想要改进 \(\LaTeX{}\) 生成的文档样式则是十分困难的。
- 相比“所见即所得”的模式有一些不便,为了查看生成文档的效果,用户总要不停地编译。
Hello, World
1 | \documentclass{article} |
这里首先介绍如何编译使用这份源代码,在后续小节中再介绍源代码的细节。你可以将这份源代码保存为helloworld.tex,而后编译。具体来说:
如果使用TeXworks 或TeXstudio 等编辑器,可以使用编辑器提供的“编译”或“排版”按钮。建议使用 pdfLaTeX 或 XeLaTeX 作为默认的编译方式。
如果使用命令行方式进行编译,打开终端,在源代码所在的目录下输入:
1
pdflatex helloworld
或者
1
xelatex helloworld
如果编译成功,可以在helloworld.tex 所在目录看到生成的helloworld.pdf 以及一些其它文件。
下面是排版中文的一个最简示例。编译的方式与上一份源代码相同,但需使用 XeLaTeX编译方式。
1 | \documentclass{ctexart} |
\(\LaTeX{}\) 命令和代码结构
\(\LaTeX{}\) 的源代码为文本文件。这些文本除了文字本身,还包括各种命令,用在排版公式、划分文档结构、控制样式等等不同的地方。
\(\LaTeX{}\) 命令和环境
\(\LaTeX{}\) 中命令以反斜线
\
开头,为以下两种形式之一:
反斜线和后面的一串字母,如
\{LaTeX}
。它们以任意非字母符号(空格、数字、标点等)为界限。反斜线和后面的单个非字母符号,如
\$
。
注意 \(\LaTeX{}\)
命令对大小写敏感,比如输入 \{LaTeX}
命令可生成错落有致的 \(\LaTeX{}\)
字母组合,但输入 \{Latex}
或 \{LaTex}
什么都得不到,还会报错。
字母形式的 \(\LaTeX{}\)
命令忽略其后的所有连续空格。如果要人为引入空格,需要在命令后面加一对花括号阻止其忽略空格:
一些 \(\LaTeX{}\) 命令可以接收一些参数,参数的内容会影响命令的效果。\(\LaTeX{}\) 的参数分为可选参数和必选参数。可选参数以方括号 [ 和 ] 包裹;必选参数一般以花括号 { 和 } 包裹2。还有些命令可以带一个星号 *,带星号和不带星号的命令效果有一定差异。初次接触这些概念时,可以粗略地把星号看作一种特殊的可选参数。
\(\LaTeX{}\)
中还包括环境,用以令一些效果在局部生效,或是生成特殊的文档元素。\(\LaTeX{}\) 环境的用法为一对命令
\begin
和 \end
:
1 | \begin{<environment name>}[<optional arguments>]{<mandatory arguments>} |
有些命令(如
\bfseries
)会对其后所有内容产生作用。若要限制其作用范围,则需要使用分组。\(\LaTeX{}\) 使用一对花括号{ }
作为分组,在分组中使用的命令被限制在分组内,不会影响到分组外的内容3。上文提到的 \(\LaTeX{}\)
环境隐含了一个分组,在环境中的命令被包裹在分组内。
\(\LaTeX{}\) 源代码结构
\(\LaTeX{}\) 源代码以一个
\{documentclass}
命令作为开头,它指定了文档使用的文档类。document
环境当中的内容是文档正文。 在 \documentclass
和
\begin{document}
之间的位置称为导言区。
在导言区中常会使用 \usepackage{}
命令调用宏包,还会进行文档的全局设置。
1 | \documentclass{...} % ... 为某文档类 |
\(\LaTeX{}\) 宏包和文档类
文档类
文档类规定了 \(\LaTeX{}\)
源代码所要生成的文档的性质——普通文章、书籍、演示文稿、个人简历等。\(\LaTeX{}\)
源代码的开头须用\documentclass
指定文档类:
\documentclass[<options>]{<class-name>}
其中<class-name>
为文档类的名称,如 \(\LaTeX{}\) 提供的
article
、report
、book
,在其基础上派生的一些文档类,如支持中文排版的
ctexart
、ctexrep
、ctexbook
,或者有其它功能的文档类,如
moderncv
、beamer
等。\(\LaTeX{}\)
提供的基础文档类见下表,其中前三个习惯上称为“标准文档类”。
文档类 | 说明 |
---|---|
article | 文章格式的文档类,广泛用于科技论文、报告、说明文档等。 |
report | 长篇报告格式的文档类,具有章节结构,用于综述、长篇论文、简单的书籍等。 |
book | 书籍文档类,包含章节结构和前言、正文、后记等结构。 |
proc | 基于article
文档类的一个简单的学术文档模板。 |
slides | 幻灯格式的文档类,使用无衬线字体。 |
minimal | 一个极其精简的文档类,只设定了纸张大小和基本字号,用作代码测试的最小工作示例。 |
可选参数 <options>
为文档类指定选项,以全局地规定一些排版的参数,如字号、纸张大小、单双面等等。比如调用
article
文档类排版文章,指定纸张为 A4 大小,基本字号为
11pt,双面排版:
\documentclass[11pt,twoside,a4paper]{article}
\(\LaTeX{}\) 的三个标准文档类可指定的选项包括:
options | 含义 |
---|---|
\(\texttt{10pt, 11pt, 12pt}\) | 指定文档的基本字号。默认为 \(\texttt{10pt}\)。 |
\(\texttt{a4paper,letterpaper,...}\) | 指定纸张大小,默认为美式信纸(\(8.5\,\text{in}\times11\,\text{in}\)大约相当于 \(21.6\,\text{cm}\times28.0\,\text{cm}\))。可指定选项还包括 \(\texttt{a5paper}\),\(\texttt{b5paper}\),\(\texttt{executivepaper}\) 和 \(\texttt{legalpaper}\)。 |
\(\texttt{twoside, oneside}\) | 指定单面/双面排版。双面排版时,奇偶页的页眉页脚、页边距不同。article
和 report 默认为 \(\texttt{oneside}\),book
默认为 \(\texttt{twoside}\)。 |
\(\texttt{onecolumn, twocolumn}\) | 指定单栏/双栏排版。默认为 \(\texttt{onecolumn}\)。 |
\(\texttt{openright, openany}\) | 指定新的一章 chapter
是在奇数页(右侧)开始,还是直接紧跟着上一页开始。report
默认为 \(\texttt{openany}\),book
默认为 \(\texttt{openright}\)。对
article 无效。 |
\(\texttt{landscape}\) | 指定横向排版。默认为纵向。 |
\(\texttt{titlepage, notitlepage}\) | 指定标题命令 \maketitle
是否生成单独的标题页。article 默认为 \(\texttt{notitlepage}\),report
和 book 默认为 \(\texttt{titlepage}\)。 |
\(\texttt{fleqn}\) | 令行间公式左对齐。默认为居中对齐。 |
\(\texttt{leqno}\) | 将公式编号放在左边。默认为右边。 |
\(\texttt{draft, final}\) | 指定草稿/终稿模式。草稿模式下,断行不良(溢出)的地方会在行尾添加一个黑色方块;插图、超链接等功能也会受这一组选项影响,具体见后文。默认为 \(\texttt{final}\)。 |
宏包
在使用 \(\LaTeX{}\)
时,时常需要依赖一些扩展来增强或补充 \(\LaTeX{}\)
的功能,比如排版复杂的表格、插入图片、增加颜色甚至超链接等等。这些扩展称为宏包。调用宏包的方法非常类似调用文档类的方法:
\usepackage[<options>]{<package-name>}
\usepackage
可以一次性调用多个宏包,在
<package-name>
中用逗号隔开。这种用法一般不要指定选项4。
1 | % 一次性调用三个排版表格常用的宏包 |
在使用宏包和文档类之前,一定要首先确认它们是否安装在你的计算机中,否则
\usepackage
等命令会报错误。
宏包(包括前面所说的文档类)可能定义了许多命令和环境,或者修改了 \(\LaTeX{}\) 已有的命令和环境。它们的用法说明记在相应宏包和文档类的帮助文档。在 Windows 命令提示符或者 Linux 终端下输入命令可查阅相应文档:
1 | texdoc <pkg-name> |
其中 <pkg-name}>
是宏包或者文档类的名称。
\(\LaTeX{}\) 用到的文件一览
除了源代码文件 \(\texttt{.tex}\) 以外,我们在使用 \(\LaTeX{}\) 时还可能接触到各种格式的文件。本节简单介绍一下经常见到的文件。
每个宏包和文档类都是带特定扩展名的文件,除此之外也有一些文件出现于 \(\LaTeX{}\) 模板中:
\(\texttt{.sty}\) | 宏包文件。宏包的名称与文件名一致。 |
---|---|
\(\texttt{.cls}\) | 文档类文件。文档类名称与文件名一致。 |
\(\texttt{.bib}\) | 参考文献数据库文件。 |
\(\texttt{.bst}\) | 用到的参考文献格式模板。 |
在编译过程中可能会生成相当多的辅助文件和日志。一些功能如交叉引用、参考文献、目录、索引等,需要先通过编译生成辅助文件,然后再次编译时读入辅助文件得到正确的结果,所以复杂的源代码可能要编译多次。
中间文件 | 作用 |
---|---|
\(\texttt{.log}\) | 排版引擎生成的日志文件,供排查错误使用。 |
\(\texttt{.aux}\) | 生成的主辅助文件,记录交叉引用、目录、参考文献的引用等。 |
\(\texttt{.toc}\) | 生成的目录记录文件。 |
\(\texttt{.lof}\) | 生成的图片目录记录文件。 |
\(\texttt{.lot}\) | 生成的表格目录记录文件。 |
\(\texttt{.bbl}\) | BibTeX生成的参考文献记录文件。 |
\(\texttt{.blg}\) | BibTeX生成的日志文件。 |
\(\texttt{.idx}\) | 生成的供 makeindex
处理的索引记录文件。 |
\(\texttt{.ind}\) | makeindex 处理 \(\texttt{.idx}\)
生成的用于排版的格式化索引文件。 |
\(\texttt{.ilg}\) | makeindex
生成的日志文件。 |
\(\texttt{.out}\) | hyperref 宏包生成的 PDF
书签记录文件。 |
文件的组织方式
当编写长篇文档时,例如当编写书籍、毕业论文时,单个源文件会使修改、校对变得十分困难。将源文件分割成若干个文件,例如将每章内容单独写在一个文件中,会大大简化修改和校对的工作。
\(\LaTeX{}\) 提供了命令
\include
用来在源代码里插入文件:
\include{<filename>}
<filename>
为文件名(不带 \(\texttt{.tex}\) 扩展名)5,如果和要编译的主文件不在一个目录中,则要加上相对或绝对路径,例如:
1 | \include{chapters/file} % 相对路径 |
值得注意的是 \include
在读入\input
命令,它纯粹是把文件里的内容插入:
\input{<filename>}
当导言区内容较多时,常常将其单独放置在一个 \(\texttt{.tex}\) 文件中,再用
\input
命令插入。复杂的图、表、代码等也会用类似的手段处理。
\(\LaTeX{}\) 还提供了一个
\includeonly
命令来组织文件,用于导言区,指定只载入某些文件。导言区使用了
\includeonly
后,正文中不在其列表范围的
\include
命令不会起效:
\includeonly{<filename1>,<filename2>,...}
需要注意的是,使用 \include
和 \input
命令载入的文件名最好不要加空格和特殊字符,也尽量避免使用中文名,否则很可能会出错。
最后介绍一个实用的工具宏包syntonly
。加载这个宏包后,在导言区使用
\syntaxonly
命令,可令编译后不生成 DVI 或者 PDF
文档,只排查错误,编译速度会快不少:
1 | \usepackage{syntonly} |
如果想生成文档,则用 % 注释掉 \syntaxonly
命令即可。
\(\LaTeX{}\) 和 \(\TeX{}\) 相关的术语和概念
在本章的最后有必要澄清几个概念:
- 引擎 全称为排版引擎,是编译源代码并生成文档的程序,如 pdfTeX、XeTeX等 。有时也称为编译器(类似于GCC、MSVC的功能)。
- 格式
是定义了一组命令的代码集(类似于库函数)。\(\LaTeX{}\)
就是最广泛应用的一个格式,高德纳本人还编写了一个简单的 plain TeX
格式,没有定义诸如
\documentclass
和\section
等命令。 - 编译命令 是实际调用的、结合了引擎和格式的命令。如 \(\texttt{xelatex}\) 命令是结合 XeTeX引擎和 \(\LaTeX{}\) 格式的一个编译命令(类似于编译并链接库函数的过程)。
常见的引擎、格式和编译命令的关系总结于下表。
文档格式 | plain TeX 格式 | LaTeX 格式 | |
---|---|---|---|
TeX 引擎 | \(\textrm{DVI}\) | \(\texttt{tex}\) | N/A |
pdfTeX 引擎 | \(\textrm{DVI}\) | \(\texttt{etex}\) | \(\texttt{latex}\) |
\(\textrm{PDF}\) | \(\texttt{pdftex}\) | \(\texttt{pdflatex}\) | |
XeTeX 引擎 | \(\textrm{PDF}\) | \(\texttt{xetex}\) | \(\texttt{xelatex}\) |
LuaTeX 引擎 | \(\textrm{PDF}\) | \(\texttt{luatex}\) | \(\texttt{lualatex}\) |
\(\texttt{latex}\) 编译命令和 \(\LaTeX{}\) 格式往往容易混淆,在讨论关于 \(\LaTeX{}\) 的时候需要明确。
在此介绍一下几个编译命令的基本特点:
编译命令 | 解释 |
---|---|
\(\texttt{latex}\) | 虽然名为 \(\texttt{latex}\) 命令,底层调用的引擎其实是 pdfTeX。 该命令生成 \(\texttt{dvi}\)格式的文档, 用 \(\texttt{dvipdfmx}\) 命令可以将其转为 \(\texttt{pdf}\)。 |
\(\texttt{pdflatex}\) | 底层调用的引擎也是 pdfTeX,可以直接生成 \(\texttt{pdf}\) 格式的文档。 |
\(\texttt{xelatex}\) | 底层调用的引擎是 XeTeX,支持 UTF-8 编码和对 TrueType/OpenType 字体的调用。 当前较为方便的中文排版解决方案基于 \(\texttt{xelatex}\)。 |
\(\texttt{lualatex}\) | 底层调用的引擎是 LuaTeX。这个引擎在pdfTeX
引擎基础上发展而来,除了支持 UTF-8 编码和对 TrueType/OpenType
字体的调用外,还支持通过 Lua 语言扩展 \(\TeX{}\) 的功能。 \(\texttt{lualatex}\)
编译命令下的中文排版支持需要借助 luatexja 宏包。 |
参考文献
[1] Partl H, Hyna I, Schlegl E. 一份 (不太) 简短的 LATEX2ε 介绍[J].
2024. https://github.com/CTeX-org/lshort-zh-cn