计算理论：图灵机

Nautilus

2021-10-08

course notes › theory of computation

theory

Turing Machine

Definition

TM 的构成包括一个状态寄存器（存储一个有限集中的状态），一个向左右无限延伸的 tape，tape 被分成很多个 cell，每个 cell 中可以填入一个 symbol，以及一个读写头

一个有限长的 string 被写在 tape 上，作为 input，而其余部分被 blank 填满，注意 blank 属于 tape alphabet，而不是 input alphabet

读写头总是指向某个 tape cell，默认开始时指向 input 的最左端。TM 的 move 由当前的状态和读写头指向的 cell 中的 symbol 决定，包含三个动作

修改状态
在当前 cell 写入新的符号
将读写头向左/右移动

更为形式化的叙述中，TM 由一个 7-tuple 定义

: the finite set of state
: input alphabet
: tape alphabet,
: transition function
: start state
: blank symbol,
: the finite set of accepting state,

其中的定义为，接受两个参数，当前状态与当前 tape symbol ，而其输入为一个 3-tuple ，其中

是下一个状态
是被写入当前 cell 的 symbol
是读写头移动的方向，可以是（表示左右）或是（表示不移动）

Instantaneous Descriptions for TM

正如 PDA 的 ID 一样，我们同样需要一个 ID 来描述运行中某一时刻时 TM 的全部信息

虽然 TM 有一个无限长的 tape，但是在有限步的 move 中，TM 所能访问到的 cell 是有限的。而在无限的未被访问到的 prefix/suffix 中，只可能是 blank 或是有限个输入符号，因此只需要在 ID 中显示在最左的非 blank 符号和最右的非 blank 符号之间的部分

TM 的 ID 是一个 string 形如

其中

是当前的状态
读写头指向第个 symbol
是最左的非 blank 符号和最右的非 blank 符号之间的部分

使用同样的记号来表示 ID 间的转换，而使用表示零步或多步转换。如果，则

TM 同样可以用转换图来表示，若，则从到有一条标号为的边

Language of TM

TM 同样有两种定义语言的方式

Acceptance by final state
Acceptance by halting

TM 的 halt 定义为当前状态为，tape symbol 为，而未定义

对于 TM ，若 acceptance by final state，其语言定义为

而 acceptance by halting 的定义为

同样可以证明这两种定义语言的方式是等价的，即给定一个 TM 满足，则存在 TM 满足，反之亦然

From Final State to Halting: 考虑 TM ，则可以构造，只需对于任意，删去，这样只要运行到 accept state，就 halt

为了防止运行中的意外 halt，引入新的状态，对任意有，即进入状态后 TM 无限向右移动，对于任意，若未定义，则令，即可避免非接受的情况下 halt

From Halting to Final State: 考虑 TM ，则可以构造，引入新的状态作为唯一的 final state，且对于所有，若未定义，则令

使用 final state 与使用 halting 定义的语言集合已经被证明是相同的，这个语言集合被称为递归可枚举语言 (recursively enumerable language)

算法 (Algorithm) 是一种特殊的 TM，其满足 accepting by final state，且不论是否接受都会 halt ，若某个 TM 是一个 algorithm，则称其定义的语言是递归语言 (recursive language)

Programming Techniques for TM

有很多有用的技巧可以使 TM 的编程更加方便，且这些技巧并没有改变基本的 TM 模型，而只是改变了表示的方式

具体的例子见课本 8.3 节

Storage in the State: 可以扩展 TM 的 state，使其成为一个 tuple（或者另一种说法，vector），从而携带更多的信息

这样的技巧并不会改变原本的 TM 模型，因为 state tuple 的每个分量都来自某个有限的 alphabet，则 state tuple 的集合，即这些 alphabet 的笛卡尔积，也是有限的，故仅仅是基本的 TM，将其状态用另一种更适合理解的方式表示

Multiple Tracks: 同理，可以扩展 tape cell，使其不止存储一个 symbol，而是存储一个 symbol 的 vector，transition function 对其整体进行修改

这样的技巧不改变原本的 TM 模型，因为其 tape alphabet 也是有限个有限 alphabet 的笛卡尔积，仍是有限集合，只是改变了 tape symbol 的表示方式

有了 multiple tracks 即可实现 marking 的功能，即在原来的基础上增加一个 track，用于存储记号，标记某些有特殊意义的位置

Subroutines: TM 的 subroutine 是一个 state 的集合，用于实现某种过程，其中有一个开始状态，也有一个状态在其上没有 move，用于实现返回的功能，对其的调用从状态迁移至开始状态开始。

Extension to the Basic TM

Multitape TM

multitape 的 TM 不同于多 track 的TM，后者虽然有多个 track 但是仍然是同时读写每一个 vector 的，而 multitape TM 有多个 tape ，即有多个读写头可以任意移动

在状态转换时，TM 改变状态，每个 tape 上的读写头修改当前 cell 的 symbol，然后独立地向左或右移动

可以证明 multitape TM 没有增加 TM 原有的能力，即

所有被 multitape TM 接受的语言都是 RE

Proof.

考虑一个有个 tape 的 TM ，则可以使用一个 one-tape TM 模拟其运行，有个 track，其中一半是的 tape 内容，另一半 tracks 每一个都有一个 mark，用于指示对应的 tape 的读写头位于何处，则将 multitape TM 的动作顺序处理即可，即找到第一个 tape 的 mark，然后处理第一条 tape，再找到第二个 tape 的 mark……

Q.E.D.

可以证明模拟步 k-tape TM 的时间复杂度为

Nondeterministic TM

与 TM 不同，NTM 的 transition function 的结果是一个集合，可以从中选择一个结果用于接下来的 move，即

只要对一个输入存在一个序列接受了即称该输入被 NTM 接受

NTM 并没有扩展 TM 的能力，如果是 NTM，则可以构造出一个 DTM 使得

Proof.

是一个 multitape 的 TM，第一个 tape 用于记录的 ID，同时使用一个 mark 来标记当前正处理到的 ID

对于正处理到的 ID，读取其状态和指向的 tape symbol，如果当前状态是 accept，则停止并接受，否则根据的 transition function，确认接下来的 move。若有个选择，则使用第二个 tape 将当前 ID 在 tape 结尾复制份，然后根据不同选择修改这些 ID。修改完成后回到原本的 ID，将 mark 移至下一个 ID

如果把从初始 ID 开始的 ID 转换看作一颗树，则所做的就是模拟树上的 BFS

如果在步后进入接受状态，且选择数的上界为，则最多只需要构造出个 ID 即可达到接受状态，即只要能接受，在有限步中也能接受。

Q.E.D.

Restricted TM

TM with semi-infinite tape

可以将 TM 的 tape 限制为仅向右边无限延伸，即在初始位置以左没有 cell，同样的可以限制 TM 永远不会写 blank，这样 tape 满足在一串非 blank symbol 后是无限的 blank，且这个非 blank 的序列从起始位置开始

semi-tape 的实现可以是两个 track，上半部分代表开始位置以右的部分，而下半部分代表开始位置以左的部分，第个位置代表和，对于开始位置，其对应的下半部分为一个特殊符号用于标记边界

可以证明任何被 TM 接受的语言都被一个 TM 接受，且满足

的 head 从不向开始位置以左移动
从不写 blank

Proof.

对于第二个限制，只需增加新的 tape symbol 用于模仿 blank 的功能，若有

则将其改为

对所有，令

对于第一个限制，设，且已修改过以满足限制 2，则构造

其中

：为，即两个状态，以及一个 2-tuple 的集合，第一个分量为的状态，第二个分量指示哪一条 track (upper/lower) 。

：其中元素为一个 2-tuple，两个分量均来自。对于输入符号，其第一个分量为一个来自 input alphabet 的 symbol，第二个分量为 blank，即，对于 blank，其两个分量均为 blank。此外还有特殊符号，用于标识 tape 的最左端

：其定义为

，即将 lower track 的最左端修改为，同时右移，因为在最左端不能左移
，即转移至的起始状态，同时左移，恢复到输入开始的位置，且指向 upper track
如果，则对于任意有

即模拟的运行，且注意由于折叠的原因，在 lower track 时方向相反
如果则

这个转换用于处理从初始位置向右走
如果则

用于处理从初始位置向左走

：其定义为，即第一分量为接受状态，不论其在 upper 或 lower track

显然对 TM 的 move 归纳，可以得出

Q.E.D.

Multistack Machines

如果给 PDA 增加一个 stack，则其接受任何 TM 能够接受的语言

一个 -stack machine 是一个 DPDA，有个栈。其处理输入的方式同 PDA（顺序读入）而非 TM（存储在 tape/stack）。其同样有一个有限的状态集，以及一个 stack alphabet，用于所有的 stack，其每一步动作取决于

当前状态
当前读入的输入符号，multistack machine 同样可以在上转换，但是因为其是 deterministic，故不能同时定义一个非转换和一个转换
每个 stack 的栈顶

而其动作包括

修改状态
对每个 stack，将其栈顶的 symbol 替换为一个有零个或多个 stack symbol 的 string

其 transition function 形如

为了方便，可以引入一个不在 input symbol 的符号用于代表输入的结束，则有

如果有被一个 TM 接受，则被一个 2-stack machine 接受

Proof.

两个 stack 可以用于模拟 TM 的一条 tape，即一个 stack 用于代表 head 以左的部分，一个 stack 用于代表 head 以右的部分。设 TM 为，2-stack machine 为，则

起始时每个栈有一个代表栈底的符号，这个 symbol 可以是栈的开始符号，仅能在栈底出现，当一个栈中只含这个符号时称这个栈为空
若输入为，则将复制到第一个栈中，当读到时停止复制
将第一个栈中所有符号弹出并压入第二个栈，这样第一个栈空，第二个栈顶为最左端
进入模拟的状态，第一个栈空表示 head 左端都是 blank，第二个栈为表示 head 及其右端都是

则可以模拟的动作，根据

当前状态，即的状态（模拟的 finite control）
的 head 指向的 symbol，即第二个栈的栈顶，若栈顶为栈底符号，则认为指向 blank
根据以上信息得知新的状态
如果写并向右移动，则将压入第一个栈，且将第二个栈的栈顶弹出。若第二个栈空，则第二个栈不变；同样的，若为 blank 且第一个栈空，则第一个栈不变
如果写并向左移动，则将第一个栈的栈顶，设为，弹出，并且将第二个栈的栈顶弹出，压入。如果第一个栈为空，则第一个栈不变，弹出第二个栈的栈顶，压入。

若接受则接受

Q.E.D.

Power of Counter Machines

counter machine 能存储有穷个整数（counter），并且根据某些 counter 是否为零来实现不同的动作。counter machine 只能对某个 counter 增 1 或减 1，且不能区分两个非零的 counter。从另一种视角来看，counter 是一个只有两种符号的 stack，其中一个 symbol 代表栈底，另一个可以被压入或弹出（计数）。对于 counter machine 有以下两个结论

任何能被 counter machine 接受的语言都是 RE，因为 counter machine 是一种特殊的 multistack machine，而 multistack machine 是一种特殊的 multitape TM
任何能被 one-counter machine 接受的语言都是 CFL，因为 counter 可以看作 stack，而 one-stack machine 就是 PDA

而只有两个 counter 的 counter machine 即可模拟 TM，这个结论分为两步

任意 RE language 都能被一个 3-counter machine 接受

Proof.

根据上文结论，任意 RE language 都能被一个 2-stack machine 接受，则可以用 counter 模拟 stack。

考虑 stack machine 使用了个 tape symbol，则可以用数字 1 到来代表这些 symbol，这样栈中的内容就可以表示为一个进制的整数，即栈中表示为整数

使用两个 counter 用于保存两个 stack 中的内容，第三个 counter 用于调整两个 counter，即用于将某个 counter 乘以或除以

对于栈的操作，可以拆分为三种基本操作：弹出栈顶，替换栈顶，压入新符号。对于一个用整数代表的栈，这三种操作为

弹出栈顶：将变为，并且不保留余数（即结果向下取整，余数为），其步骤为
- 第三个 counter 为 0
- 重复将目标 counter 减去，同时将第三个 counter 加 1
- 当目标 counter 为 0 时，停止
- 重复将目标 counter 加 1，同时将第三个 counter 减 1
- 当第三个 counter 为 0 时目标 counter 为
将栈顶的变为：如果则将目标 counter 减少，否则将目标 counter 增加
压入：需要将目标 counter 从变为，则
- 第三个 counter 为 0
- 重复将目标 counter 减 1，同时将第三个 counter 加
- 当目标 counter 为 0 时，第三个 counter 为
- 将第三个 counter 复制到目标 counter ，则第三个 counter 为 0
- 将目标 counter 增加

这样只需要将 counter 设置为 stack 初始的情况，即将其设为代表 stack 开始符号的整数，然后即可模拟 2-stack machine

Q.E.D.

任意 RE language 都能被一个 2-counter machine 接受

Proof.

根据上文结论，只需要证明一个 3-counter 能被一个 2-counter 模拟即可

思路为将 3 个 counter，用一个整数模拟，如。其中一个 counter 用于保存，同时另一个 counter 用于辅助乘除操作

增加：将乘以 2 或 3 或 5 即可
测试是否为 0：判断能否被 2/3/5 除尽即可，这一步可以通过有限的状态转换做到
减少：只需将除以 2/3/5 ，因为 counter 不能减到负数，因此当不能除尽时代表原来的 3-counter 的操作使某个 counter 减到了负数，这样只需要 halt 即可

Q.E.D.

Closure Properties of Recursive and RE languages

对于 recursive language 和 RE language，以下操作均封闭

union
concatenation
star
reversal
intersection
inverse homomorphism

对于 recursive language，以下操作封闭

difference
complementation

对于 RE language，以下操作封闭

homomorphism

Union: 令，且都是 single-semi-infinite-tape TM

构造一个 2-tape 的 TM 并且将输入复制到两个 tape，平行地模拟即可

对于 recursive language，若均是 algorithm，则必定能 halt，只需当两个 TM 至少有一个接受，接受，若两个 TM 都拒绝，则拒绝
对于 RE language，只需两个 TM 至少有一个接受，接受

Concatenation: 令，且都是 single-semi-infinite-tape TM

构造一个 2-tape 的 NTM ，根据猜测将输入分割为，将复制到第二个 tape 并开始平行地模拟，当两个模拟均接受时接受

由于是 NTM，根据定义其只要有一条路径能接受即可接受，而若使用 DTM 并顺序模拟拆分过程可能导致在某个拆分结果上永远运行（对 RE 而言，若是 recursive 则总能停止）

Star: 思路同 concatenation，对于 RE 而言，构造 NTM 以猜测任意可能的 break，只要每一个 piece 都被接受则接受。对于 recursive 而言，只需顺序尝试所有可能的 break 即可

Intersection: intersection 的思路与 union 完全相同，只需改变接受条件即可

Difference: 思路同 union，对于 recursive language，只需 halt 后判断是否接受且拒绝即可，但是对于 RE，由于其 TM 不保证一定能在不接受时给出结果，当始终不 halt 时并不能判断输入是否属于

Complementation: complementation 是全集的 difference

Reversal: 只需要在开始时将输入反转，然后正常模拟原本的 TM 即可，不论对 RE 还是 recursive 都是如此

Homomorphism: 对于 homomorphism ，构造一个 NTM 猜测一个使得，若能被原 TM 接受，则被 NTM 接受，显然这个构造对 RE 是适用的而对 recursive 不适用，因为若是则总能找到符合的，但是的选择可以是 infinite 的，在没有符合要求的时 TM 或许不会 halt

Inverse Homomorphism: 对于一个 homomorphism ，只需要在开始时将应用于输入，然后模拟 TM 判断其是否接受即可，不论对 RE 还是 recursive 都是如此