lang-c 模板系统设计:为 C 语言引入泛型编程能力

1. 引言：C 语言与泛型编程的鸿沟
2. 语法特性速览
3. 模板结构体与函数
4. 特化与偏特化机制
5. 变长模板与递归展开
6. 系统架构与核心流程
7. 名称修饰与类型替换算法
8. 嵌套实例化的正确性保证
9. 代码生成与转译工具
10. 已知限制与设计取舍

1. 引言：C 语言与泛型编程的鸿沟

C 语言以其极简、高效和可移植性成为系统编程的基石。然而，缺乏泛型支持始终是 C 开发者心中的痛点。传统的解决方案——宏展开或 void* 类型擦除——要么牺牲类型安全，要么带来运行时开销。

lang-c 项目是一个用 Rust 编写的轻量级 C 语言解析器，几乎完整支持 C11 标准，并额外提供了 GCC/Clang 扩展。本文聚焦于其最新特性：类 C++ 模板系统。该设计允许开发者在 C 代码中书写 template<typename T> struct Box { T value; };，并通过转译工具生成纯 C 代码，从而在零运行时开销的前提下获得泛型能力。

本文将从语法、架构、实例化算法、名称修饰、变长模板展开等多个维度，系统性地剖析这一模板系统的设计思路与实现细节。

2. 语法特性速览

lang-c 的模板语法与 C++ 高度兼容，但做了简化与取舍：

• 模板声明：使用 template<typename T, int N> 语法。
• 模板载体：支持 struct、函数、变量声明，不支持 class。
• 特化：支持全特化 (template<>) 和偏特化 (template<typename T> struct X<T*>）。
• 变长参数：使用 typename... Args 表示类型包。
• 实例化语法：类型位置使用 Box<int>，函数调用必须显式指定参数 add<int>(1,2)。
• 名称修饰：实例被重命名为 __Name_Arg1_Arg2__，避免符号冲突。

与 C++ 的关键区别在于：无类型推导、无 SFINAE、无模板模板参数（预留）。这些限制简化了解析器与实例化引擎的复杂度，同时保证了输出的可预测性。

3. 模板结构体与函数

3.1 结构体模板

template<typename T, int N>
struct Array {
    T data[N];
};

// 使用
Array<int, 3> arr;
Array<Array<float, 2>, 4> matrix;

转译后的 C 代码：

struct __Array_int_3__ {
    int data[3];
};

struct __Array_Array_float_2___4__ {
struct __Array_float_2__ data[4];
};

struct __Array_int_3__ arr;
struct __Array_Array_float_2___4__ matrix;

注意嵌套模板的名称修饰：内层 Array<float,2> 先被修饰为 __Array_float_2__，然后外层使用该修饰名作为类型参数，最终得到 __Array_Array_float_2___4__。

3.2 函数模板

template<typename T>
T add(T a, T b) {
    return a + b;
}

int x = add<int>(1, 2);

转译后：

int __add_int__(int a, int b) {
    return a + b;
}

int x = __add_int__(1, 2);

函数模板体内部可以包含局部变量、调用其他模板函数或使用模板结构体。实例化引擎会递归处理所有嵌套依赖。

3.3 变量模板（C++14 风格）

虽然 C++14 引入了变量模板，lang-c 将其简化为模板化的全局变量声明：

template<typename T>
const T pi = (T)3.14159;

float f = pi<float>;

转译后生成 const float __pi_float__ = (float)3.14159;。这一特性在编译期常量泛型化场景中十分有用。

4. 特化与偏特化机制

4.1 全特化

当所有模板参数都被具体类型取代时，使用全特化提供定制实现：

template<typename T>
struct Box { T value; };

template<>
struct Box<char> {
    char* str;
};

实例化 Box<char> 时，将采用特化版本而非通用模板。

4.2 偏特化

偏特化匹配参数的部分模式。例如，为指针类型提供特殊存储布局：

template<typename T>
struct Box<T*> {
    T* ptr;
    int ref_count;
};

当代码中出现 Box<int*> 时，偏特化规则被触发，生成 __Box_int_ptr__ 结构体，包含 ptr 和 ref_count 两个成员。

4.3 特化匹配算法

实例化引擎在决定使用通用模板还是某个特化时，遵循以下优先级：

1. 收集所有与模板名称匹配的特化声明。
2. 计算每个特化的参数模式与实参列表的匹配程度（精确匹配 > 偏特化匹配）。
3. 如果存在多个候选，选择最特化的那个；如果出现二义性，报告错误。

当前实现未实现复杂的偏序规则，但对于大多数实际用例（如 T* 与 const T* 模式）已经足够。

5. 变长模板与递归展开

5.1 语法与空特化

变长模板允许接受任意数量的类型参数，是实现 tuple 等高级泛型的基础：

template<typename... Types>
struct tuple;

template<>
struct tuple<> { };   // 空特化，递归终止

template<typename T>
struct tuple<T> {     // 单元素特化
    T value;
};

5.2 递归实例化过程

当用户书写 tuple<int, float, char> 时，引擎执行以下步骤：

• 检查是否有精确匹配的特化（如 tuple<int,float,char>） → 无。
• 检查是否有偏特化匹配参数数量为 3 → 无。
• 进入默认递归展开：

• 头部：第一个参数类型 int。
• 尾部：剩余参数 float, char 实例化的类型名称 __tuple_float_char__。
• 生成结构体 __tuple_int_float_char__ { int head; __tuple_float_char__ tail; }。

• 递归处理 tuple<float, char>：

• 头部 float，尾部 __tuple_char__。
• 生成 __tuple_float_char__ { float head; __tuple_char__ tail; }。

• 递归处理 tuple<char>：

• 匹配单元素特化 template<typename T> struct tuple<T>。
• 生成 __tuple_char__ { char value; }。

• 递归终止：tuple<> 空特化不会生成任何成员。

最终输出代码形成嵌套链表结构，访问第 N 个元素需要逐层遍历 tail。

5.3 可视化递归展开

该结构与 C++ 的 std::tuple 经典实现如出一辙，但生成的是纯 C 代码，无任何运行时类型信息开销。

6. 系统架构与核心流程

整个模板系统由四个主要组件构成，形成从源码到目标代码的流水线。

6.1 解析层

基于 rust-peg 的 PEG 解析器识别 template<>、typename、... 等记号，构建包含 TemplateDeclaration、TemplateSpecialization 节点的 AST。PEG 的有序选择特性被用于区分模板函数调用与普通函数调用。

6.2 注册层

TemplateRegistry 维护两个哈希表：

• templates: HashMap<String, TemplateDecl>
• specializations: HashMap<String, Vec<TemplateSpec>>

在 AST 遍历的第一阶段收集所有模板声明，为后续实例化提供查找依据。

6.3 实例化引擎

这是系统的核心，执行以下任务：

• 根据使用点（TemplateTypeUse 或 TemplateFunctionCall）计算 mangled 名称。
• 查找是否已实例化（缓存命中则跳过）。
• 选择通用模板或匹配的特化。
• 克隆模板主体，建立类型替换映射（T -> int）。
• 递归实例化所有嵌套模板使用。
• 替换所有类型引用为 mangled 名称。
• 返回实例化后的声明列表。

6.4 代码生成器

CodeGenerator 将实例化后的 AST 转换回 C 代码。关键转换包括：

• TemplateTypeUse → TypedefName（mangled 名称）
• TemplateFunctionCall → Call（mangled 名称）
• 删除所有模板元节点（TemplateDeclaration 等）。

7. 名称修饰与类型替换算法

7.1 名称修饰规则

pub fn mangle_name(name: &str, arguments: &[Node<TemplateArgument>]) -> String {
    let mut result = String::from("__");
    result.push_str(name);
    for arg in arguments {
        result.push('_');
        mangle_argument(&mut result, &arg.node);
    }
    result.push_str("__");
    result
}

参数修饰规则：

参数类型	示例	修饰结果
基本类型	`int`	`int`
复合类型	`Box<int>`	`Box_int`
指针类型	`int*`	`int_ptr`
多词类型	`unsigned long`	`unsigned_long`
非类型常量	`3`	`3`
字符串字面量	`"hello"`	`str_hello` （转义）

为什么使用双下划线前后缀？
C 标准保留所有以双下划线开头的标识符供实现使用，因此用户代码不会意外定义相同名称，避免了符号冲突。

7.2 类型替换算法流程

该算法保证了从内向外逐层实例化，避免生成不完整的中间类型。例如 Box<Box<int>> 的处理顺序：

1. 实例化 Box<int> → __Box_int__
2. 替换外层 Box 的模板参数为 __Box_int__
3. 实例化 Box<__Box_int__> → __Box_Box_int__

8. 嵌套实例化的正确性保证

嵌套实例化是模板系统中最容易出错的环节。考虑如下代码：

template<typename T>struct Outer {
    Inner<T> field;   // Inner 是另一个模板
};

template<typename U>struct Inner { U value; };

Outer<int> o;

引擎必须先生成 Inner<int>，然后才能生成 Outer<int> 的成员定义。lang-c 通过以下机制保证顺序：

• 依赖收集：在替换完当前模板的参数后，扫描主体中的每个 TemplateTypeUse，将其加入依赖列表。
• 拓扑排序：虽然当前实现未做显式拓扑排序，但由于实例化过程是递归的（先处理子节点再处理父节点），天然满足依赖顺序。
• 缓存检查：每个 mangled 名称只实例化一次，重复依赖不会导致无限递归。

对于变长模板，递归深度等于参数数量，栈空间安全（Rust 默认栈足够支持数百层递归）。

9. 代码生成与转译工具

9.1 转译工具用法

项目提供了 transpile 二进制工具：

cargo run --bin transpile -- input.c -o output.c

输入 input.c 可包含模板声明、特化和使用点；输出 output.c 是纯 C 代码，不包含任何模板元语法。

9.2 生成代码的编译要求

生成的 C 代码符合 C99/C11 标准，无任何外部依赖。开发者可以使用任何标准 C 编译器（GCC、Clang、MSVC）编译。

9.3 格式化与可读性

CodeGenerator 采用空格前缀策略，避免输出多余空格。每个 AST 节点都有专门的 emit 方法，递归构建最终字符串。虽然输出的 mangled 名称较长，但保持了唯一性和可读性（例如 __Array_int_3__ 比 _Z5ArrayIiLi3EE 友好得多）。

10. 已知限制与设计取舍

10.1 显式类型参数强制

与 C++ 不同，lang-c 要求模板函数调用必须写出全部类型参数：

add<int>(1, 2);   // OK
add(1, 2);        // 解析为普通函数，不会实例化模板

这一限制简化了重载解析和类型推导的实现，也避免了复杂的 SFINAE 规则。对于绝大多数场景，显式参数带来的冗长性是可接受的。

10.2 不支持类模板的成员函数体外定义

C++ 允许在类模板外部定义成员函数：

template<typename T>
struct X {
void f();
};

template<typename T>
void X<T>::f() { }

lang-c 当前不支持这种分离定义，所有模板成员函数必须在结构体体内定义。这是一个未来可扩展的点。

10.3 无模板模板参数（完全）

虽然 AST 中预留了 TemplateParameterKind::Template 变体，但语法和实例化引擎尚未完全实现。这意味着不能写出：

template<template<typename>class Container, typename T>
struct Wrapper {
    Container<T> obj;
};

该特性的复杂度较高，将在后续版本中逐步引入。

10.4 设计取舍总结

取舍点	选择	理由
类型推导	不支持	降低实例化引擎复杂度
SFINAE	不支持	避免错误恢复与重载规则
模板模板参数	预留未实现	需要二阶实例化，复杂度高
名称修饰	可读性优先	调试友好，符号长度可接受
代码生成	纯 C	最大化兼容性，无运行时依赖

这些取舍使 lang-c 模板系统在简洁性、可预测性和实用性之间取得了平衡。项目已开源，欢迎试用、反馈和贡献。

目录