一、什么是内核模块导出符号?

1.1 模块间的资源共享

想象一个工厂里有多个车间:

  • 机械加工车间有精密车床(函数)
  • 电子车间有示波器(变量)
  • 装配车间需要使用车床加工零件,但自己没有
  • 此时机械车间可以 "导出" 车床使用权,让装配车间调用

在内核中,模块 A 可以将自己的函数或变量 "导出",供模块 B 使用,这就是导出符号的核心思想。

1.2 符号的本质

在内核中,符号(Symbol)就是函数或全局变量的名称。每个符号对应内存中的一个地址:

  • 函数名 → 代码段中的起始地址
  • 变量名 → 数据段中的存储位置

导出符号就是把这些名称和地址注册到一个公共表(内核符号表)中,让其他模块可以通过名称找到并使用它们。

内核通过符号表(Symbol Table)记录所有全局符号的地址信息,分为两种类型:

  • 静态符号:仅在编译单元内可见(如static修饰的函数)
  • 全局符号:可被其他模块访问(需显式导出)
1.3 符号表结构

通过readelf -s可查看模块符号表:

代码语言:javascript

AI代码解释

readelf -s hello.ko
# 输出示例:
# Num: Value    Size Type    Bind   Ndx Name
# 12: 00000000     4 FUNC    GLOBAL DEFAULT   1 public_function
  • Bind:符号绑定类型(LOCAL/GLOBAL/WEAK)
  • Ndx:段索引(UND表示未定义)
  • Type:符号类型(FUNC/OBJECT/NOTYPE)
1.4 导出符号的两大应用场景
  • 功能复用:避免多个模块重复实现相同功能(如 CRC 校验算法)
  • 分层设计:底层模块提供基础功能,上层模块调用(如驱动框架与具体驱动)

二、导出符号的三要素:定义、导出、使用

要实现模块间符号共享,必须掌握三个核心步骤:定义符号→导出符号→使用符号

2.1 第一步:定义符号(函数或变量)

先在模块中定义要导出的函数或全局变量:

代码语言:javascript

AI代码解释

// 定义要导出的函数
int my_crc32(const unsigned char *buf, size_t len) {
    // CRC32计算实现
    // ...
    return crc;
}

// 定义要导出的全局变量
int global_counter = 0;

注意:函数不能是staticstatic会限制作用域为当前文件),变量同理。

2.2 第二步:导出符号

使用EXPORT_SYMBOLEXPORT_SYMBOL_GPL宏导出符号:

代码语言:javascript

AI代码解释

// 导出函数
EXPORT_SYMBOL(my_crc32);

// 导出变量
EXPORT_SYMBOL(global_counter);

这两个宏的区别在于:

  • EXPORT_SYMBOL:允许所有模块使用(无论许可证)
  • EXPORT_SYMBOL_GPL:仅允许 GPL 兼容许可证的模块使用

推荐做法:除非必要,优先使用EXPORT_SYMBOL_GPL,保证内核许可证纯洁性。

2.3 第三步:使用导出的符号

在需要使用这些符号的模块中,先声明符号(类似extern),再直接使用:

代码语言:javascript

AI代码解释

// 声明要使用的外部符号
extern int my_crc32(const unsigned char *buf, size_t len);
extern int global_counter;

// 在模块中使用
static int __init use_module_init(void) {
    int crc = my_crc32("hello", 5);
    printk("CRC32值: %x\n", crc);
    
    global_counter++;  // 使用全局变量
    printk("计数器值: %d\n", global_counter);
    return 0;
}

三、导出符号的工作原理:内核符号表揭秘

理解导出符号的工作原理,才能更好地使用这个机制。

3.1 内核符号表:模块间的通讯录

内核维护着一个全局的符号表(本质是哈希表),记录了所有导出符号的名称和地址。当模块 A 导出符号时:

  • 符号名称和地址被添加到符号表
  • 其他模块可以通过符号名称查找对应的地址

这个符号表在/proc/kallsyms中可见(需要 root 权限):

代码语言:javascript

AI代码解释

$ sudo cat /proc/kallsyms | grep my_crc32
ffffffffc00080a0 T my_crc32

其中:

  • ffffffffc00080a0是符号地址
  • T表示该符号在代码段(Text 段)
  • my_crc32是符号名称
3.2 符号解析过程

当模块 B 使用模块 A 导出的符号时,内核会:

  1. 在模块加载时,检查模块 B 引用的外部符号
  2. 在内核符号表中查找这些符号的地址
  3. 将模块 B 代码中对这些符号的引用替换为实际地址

这个过程称为符号解析,由内核在模块加载时自动完成。

3.3 导出符号的生命周期
  • 导出时机:模块加载时,EXPORT_SYMBOL所在的初始化函数执行后
  • 生效范围:模块加载后,直到模块卸载前
  • 失效时机:模块卸载时,其导出的符号自动从符号表移除

四、EXPORT_SYMBOL vs EXPORT_SYMBOL_GPL:许可证的微妙差别

这两个宏的核心区别在于许可证兼容性。

1. EXPORT_SYMBOL:无限制导出

  • 任何模块(无论使用何种许可证)都可以使用该符号
  • 适用于通用工具函数(如 CRC 计算、字符串处理)

2. EXPORT_SYMBOL_GPL:GPL 约束导出

  • 仅允许 GPL 兼容许可证的模块使用该符号
  • 适用于依赖 GPL 特定机制的函数(如内核锁、文件系统 API)
  • 使用该符号的模块必须声明MODULE_LICENSE("GPL")

3. 违反许可证约束的后果

如果非 GPL 模块使用了EXPORT_SYMBOL_GPL导出的符号:

  • 编译时不会报错,但加载模块时内核会警告 "Module taints kernel"
  • 可能导致内核功能异常(如无法正确获取锁)
  • 违反 GPL 许可证条款,存在法律风险

总结:除非必须开放给所有模块,否则优先使用EXPORT_SYMBOL_GPL

五、实战示例:模块间符号共享的完整流程

下面通过一个具体例子,演示如何实现模块间的符号共享。

5.1 模块 A:导出符号的模块(math_helper.c)

代码语言:javascript

AI代码解释

#include <linux/module.h>
#include <linux/init.h>

// 定义要导出的函数
int add(int a, int b) {
    return a + b;
}

int subtract(int a, int b) {
    return a - b;
}

// 定义要导出的全局变量
int operation_count = 0;

// 导出符号
EXPORT_SYMBOL(add);
EXPORT_SYMBOL(subtract);
EXPORT_SYMBOL(operation_count);

static int __init math_helper_init(void) {
    printk(KERN_INFO "数学助手模块加载成功\n");
    return 0;
}

static void __exit math_helper_exit(void) {
    printk(KERN_INFO "数学助手模块卸载成功\n");
}

module_init(math_helper_init);
module_exit(math_helper_exit);
MODULE_LICENSE("GPL");
MODULE_DESCRIPTION("数学计算辅助模块");
5.2 模块 B:使用导出符号的模块(calculator.c)

代码语言:javascript

AI代码解释

#include <linux/module.h>
#include <linux/init.h>

// 声明要使用的外部符号
extern int add(int a, int b);
extern int subtract(int a, int b);
extern int operation_count;

static int __init calculator_init(void) {
    int result;
    
    result = add(5, 3);
    printk(KERN_INFO "5 + 3 = %d\n", result);
    
    result = subtract(5, 3);
    printk(KERN_INFO "5 - 3 = %d\n", result);
    
    // 更新操作计数器
    operation_count += 2;
    printk(KERN_INFO "总操作次数: %d\n", operation_count);
    
    return 0;
}

static void __exit calculator_exit(void) {
    printk(KERN_INFO "计算器模块卸载成功\n");
}

module_init(calculator_init);
module_exit(calculator_exit);
MODULE_LICENSE("GPL");  // 必须声明GPL兼容许可证
MODULE_DESCRIPTION("使用导出符号的计算器模块");
5.3 编译 Makefile

代码语言:javascript

AI代码解释

obj-m += math_helper.o calculator.o

all:
    make -C /lib/modules/$(shell uname -r)/build M=$(PWD) modules

clean:
    make -C /lib/modules/$(shell uname -r)/build M=$(PWD) clean
5.4 测试流程

代码语言:javascript

AI代码解释

# 编译模块
make

# 加载模块(先加载导出符号的模块)
sudo insmod math_helper.ko
sudo insmod calculator.ko

# 查看日志
dmesg | tail -n 5
[ 1234.567890] 数学助手模块加载成功
[ 1234.567900] 5 + 3 = 8
[ 1234.567910] 5 - 3 = 2
[ 1234.567920] 总操作次数: 2
[ 1234.567930] 计算器模块加载成功

# 卸载模块(顺序与加载相反)
sudo rmmod calculator
sudo rmmod math_helper

六、导出符号的高级用法:符号版本控制

当模块升级时,可能会修改导出函数的参数或行为,可能导致依赖模块出错。内核提供了符号版本控制机制来解决这个问题。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐