Linux内核对I/O端口的管理实现

本文主要从内核实现的角度分析Linux 2.4.0内核IO子系统中对IO端口资源的管理的实现原理。本文是为那些想要深入分析Linux的IO子系统的读者和设备驱动程序开发人员而写的。

几乎每一种外设都是通过读写设备上的寄存器来进行的。外设寄存器也称为“I/O端口”，通常包括：控制寄存器、状态寄存器和数据寄存器三大类，而且一个外设的寄存器通常被连续地编址。CPU对外设IO端口物理地址的编址方式有两种：一种是I/O映射方式（I/O－mapped），另一种是内存映射方式（Memory－mapped）。而具体采用哪一种则取决于CPU的体系结构。

有些体系结构的CPU（如，PowerPC、m68k等）通常只实现一个物理地址空间（RAM）。在这种情况下，外设I/O端口的物理地址就被映射到CPU的单一物理地址空间中，而成为内存的一部分。此时，CPU可象访问一个内存单元那样访问外设I/O端口，而不需要设立专门的外设I/O指令。这就是所谓的“内存映射方式”（Memory－mapped）。

而另外一些体系结构的CPU（典型地如X86）则为外设专门实现了一个单独地地址空间，称为“I/O地址空间”或者“I/O端口空间”。这是一个与CPU地RAM物理地址空间不同的地址空间，所有外设的I/O端口均在这一空间中进行编址。CPU通过设立专门的I/O指令（如X86的IN和OUT指令）来访问这一空间中的地址单元（也即I/O端口）。这就是所谓的“I/O映射方式”（I/O－mapped）。与RAM物理地址空间相比，I/O地址空间通常都比较小，如x86CPU的I/O空间就只有64KB（0－0xffff）。这是“I/O映射方式”的一个主要缺点。

Linux将基于I/O映射方式的或内存映射方式的I/O端口通称为“I/O区域”（I/O region）。在讨论对I/O区域的管理之前，我们首先来分析一下Linux是如何实现“I/O资源”这一抽象概念的。

Linux对I/O资源的描述

Linux设计了一个通用的数据结构resource来描述各种I/O资源（如：I/O端口、外设内存、DMA和IRQ等）。该结构定义在include/linux/ioport.h头文件中：

　　struct resource {const char *name;unsigned long start, end;unsigned long flags;struct resource *parent, *sibling, *child;　　};

各成员的含义如下：

1. name指针：指向此资源的名称。

2. start和end：表示资源的起始物理地址和终止物理地址。它们确定了资源的范围，也即是一个闭区间[start,end]。

3. flags：描述此资源属性的标志（见下面）。

4. 指针parent、sibling和child：分别为指向父亲、兄弟和子资源的指针。

属性flags是一个unsigned long类型的32位标志值，用以描述资源的属性。比如：资源的类型、是否只读、是否可缓存，以及是否已被占用等。下面是一部分常用属性标志位的定义（ioport.h）：

/* * IO resources have these defined flags. */#define IORESOURCE_BITS0x000000ff/* Bus-specific bits */#define IORESOURCE_IO0x00000100/* Resource type */#define IORESOURCE_MEM0x00000200#define IORESOURCE_IRQ0x00000400#define IORESOURCE_DMA0x00000800#define IORESOURCE_PREFETCH0x00001000/* No side effects */#define IORESOURCE_READONLY0x00002000#define IORESOURCE_CACHEABLE0x00004000#define IORESOURCE_RANGELENGTH0x00008000#define IORESOURCE_SHADOWABLE0x00010000#define IORESOURCE_BUS_HAS_VGA0x00080000#define IORESOURCE_UNSET0x20000000#define IORESOURCE_AUTO0x40000000#define IORESOURCE_BUSY0x80000000/* Driver has marked this resource busy */

指针parent、sibling和child的设置是为了以一种树的形式来管理各种I/O资源。

Linux对I/O资源的管理

Linux是以一种倒置的树形结构来管理每一类I/O资源（如：I/O端口、外设内存、DMA和IRQ）的。每一类I/O资源都对应有一颗倒置的资源树，树中的每一个节点都是一个resource结构，而树的根结点root则描述了该类资源的整个资源空间。

基于上述这个思想，Linux在kernel/Resource.c文件中实现了对资源的申请、释放及查找等操作。

1 I/O资源的申请

假设某类资源有如下这样一颗资源树：

节点root、r1、r2和r3实际上都是一个resource结构类型。子资源r1、r2和r3通过sibling指针链接成一条单向非循环链表，其表头由root节点中的child指针定义，因此也称为父资源的子资源链表。r1、r2和r3的parent指针均指向他们的父资源节点，在这里也就是图中的root节点。

假设想在root节点中分配一段I/O资源（由图中的阴影区域表示）。函数request_resource()实现这一功能。它有两个参数：①root指针，表示要在哪个资源根节点中进行分配；②new指针，指向描述所要分配的资源（即图中的阴影区域）的resource结构。该函数的源代码如下（kernel/resource.c）:

　　int request_resource(struct resource *root, struct resource *new)　　{struct resource *conflict;write_lock(&resource_lock);conflict = __request_resource(root, new);write_unlock(&resource_lock);return conflict ? -EBUSY : 0;　　}

对上述函数的NOTE如下：

①资源锁resource_lock对所有资源树进行读写保护，任何代码段在访问某一颗资源树之前都必须先持有该锁。其定义如下（kernel/Resource.c）：

static rwlock_t resource_lock = RW_LOCK_UNLOCKED;

②可以看出，函数实际上是通过调用内部静态函数__request_resource()来完成实际的资源分配工作。如果该函数返回非空指针，则表示有资源冲突；否则，返回NULL就表示分配成功。

③最后，如果conflict指针为NULL，则request_resource()函数返回返回值0，表示成功；否则返回－EBUSY表示想要分配的资源已被占用。

函数__request_resource()完成实际的资源分配工作。如果参数new所描述的资源中的一部分或全部已经被其它节点所占用，则函数返回与new相冲突的resource结构的指针。否则就返回NULL。该函数的源代码如下

（kernel/Resource.c）：/* Return the conflict entry if you can't request it */static struct resource * __request_resource　　(struct resource *root, struct resource *new){unsigned long start = new->start;unsigned long end = new->end;struct resource *tmp, **p;if (end < start)return root;if (start < root->start)return root;if (end > root->end)return root;p = &root->child;for (;;) {tmp = *p;if (!tmp || tmp->start > end) {new->sibling = tmp;*p = new;new->parent = root;return NULL;}p = &tmp->sibling;if (tmp->end < start)continue;return tmp;}}

对函数的NOTE：

①前三个if语句判断new所描述的资源范围是否被包含在root内，以及是否是一段有效的资源（因为end必须大于start）。否则就返回root指针，表示与根结点相冲突。

②接下来用一个for循环遍历根节点root的child链表，以便检查是否有资源冲突，并将new插入到child链表中的合适位置（child链表是以I/O资源物理地址从低到高的顺序排列的）。为此，它用tmp指针指向当前正被扫描的resource结构，用指针p指向前一个resource结构的sibling指针成员变量，p的初始值为指向root－>sibling。For循环体的执行步骤如下：

让tmp指向当前正被扫描的resource结构（tmp＝*p）。判断tmp指针是否为空（tmp指针为空说明已经遍历完整个child链表），或者当前被扫描节点的起始位置start是否比new的结束位置end还要大。只要这两个条件之一成立的话，就说明没有资源冲突，于是就可以把new链入child链表中：①设置new的sibling指针指向当前正被扫描的节点tmp（new->sibling=tmp）；②当前节点tmp的前一个兄弟节点的sibling指针被修改为指向new这个节点（*p=new）；③将new的parent指针设置为指向root。然后函数就可以返回了（返回值NULL表示没有资源冲突）。

如果上述两个条件都不成立，这说明当前被扫描节点的资源域有可能与new相冲突（实际上就是两个闭区间有交集），因此需要进一步判断。为此它首先修改指针p，让它指向tmp->sibling，以便于继续扫描child链表。然后，判断tmp->end是否小于new->start，如果小于，则说明当前节点tmp和new没有资源冲突，因此执行continue语句，继续向下扫描child链表。否则，如果tmp->end大于或等于new->start，则说明tmp->[start,end]和new->[start,end]之间有交集。所以返回当前节点的指针tmp，表示发生资源冲突。

2 资源的释放

函数release_resource()用于实现I/O资源的释放。该函数只有一个参数——即指针old，它指向所要释放的资源。起源代码如下：

int release_resource(struct resource *old){int retval;write_lock(&resource_lock);retval = __release_resource(old);write_unlock(&resource_lock);return retval;}

可以看出，它实际上通过调用__release_resource()这个内部静态函数来完成实际的资源释放工作。函数__release_resource()的主要任务就是将资源区域old（如果已经存在的话）从其父资源的child链表重摘除，它的源代码如下：

static int __release_resource(struct resource *old){struct resource *tmp, **p;p = &old->parent->child;for (;;) {tmp = *p;if (!tmp)break;if (tmp == old) {*p = tmp->sibling;old->parent = NULL;return 0;}p = &tmp->sibling;}return -EINVAL;}

对上述函数代码的NOTE如下：

同函数__request_resource()相类似，该函数也是通过一个for循环来遍历父资源的child链表。为此，它让tmp指针指向当前被扫描的资源，而指针p则指向当前节点的前一个节点的sibling成员（p的初始值为指向父资源的child指针）。循环体的步骤如下：

①首先，让tmp指针指向当前被扫描的节点（tmp＝*p）。

②如果tmp指针为空，说明已经遍历完整个child链表，因此执行break语句推出for循环。由于在遍历过程中没有在child链表中找到参数old所指定的资源节点，因此最后返回错误值－EINVAL，表示参数old是一个无效的值。

③接下来，判断当前被扫描节点是否就是参数old所指定的资源节点。如果是，那就将old从child链表中去除，也即让当前结点tmp的前一个兄弟节点的sibling指针指向tmp的下一个节点，然后将old－>parent指针设置为NULL。最后返回0值表示执行成功。

④如果当前被扫描节点不是资源old，那就继续扫描child链表中的下一个元素。因此将指针p指向tmp－>sibling成员。

3 检查资源是否已被占用

函数check_resource()用于实现检查某一段I/O资源是否已被占用。其源代码如下：

int check_resource(struct resource *root, unsigned long start, unsigned long len){struct resource *conflict, tmp;tmp.start = start;tmp.end = start + len - 1;write_lock(&resource_lock);conflict = __request_resource(root, &tmp);if (!conflict)__release_resource(&tmp);write_unlock(&resource_lock);return conflict ? -EBUSY : 0;}

对该函数的NOTE如下：

①构造一个临时资源tmp，表示所要检查的资源[start,start+end-1]。

②调用__request_resource()函数在根节点root申请tmp所表示的资源。如果tmp所描述的资源还被人使用，则该函数返回NULL，否则返回非空指针。因此接下来在conflict为NULL的情况下，调用__release_resource()将刚刚申请的资源释放掉。

③最后根据conflict是否为NULL，返回－EBUSY或0值。

4 寻找可用资源

函数find_resource()用于在一颗资源树中寻找未被使用的、且满足给定条件的（也即资源长度大小为size，且在[min,max]区间内）的资源。其函数源代码如下：

/* * Find empty slot in the resource tree given range and alignment. */static int find_resource(struct resource *root, struct resource *new,  unsigned long size,  unsigned long min, unsigned long max,  unsigned long align,  void (*alignf)(void *, struct resource *, unsigned long),  void *alignf_data){struct resource *this = root->child;new->start = root->start;for(;;) {if (this)new->end = this->start;elsenew->end = root->end;if (new->start < min)new->start = min;if (new->end > max)new->end = max;new->start = (new->start + align - 1) & ~(align - 1);if (alignf)alignf(alignf_data, new, size);if (new->start < new->end && new->end - new->start + 1 >= size)                   {new->end = new->start + size - 1;return 0;}if (!this)break;new->start = this->end + 1;this = this->sibling;}return -EBUSY;}

对该函数的NOTE如下：

同样，该函数也要遍历root的child链表，以寻找未被使用的资源空洞。为此，它让this指针表示当前正被扫描的子资源节点，其初始值等于root->child，即指向child链表中的第一个节点，并让new->start的初始值等于root->start，然后用一个for循环开始扫描child链表，对于每一个被扫描的节点，循环体执行如下操作：

①首先，判断this指针是否为NULL。如果不为空，就让new->end等于this->start，也即让资源new表示当前资源节点this前面那一段未使用的资源区间。

②如果this指针为空，那就让new->end等于root->end。这有两层意思：第一种情况就是根结点的child指针为NULL（即根节点没有任何子资源）。因此此时先暂时将new->end放到最大。第二种情况就是已经遍历完整个child链表，所以此时就让new表示最后一个子资源后面那一段未使用的资源区间。

③根据参数min和max修正new->[start,end]的值，以使资源new被包含在[min,max]区域内。

④接下来进行对齐操作。

⑤然后，判断经过上述这些步骤所形成的资源区域new是否是一段有效的资源（end必须大于或等于start），而且资源区域的长度满足size参数的要求（end－start＋1>=size）。如果这两个条件均满足，则说明我们已经找到了一段满足条件的资源空洞。因此在对new->end的值进行修正后，然后就可以返回了（返回值0表示成功）。

⑥如果上述两条件不能同时满足，则说明还没有找到，因此要继续扫描链表。在继续扫描之前，我们还是要判断一下this指针是否为空。如果为空，说明已经扫描完整个child链表，因此就可以推出for循环了。否则就将new->start的值修改为this->end+1，并让this指向下一个兄弟资源节点，从而继续扫描链表中的下一个子资源节点。

5 分配接口allocate_resource()

在find_resource()函数的基础上，函数allocate_resource()实现：在一颗资源树中分配一条指定大小的、且包含在指定区域[min,max]中的、未使用资源区域。其源代码如下：

/* * Allocate empty slot in the resource tree given range and alignment. */int allocate_resource(struct resource *root, struct resource *new,      unsigned long size,      unsigned long min, unsigned long max,      unsigned long align,      void (*alignf)(void *, struct resource *, unsigned long),      void *alignf_data){    int err;    write_lock(&resource_lock);    err = find_resource(root, new, size, min, max, align, alignf, alignf_data);    if (err >= 0 && __request_resource(root, new))err = -EBUSY;    write_unlock(&resource_lock);    return err;}

6 获取资源的名称列表

函数get_resource_list()用于获取根节点root的子资源名字列表。该函数主要用来支持/proc/文件系统（比如实现proc/ioports文件和/proc/iomem文件）。其源代码如下：

int get_resource_list(struct resource *root, char *buf, int size){char *fmt;int retval;fmt = "        %08lx-%08lx : %s";if (root->end < 0x10000)fmt = "        %04lx-%04lx : %s";read_lock(&resource_lock);retval = do_resource_list(root->child, fmt, 8, buf, buf + size) - buf;read_unlock(&resource_lock);return retval;}

可以看出，该函数主要通过调用内部静态函数do_resource_list()来实现其功能，其源代码如下：

/* * This generates reports for /proc/ioports and /proc/iomem */static char * do_resource_list(struct resource *entry, const char *fmt, 　　int offset, char *buf, char *end){if (offset < 0)offset = 0;while (entry) {const char *name = entry->name;unsigned long from, to;if ((int) (end-buf) < 80)return buf;from = entry->start;to = entry->end;if (!name)name = "";buf += sprintf(buf, fmt + offset, from, to, name);if (entry->child)   buf = do_resource_list(entry->child, fmt, offset-2, buf, end);entry = entry->sibling;}return buf;}

函数do_resource_list()主要通过一个while{}循环以及递归嵌套调用来实现，较为简单，这里就不在详细解释了。

管理I/O Region资源

Linux将基于I/O映射方式的I/O端口和基于内存映射方式的I/O端口资源统称为“I/O区域”（I/O Region）。I/ORegion仍然是一种I/O资源，因此它仍然可以用resource结构类型来描述。下面我们就来看看Linux是如何管理I/O Region的。

1 I/O Region的分配

在函数__request_resource()的基础上，Linux实现了用于分配I/O区域的函数__request_region()，如下:

struct resource * __request_region(struct resource *parent, 　　unsigned long start, unsigned long n, const char *name){struct resource *res = kmalloc(sizeof(*res), GFP_KERNEL);if (res) {memset(res, 0, sizeof(*res));res->name = name;res->start = start;res->end = start + n - 1;res->flags = IORESOURCE_BUSY;write_lock(&resource_lock);for (;;) {struct resource *conflict;conflict = __request_resource(parent, res);if (!conflict)break;if (conflict != parent) {parent = conflict;if (!(conflict->flags & IORESOURCE_BUSY))continue;}/* Uhhuh, that didn't work out.. */kfree(res);res = NULL;break;}write_unlock(&resource_lock);}return res;}

NOTE：

①首先，调用kmalloc（）函数在SLAB分配器缓存中分配一个resource结构。

②然后，相应的根据参数值初始化所分配的resource结构。注意！flags成员被初始化为IORESOURCE_BUSY。

③接下来，用一个for循环开始进行资源分配，循环体的步骤如下：

首先，调用__request_resource()函数进行资源分配。如果返回NULL，说明分配成功，因此就执行break语句推出for循环，返回所分配的resource结构的指针，函数成功地结束。

如果__request_resource()函数分配不成功，则进一步判断所返回的冲突资源节点是否就是父资源节点parent。如果不是，则将分配行为下降一个层次，即试图在当前冲突的资源节点中进行分配（只有在冲突的资源节点没有设置IORESOURCE_BUSY的情况下才可以），于是让parent指针等于conflict，并在conflict->flags&IORESOURCE_BUSY为0的情况下执行continue语句继续for循环。

否则如果相冲突的资源节点就是父节点parent，或者相冲突资源节点设置了IORESOURCE_BUSY标志位，则宣告分配失败。于是调用kfree（）函数释放所分配的resource结构，并将res指针置为NULL，最后用break语句推出for循环。

④最后，返回所分配的resource结构的指针。

2 I/O Region的释放

函数__release_region()实现在一个父资源节点parent中释放给定范围的I/O Region。实际上该函数的实现思想与__release_resource()相类似。其源代码如下：

void __release_region(struct resource *parent, 　　　　unsigned long start, unsigned long n){struct resource **p;unsigned long end;p = &parent->child;end = start + n - 1;for (;;) {struct resource *res = *p;if (!res)break;if (res->start <= start && res->end >= end) {if (!(res->flags & IORESOURCE_BUSY)) {p = &res->child;continue;}if (res->start != start'  'res->end != end)break;*p = res->sibling;kfree(res);return;}p = &res->sibling;}printk("Trying to free nonexistent resource <%08lx-%08lx>", start, end);}

类似地，该函数也是通过一个for循环来遍历父资源parent的child链表。为此，它让指针res指向当前正被扫描的子资源节点，指针p指向前一个子资源节点的sibling成员变量，p的初始值为指向parent->child。For循环体的步骤如下：

①让res指针指向当前被扫描的子资源节点（res＝*p）。

②如果res指针为NULL，说明已经扫描完整个child链表，所以退出for循环。

③如果res指针不为NULL，则继续看看所指定的I/O区域范围是否完全包含在当前资源节点中，也即看看[start,start+n-1]是否包含在res->[start,end]中。如果不属于，则让p指向当前资源节点的sibling成员，然后继续for循环。如果属于，则执行下列步骤：

先看看当前资源节点是否设置了IORESOURCE_BUSY标志位。如果没有设置该标志位，则说明该资源节点下面可能还会有子节点，因此将扫描过程下降一个层次，于是修改p指针，使它指向res->child，然后执行continue语句继续for循环。

如果设置了IORESOURCE_BUSY标志位。则一定要确保当前资源节点就是所指定的I/O区域，然后将当前资源节点从其父资源的child链表中去除。这可以通过让前一个兄弟资源节点的sibling指针指向当前资源节点的下一个兄弟资源节点来实现（即让*p=res->sibling），最后调用kfree（）函数释放当前资源节点的resource结构。然后函数就可以成功返回了。

3 检查指定的I/O Region是否已被占用

函数__check_region()检查指定的I/O Region是否已被占用。其源代码如下：

int __check_region(struct resource *parent, unsigned long start, unsigned long n){struct resource * res;res = __request_region(parent, start, n, "check-region");if (!res)return -EBUSY;release_resource(res);kfree(res);return 0;}

该函数的实现与__check_resource()的实现思想类似。首先，它通过调用__request_region()函数试图在父资源parent中分配指定的I/O Region。如果分配不成功，将返回NULL，因此此时函数返回错误值－EBUSY表示所指定的I/ORegion已被占用。如果res指针不为空则说明所指定的I/ORegion没有被占用。于是调用__release_resource()函数将刚刚分配的资源释放掉（实际上是将res结构从parent的child链表去除），然后调用kfree（）函数释放res结构所占用的内存。最后，返回0值表示指定的I/O Region没有被占用。

也只有懂的接受自己的失败，才能更好的去发挥自身优势，也才能够更好的去实现自我

相关文章：

你感兴趣的文章：

标签云：