《linux 内核完全剖析》 由逻辑地址转换成线性地址代码分析 ge

一开始由这段代码引发的纠结

get_base(current->ldt[1])

下面是各个相关的代码,摘自不同的header files。。。

current是指向当前task的指针

struct desc_struct ldt[3];

struct desc_struct {unsigned long a,b;} ;

#define _get_base(addr) ({\unsigned long __base; \__asm__("movb %3,%%dh\n\t" \&;movb %2,%%dl\n\t" \&;shll $16,%%edx\n\t" \&;movw %1,%%dx" \:"=d" (__base) \:"m" (*((addr)+2)), \&;m" (*((addr)+4)), \&;m" (*((addr)+7))); \__base;})
#define get_base(ldt) _get_base( ((char *)&(ldt)) )

事实证明(说的直接点就是代码看不懂),前面的8086保护模式编程是相当重要的,是理论基础。我现在越来越理解汤老师的话,只有坚实的理论基础,才能更好的实践。

不复习分页保护模式,这段代码是看不懂的,而且一开始我特别纠结

 :"m" (*((addr)+2)), \ "m" (*((addr)+4)), \ "m" (*((addr)+7))); \

为什么取addr的偏移量偏偏就是2 4 7

通过ldt(locale descriptor table)可以找到它映射的物理地址空间。

struct desc_struct {unsigned long a,b;} ;

这个结构体里面的 a b 是unsigned long类型,8 byte长, 32位

对应的是段描述符,贴图吧。。

ldt[1],是代码段,ldt[2]数据段,ldt[0]为空,至于为什么,现在。。。我也布吉岛。。。

get_base传参的方式有点技巧,他传递了ldt的地址

然而这里的ldt其实是一个指针current->ldt[1] ,于是这里的addr是一个指针,这个对于理解为什么addr偏移2 4 7“至关重要”。。。

#define get_base(ldt) _get_base( ((char *)&(ldt)) )

但是我觉得赵炯博士的解释说明图和具体代码对应的时候,是有点问题的。

我纠结了很久这里的addr+2 addr+4 addr+7究竟指向哪儿了。

事实上

addr+2是指向那个有16位长度的base address的(0-15)

addr+4是指向那个有最右边的8位base address(16-23)

addr+7是指向那个最左边的8为base address的(24-31)

数据段描述符是对应结构体

struct desc_struct {unsigned long a,b;} ;

#define _get_base(addr) ({\unsigned long __base; \__asm__("movb %3,%%dh\n\t" \&;movb %2,%%dl\n\t" \&;shll $16,%%edx\n\t" \&;movw %1,%%dx" \:"=d" (__base) \:"m" (*((addr)+2)), \ "m" (*((addr)+4)), \ "m" (*((addr)+7))); \__base;})

这个获取基地址就很好解释了。

首先 取addr+4开始的8个位,置于寄存器%dl,取addr+7开始的8个位置于寄存器%dh

然后左移16位,把刚移入的16位数据(本来在寄存器中的低16位),移位到高16位

取addr+2开始的16位,置于寄存器%dx,也就是%edx的低16位。

这样edx就被填满了。是 segment base!

update:2014.05.07

删除了之前错误的观点,增添了getlimit的分析

#define get_limit(segment) ({ \unsigned long __limit; \__asm__("lsll %1,%0\n\tincl %0":"=r" (__limit):"r" (segment)); \__limit;})

segment是段选择符

背着背包的路上,看过许多人,听过许多故事,

《linux 内核完全剖析》  由逻辑地址转换成线性地址代码分析  ge

相关文章:

你感兴趣的文章:

标签云: