Linux内核源码分析方法

一、内核源码之我见

3．神奇的编程技巧。在一般的应用软件设计领域，编码的地位可能不被过度的重视，因为开发者更注重软件的良好设计，而编码仅仅是实现手段问题——就像拿斧子劈柴一样，不用太多的思考。但是这在内核中并不成立，好的编码设计带来的不光是可维护性的提高，甚至是代码性能的提升。

二、内核源码难不难？

2．不少人也接触过大型软件的代码，但多数属于应用型项目，代码的形式和含义都和自己常接触的业务逻辑相关。而内核代码不同，它处理的信息多数和计算机底层密切相关。比如操作系统、编译器、汇编、体系结构等相关的知识的欠缺，也会让阅读内核代码障碍重重。

3．分析内核代码的方法不够合理。面对大量的并且复杂的内核代码，如果不从全局的角度入手，很容易陷入代码细节的泥淖中。内核代码虽然庞大，但是它也有它的设计原则和架构，否则维护它对任何人来说都是一个噩梦！如果我们理清代码模块的整体设计思路，再去分析代码的实现，可能分析源码就是一件轻松快乐的事情了。

三、内核源码分析方法

第一步：资料搜集

从人认识新事物的角度来讲，在探索事物本质之前，必须有一个了解新鲜事物的过程，这个过程是的我们对新鲜事物产生一个初步的概念。比如我们想学习钢琴，那么我们需要先了解弹奏钢琴需要我们学习基本的乐理、简谱、五线谱等基础知识，然后学习钢琴弹奏的技巧和指法，最后才能真正的开始练习钢琴。

分析内核代码也是如此，首先我们需要定位要分析的代码涉及的内容。是进程同步和调度的代码，是内存管理的代码，还是设备管理的代码，还是系统启动的代码等等。内核的庞大决定着我们不能一次性将内核代码全部分析完成，因此我们需要给自己一个合理的分工。正如算法设计告诉我们的，要解决一个大问题，首先要解决它所涉及的子问题。

定位好要分析的代码范围，我们就可以动用手头的一切资源，尽可能的全面了解该部分代码的整体结构和大致功能。

……

第二步：源码定位

从资料搜集中，我们“有幸”找到了源码相关的源码目录。但是这并非意味着我们的确就是分析这个目录下的源代码。有时我们找到的目录有可能是分散的，也有时我们找到的目录下有很多和具体机器相关的代码，而我们更关心的是待分析代码的主要机制，而非与机器相关的特化代码（这样更有助于我们理解内核的本质）。因此，我们需要对资料中涉及代码文件的资料进行仔细甄选。当然，这一步也不太可能一次性完成，谁也不能保证一次就能选择出所有待分析的源码文件而且一个不漏。但是我们也不必担心，香港服务器租用，只要我们能抓住大多数模块相关的核心源文件，通过后期对代码的具体分析，就很自然的把它们全部找出来。

按照搜索出的信息流动方向，我们完全可以定位到需要分析的源码文件。源码定位这一步并非十分关键，因为我们不需要找出所有源码文件，我们可以把部分工作推迟到分析代码的过程中。源码定位也比较关键，找到一部分源码文件是分析源码的基础。

第三步：简单注释

我们也不要强求一次就能把注释描述的很准确（我们甚至都没必要弄清每个函数的具体实现流程，只要弄清大致功能含义即可），我们结合搜集到的资料和后边代码的分析不断的完善注释的含义（源码中原有的注释和标识符命名在此很有利用价值）。通过不断的注释，不断的查阅资料，不断的修改注释的含义。

当我们把所有涉及的源码文件简单注释完毕后我们可以达到如下效果：

1．基本弄清了源码中代码元素存在的含义。

2．找出了该模块所涉及的基本上全部的关键源码文件。

结合之前搜集到的信息和资料对该待分析代码的整体或者架构描述，我们可以将分析的结果和资料对比，以确定和修正我们对代码的理解。这样，通过一遍的简单注释，我们就可以从整体上把握了源码模块的主要结构。这也达到了我们简单注释的基本目的。

第四步：详细注释

完成代码的简单注释后，可以认为对模块的分析工作完成了一半了，剩下的内容就是对代码的深入分析和彻底理解。简单注释总是不能将代码元素的具体含义描述的十分精确，因此详细注释是十分有必要的。这一步中，我们需要弄清以下内容：

1．变量定义在何时被使用。

2．宏定义的代码何时被使用。

3．函数的参数和返回值的含义。

4．函数的执行流程和调用关系。

5．结构体字段的具体含义和使用条件。

我们甚至可以把这一步称为函数详细注释，因为函数之外的代码元素的含义基本上在简单注释中已经比较明确了。而函数本身的执行流程、算法等是这部分注释和分析的主要任务。

第五步：模块内部标识符依赖关系

别人失去了信心，他却下决心实现自己的目标。

相关文章：

你感兴趣的文章：

标签云：