linux系统中oom killer策略

最近经常出现datanode被内核oom-killer干掉的情况,下面追查下原因:(todo…)

什么是Overcommit和OOM?overcommit的策略当oom-killer发生时,linux会选择杀死哪些进程

在Unix中,当一个用户进程使用malloc()函数申请内存时,假如返回值是NULL,则这个进程知道当前没有可用内存空间,就会做相应的处理工作。许多进程会打印错误信息并退出。Linux使用另外一种处理方式,它对大部分申请内存的请求都回复"yes",以便能跑更多更大的程序。因为申请内存后,并不会马上使用内存。这种技术叫做Overcommit。当内存不足时,会发生OOM killer(OOM=out-of-memory)。它会选择杀死一些进程(用户态进程,不是内核线程),以便释放内存。Overcommit的策略Linux下overcommit有三种策略(Documentation/vm/overcommit-accounting):0. 启发式策略。合理的overcommit会被接受,不合理的overcommit会被拒绝。1. 任何overcommit都会被接受。2. 当系统分配的内存超过swap+N%*物理RAM(N%由vm.overcommit_ratio决定)时,会拒绝commit。overcommit的策略通过vm.overcommit_memory设置。

参:http://blog.163.com/ly_89/blog/static/18690229920125220145180/overcommit的百分比由vm.overcommit_ratio设置。

# echo 2 > /proc/sys/vm/overcommit_memory
# echo 80 > /proc/sys/vm/overcommit_ratio

当oom-killer发生时,linux会选择杀死哪些进程选择进程的函数是oom_badness函数(在mm/oom_kill.c中),该函数会计算每个进程的点数(0~1000)。点数越高,这个进程越有可能被杀死。每个进程的点数跟oom_score_adj有关,而且oom_score_adj可以被设置(-1000最低,1000最高)。

既有美妙的风景,也会有称不上景只有风的地方。

linux系统中oom killer策略

相关文章:

你感兴趣的文章:

标签云: