图解|透明大页原理与实现
在《图解|Linux大内存页原理》一文中,我们介绍过 标准大页
的原理与其优点,现在我们回顾一下标准大页有哪些优点:
减少 转译后备缓冲区(Translation Lookaside Buffer,TLB)
的失效情况,TLB 是 CPU 为了加速虚拟内存地址转换成物理内存地址而增加的缓冲区。减少 页表
的内存消耗。减少 缺页异常(page fault)
发生的次数,缺页异常处理例程需要对虚拟内存地址进行映射,而这个映射过程也是一个耗时的过程。
可以看出,使用 大页
能够加速系统的运行效率。
但是 标准大页
使用起来比较麻烦,需要挂载 Hugetlb 文件系统,并且需要使用 mmap 系统调用来对大页进行映射。为了解决标准大页使用麻烦的问题,红帽子(Red Hat)公司开发出 透明大页(Transparent Huge Pages,THP)
功能。
要使用透明大页功能,只需要使用以下命令开启即可:
echo always > /sys/kernel/mm/transparent_hugepage/enabled
开启了透明大页功能后,内核将会创建一个名为 khugepaged
的内核线程。
khugepaged
内核线程会不断扫描进程的虚拟内存空间(vma,virtual memory area),如果发现存在 2MB 地址连续的虚拟地址空间,那么判断其是否满足转换成大页的条件,如果满足则将这些物理内存合并成一个大页。如下图所示:
相对于使用繁琐的标准大页,透明大页显得更加友好。
透明大页原理
操作系统管理内存时,是以页作为单位的,常用的页大小有 4KB
、2MB
和 1GB
。4KB 的内存页被称为普通内存页,而 2MB 和 1GB 的内存页被称为大页。
通常来说,4KB 的内存页使用频率最多,但有时候为了减少缺页异常发生的次数(提升程序的性能),所以会使用 2MB 或者 1GB 的内存页来代替 4KB 的内存页。
透明大页核心思想
透明大页的核心思想很简单:不断扫描进程的虚拟内存区间(vma),如果发现大小超过 2MB 的内存区间,将会判断其是否满足转换成大页的条件,如果满足则将这些物理内存合并成一个大页。
我们知道每个进程都有一个 mm_struct 结构,用来管理进程的虚拟内存空间和映射物理地址的页表等信息,而虚拟内存的区间是通过 vm_area_struct 结构(vma)来管理的。
透明大页的核心逻辑步骤:
查找满足转换成大页的内存区间
khugepaged
内核线程会扫描进程的虚拟内存空间,如果发现内存区间大于等于 2MB,并且满足转换成大页的条件,那么将会进入下面的步骤。