Home Kernel Data Access Monitor
Post
Cancel

Kernel Data Access Monitor

DAMON:Linux Kernel官方的内存访问频次监控统计框架

DAMON(Data Access MONitor)是linux kernel的内存访问频次监控统计框架。在5.15进入了Kernel主线,一直在迭代(去看看)。

DAMON可以做虚拟内存和物理内存的访问监控,监控的结果是数据的访问频繁程度,可以通过回调函数(比如利用MADV),对冷热内存做很多内存优化的操作,包括冷内存的swap out和将热页组织为大页等。

虚拟内存监控和物理内存监控都是通过检查PTE的accessed bit来做访问监控的。虚拟内存监控,是直接访问目标虚拟地址空间的页表即可。物理内存则是,访问每个映射到目标物理地址空间的页表。检查和重置accessed bit可能对内存的回收和idle page track机制造成干扰,damon使用PG_idle 和 PG_young page 标志来避免。

监控原理:

1、基于region的采样#

把一个完整的监控区域划分为小的region,region是多个内存页的集合。

假设同一个region的页,访问频率是相同的(基于此,可以只统计大的region中一个页的access bit来代替整个region,达到减小扫描代价的目的)。基于这个假设,damon只需要检查任意一个PTE(页表项上的flags)的accessed bit,就可以确定一个region的访问频率。

监控精度和开销是一对tradeoff。

监控精度和开销主要通过设置采样间隔和结果聚合间隔来控制。

每个采样间隔(sampling interval),damon会检查一次region的访问情况。

每个聚合间隔(aggregation interval),damon汇总所有采样间隔结果。

为了防止随着监控区域的增大,开销会无限制的增大。然而,damon采样的region数目是有最大最小值的( minimum number of regions, and maximum number of regions),这样就很好的控制住了开销。

2、自适应的region调整#

随着系统的运行,不同数据的访问频繁模式是动态变化的,就需要自适应的调整region,包括分割和合并region。

合并的是,那些聚合统计后,相邻region访问频繁模式差距小,就合并他们成一个更大的region。

保证region数目不超过上限的前提下,在每次聚合统计清理标记时候,尝试分割一个region成两个到三个。

3、基于VMA的虚拟地址监控#

我们知道,虚拟地址空间大部分是没有映射的,监控这些unmap的区域完全是浪费。因此,damon应该自适应的去除这些未映射区域。

基于这个原因,初始化的时候,damon利用VMA划分了三个大的region:堆、栈、mmap。不去监控两个大的gap(1、heap和mmap上界之间。2、mmap下界和stack之间。)

为了应对程序运行过程中,动态的内存地址map和unmap。damon在每个regions update interval(一个可配置参数)之后重新初始化。

进程虚拟地址空间:

1
2
3
4
5
6
7
    <heap>
    <BIG UNMAPPED REGION 1>
    <uppermost mmap()-ed region>
    (small mmap()-ed regions and munmap()-ed regions)
    <lowermost mmap()-ed region>
    <BIG UNMAPPED REGION 2>
    <stack>

一点看法#

扫描页表项flag上的access bit是内存访问频次统计的通行做法,DAMON的主要贡献在于通过由region的自适应采样,把性能损耗降低到可以忽略不计。

1
2
https://github.com/awslabs/damo
https://damonitor.github.io/doc/html/latest-damon/admin-guide/mm/damon/guide.html
1
https://blog.csdn.net/zqh1630/article/details/109954910
This post is licensed under CC BY 4.0 by the author.