文档介绍:在内核模块的编写中,我们用alloc_page()/alloc_pages()来分配大内存(超过一个页面,即4K).用free_page()/free_pages(),在linux内核中大内存分配的实现.
本文档包括:
一:准备知识
二:有关的数据结构
三:alloc_pages()/alloc_page 实现分析
四:free_pages()的相关实现
五:总结
一:准备知识:
一个操作系统的内存管理方式很大程度上决定了它的效率,时间与空间的对立统一在内存管理上体现得最为明显,首先,分配/释放内存是一个发生频率很高的操作,所以它要求有一定的实时性,另外,.
Linux采用了伙伴系统算法来管理内存,即把内页按2^0,2^1,2^2…2^,从相应大小的池中分配内存,然后再把余下的内存分配给它的下一级缓存池.
如下图所示:
关于分配位图:
在linux中,每一个大小的缓存池都对应一个位图,然后,,:位图管理A,,,若把A分配出去,,再取反,,不难发现有以下规律:
若位图为0:表示两个分配块都空或者都已经分配出去.
若位图为1:表示其中有一个已经分配出去,有一个空闲
特别的,关于分配位图,有几点值得注意的地方:
1:位图的大小只跟总内存有关,跟当前缓存池的空闲内存无关.
例如: = 1024个页
那对应的.
2^0位图有1024/1/2 512项
2^1位图有1024/2/2= 256项
……
2^10位图有1024/2^10/2 1项
(除以2是因为1位表示二个页面)
2:为什么一位要管理一对内存呢?其实这是为了更好的管理伙伴系统而设计的,当然,也有减少位图大小的因素
如下图所示
位图1表示A,B的分配情况,位图2表示C,,B,C处于空闲状态
上图中,虽然B,C处理连续的页,且都空闲,但不可以把B,C合位为一块大内存.
二:有关的数据结构.
我们以NUMA配置来分析伙伴系统算法中所涉及的数据结构
系统中,每一个页面对应一个页描述符,它的结构如下:
struct page {
page_flags_t flags; //页面所对应的标志,这跟页表项的标志是不一样的
atomic_t _count; //页面引用计数
atomic_t _mapcount; //有多少个页表项映射到了此页面
unsigned long private; //私有数据区,我们在以后将要看到的交换与磁盘高速缓存中会有关于这个成员的使用
struct address_space *mapping; //用于磁盘高速缓存,以后分析
pgoff_t index; //同上
struct list_head lru; //LRU链表,链至管理区的相应链表中
#if defined(WANT_PAGE_VIRTUAL)
void *virtual; /* Kernel virtual address (NULL if
not kmapped, ie. highmem) */
#endif /* WANT_PAGE_VIRTUAL */
}
在linux中,用一个全局的page结构数组mem_map描述了系统中可管理的物理页面项
在上面的成员分析中有一个管理区的概念,我们来看一下何所谓管理区
由于计算机系统的发展原因,老的ISA设备的DMA只能使用前16M的内存..这就是ZONE_DMA
另外,
余下的就是ZONE_NORMAL了.
具体的看一下管理区的结构
struct zone
{
//互斥锁
spinlock_t lock;
//这个区中现有的空闲页面数
unsigned long free_pages;
//pages_min、pages_low及 pages_high是对这个区最少、此少及最多页面个数的描述
unsigned long pages_min, pages_low, pages_high;
//每个类型的管理区的,所保护的页面数
unsigne