【扫雷软件源码】【战旗源码】【loaderwebpack源码】军事推演源码

【扫雷软件源码】【战旗源码】【loaderwebpack源码】军事推演源码_军事推演源码下载

来源：pushlet源码官网时间：2024-11-26 13:55:35

1.Linux内核源码解析---万字解析从设计模式推演per-cpu实现原理

军事推演源码_军事推演源码下载

Linux内核源码解析---万字解析从设计模式推演per-cpu实现原理

引子

在如今的军事军事大型服务器中，NUMA架构扮演着关键角色。推演推演它允许系统拥有多个物理CPU，源码源码不同NUMA节点之间通过QPI通信。下载虽然硬件连接细节在此不作深入讨论，军事军事但需明白每个CPU优先访问本节点内存，推演推演扫雷软件源码当本地内存不足时，源码源码可向其他节点申请。下载从传统的军事军事SMP架构转向NUMA架构，主要是推演推演为了解决随着CPU数量增多而带来的总线压力问题。

分配物理内存时，源码源码numa_node_id() 方法用于查询当前CPU所在的下载NUMA节点。频繁的军事军事战旗源码内存申请操作促使Linux内核采用per-cpu实现，将CPU访问的推演推演变量复制到每个CPU中，以减少缓存行竞争和False Sharing，源码源码类似于Java中的Thread Local。

分配物理页

尽管我们不必关注底层实现，buddy system负责分配物理页，关键在于使用了numa_node_id方法。接下来，我们将深入探索整个Linux内核的per-cpu体系。

numa_node_id源码分析获取数据

在topology.h中，我们发现使用了raw_cpu_read函数，传入了numa_node参数。接下来，loaderwebpack源码我们来了解numa_node的定义。

在topology.h中定义了numa_node。我们继续跟踪DECLARE_PER_CPU_SECTION的定义，最终揭示numa_node是一个共享全局变量，类型为int，存储在.data..percpu段中。

在percpu-defs.h中，numa_node被放置在ELF文件的.data..percpu段中，这些段在运行阶段即为段。接下来，我们返回raw_cpu_read方法。

在percpu-defs.h中，getday源码我们继续跟进__pcpu_size_call_return方法，此方法根据per-cpu变量的大小生成回调函数。对于numa_node的int类型，最终拼接得到的是raw_cpu_read_4方法。

在percpu.h中，调用了一般的read方法。在percpu.h中，获取numa_node的绝对地址，并通过raw_cpu_ptr方法。

在percpu-defs.h中，我们略过验证指针的环节，追踪arch_raw_cpu_ptr方法。postmapping源码接下来，我们来看x架构的实现。

在percpu.h中，使用汇编获取this_cpu_off的地址，代表此CPU内存副本到".data..percpu"的偏移量。加上numa_node相对于原始内存副本的偏移量，最终通过解引用获得真正内存地址内的值。

对于其他架构，实现方式相似，通过获取自己CPU的偏移量，最终通过相对偏移得到pcp变量的地址。

放入数据

讨论Linux内核启动过程时，我们不得不关注per-cpu的值是如何被放入的。

在main.c中，我们以x实现为例进行分析。通过setup_percpu.c文件中的代码，我们将node值赋给每个CPU的numa_node地址处。具体计算方法通过early_cpu_to_node实现，此处不作展开。

在percpu-defs.h中，我们来看看如何获取每个CPU的numa_node地址，最终还是通过简单的偏移获取。需要注意如何获取每个CPU的副本偏移地址。

在percpu.h中，我们发现一个关键数组__per_cpu_offset，其中保存了每个CPU副本的偏移值，通过CPU的索引来查找。

接下来，我们来设计PER CPU模块。

设计一个全面的PER CPU架构，它支持UMA或NUMA架构。我们设计了一个包含NUMA节点的结构体，内部管理所有CPU。为每个CPU创建副本，其中存储所有per-cpu变量。静态数据在编译时放入原始数据段，动态数据在运行时生成。

最后，我们回到setup_per_cpu_areas方法的分析。在setup_percpu.c中，我们详细探讨了关键方法pcpu_embed_first_chunk。此方法管理group、unit、静态、保留、动态区域。

通过percpu.c中的关键变量__per_cpu_load和vmlinux.lds.S的链接脚本，我们了解了per-cpu加载时的地址符号。PERCPU_INPUT宏定义了静态原始数据的起始和结束符号。

接下来，我们关注如何分配per-cpu元数据信息pcpu_alloc_info。percpu.c中的方法执行后，元数据分配如下图所示。

接着，我们分析pcpu_alloc_alloc_info的方法，完成元数据分配。

在pcpu_setup_first_chunk方法中，我们看到分配的smap和dmap在后期将通过slab再次分配。

在main.c的mm_init中，我们关注重点区域，完成map数组的slab分配。

至此，我们探讨了Linux内核中per-cpu实现的原理，从设计到源码分析，全面展现了这一关键机制在现代服务器架构中的作用。

【扫雷软件源码】【战旗源码】【loaderwebpack源码】军事推演源码_军事推演源码下载

热点文章

精彩图文

【扫雷软件源码】【战旗源码】【loaderwebpack源码】军事推演 源码_军事推演 源码下载

热点文章

精彩图文

【扫雷软件源码】【战旗源码】【loaderwebpack源码】军事推演源码_军事推演源码下载