Home
Cheng Luo
Cancel

community contribution

bcc: https://github.com/iovisor/bcc/pull/4935 procps-ng: https://gitlab.com/procps-ng/procps/-/merge_requests/222 kernel: https://lore.kernel.org/linux-mm/?q=luochunsheng numactl (maintainer): h...

Input-Output Memory Management Unit

Intel IOMMU Introduction https://kernelgo.org/intel_iommu.html https://blog.csdn.net/21cnbao/article/details/106293976 对于Intel的硬件辅助虚拟化方案而言核心的两大技术分别是VT-x和VT-d。 其中VT-x中主要引入了non-root模式(VMCS)以及EPT页表等...

Distributed Shared Memory

一、Popcorn DSM:distributed shared memory https://www.ssrg.ece.vt.edu/papers/icdcs20.pdf (0) Migrating Execution Contexts 要跨计算机边界迁移线程,我们需要获取描述原始节点上线程当前状态的执行上下文。幸运的是,现代操作系统维护这样 的执行上下文,以在系统调用和...

The Robot Operating System 2 (ROS2)

一、ROS2介绍 https://www.jianshu.com/p/3829624ac310 //ROS2简介 有图有介绍,很详细 1) 基本概念ROS1 Vs ROS2.png Nodes-节点概念 节点即Node,是ROS里面的一个执行体,可以和其他节点直接在ROS中互相通信。Node是Package里面的可执行文件 的一个功能体现(也就是说Package的可执行文件能...

Realtime Operating System

一、RT linux patch Linux kernel在spinlock、irq上下文方面无法抢占,因此高优先级任务被唤醒到得以执行的时间并不能完全确定。同时,Linux kernel本身也不处理优先级反转。RT-Preempt Patch是在Linux社区kernel的基础上,加上相关的补丁,以使得Linux满足硬实时的需求。 RT-Preempt Patch对Linux kern...

Linux Heterogeneous memory management (HMM)

一、HMM是什么? Reference:异构内存管理 Heterogeneous Memory Management (HMM) 翻译于:https://elixir.bootlin.com/linux/v5.5-rc2/source/Documentation/vm/hmm.rst 提供基础设施和帮助程序以将非常规内存(设备内存,如板上 GPU 内存)集成到常规内核路径中,其基石是此类...

OpenEuler High-performance computing Kernel(HCK)

一、HPC场景 OpnEuler22.09 白皮书: https://www.openeuler.org/whitepaper/openEuler-whitepaper-2209.pdf 数控分离HCK 1> 背景 1、HPC介绍 reference: https://www.ibm.com/cn-zh/topics/hpc https://www.oracle.com...

OpenEuler Generalized Memory Management(Gmem) For Heterogeneous Device

openEuler 23.09 白皮书 https://www.openeuler.org/whitepaper/openEuler%2023.09%20%E6%8A%80%E6%9C%AF%E7%99%BD%E7%9A%AE%E4%B9%A6.pdf 异构通用内存管理框架(GMEM)特性 1> 背景和问题 在后摩尔时代,GPU、TPU 和 FPGA 等专用异构加速器设备正不断涌...

GCC FDO

一、Cache/TLB 根据空间局部性和时间局部性原理,cpu中会引入Cache/TLB, 来加速数据读取。但是因为大型应用中,由于多个重要硬件结构(包括缓存、TLB和分支预测器)面临巨大压力,大型二进制文件往往表现出较差的CPU性能。 二、二进制编译优化 1、主动Cahce优化 Cache优化 (taodudu.cc) 主动识别出可能导致cache miss的原因,对二进制的bs...

userspace lock introduce

锁介绍 多线程下为了保护共享数据,需要同步机制。 互斥:多线程中互斥是指多个线程访问同一资源时同时只允许一个线程对其进行访问,具有唯一性和排它性。但互斥无法限制访问者对资源的访问顺序,即访问是无序的; 同步:多线程同步是指在互斥的基础上(大多数情况),通过其它机制实现访问者对资源的有序访问。在大多数情况下,同步已经实现了互斥,特别是所有写入资源的情况必定是互斥的。少数情况是指可以允许多个...