网站首页 文章专栏
共有文章【55】篇,请查阅!
浅析GPU通信技术(上)-GPUDirect P2P
GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。
Docker中的镜像分层
我们在容器内对删除文件,为什么commit后,无法达到删除文件的效果(镜像大小没有减小)?怎样取优化一个镜像?这些都要深入了解docker中的镜像分层机制。
怎样用好Kubernetes的NUMA对齐?
NUMA的全称叫Non-Uniform Memory Access,非均匀访问存储模型。第一次见到的时候,每个字都认识,但是完全不知道它在说什么。那索性就不要管字面意思,内涵意思就是在服务器上为了支持扩展多处理器而设计的一种硬件架构。现在基本市面上见到的大部分服务器都是NUMA架构的,这是不是就简单了。
CPU拓扑结构详解
本篇旨在熟悉Symmetric multiprocessing (SMP)、Non-uniform memory access (NUMA)、Simultaneous Multi-Threading (SMT)三种CPU拓扑结构。
NUMA(非一致性内存架构)
非一致性内存架构(Non-uniform Memory Architecture)是为了解决传统的对称多处理(Symmetric Multi-processor)系统中的可扩展性问题而诞生的。在对称多处理系统中,处理器共享北桥中的内存控制器来达到共同访问外部内存和IO的目的,也就是说所有的处理器对内存和I/O的访问方式和开销都是相同的。在这种系统中,随着更多的处理器被添加到SMP系统中,总线的竞争将会越来越大,系统的性能也必将随之大打折扣。