偷偷告诉大家,本博客的后台管理也正在制作,为大家准备了游客专用账号! 网站新增留言回复啦!使用QQ登陆即可回复,人人都可以回复! 如果你觉得网站做得还不错,来Fly社区点个赞吧!点我前往 美文网    一个PHP&Golang程序员的个人博客,采用TP框架搭建,目前已完工!点我前往 博客园    一个PHP&Golang程序员的个人博客,采用Yii2框架搭建,目前已完工!点我前往 图书商城    一个PHP&Golang程序员的个人博客,前端采用weiui框架、后端采用Laravel5.5框架搭建,目前已完工!点我前往
浅析GPU通信技术(上)-GPUDirect P2P
GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。
浅析GPU通信技术(中)-NVLink
背景 上一篇文章《浅析GPU通信技术(上)-GPUDirect P2P》中我们提到通过GPUDirect P2P技术可以大大提升GPU服务器单机的GPU通信性能,但是受限于PCI Expresss总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA提出了NVLink总线协议。
浅析GPU通信技术(下)-GPUDirect RDMA
目录 浅析GPU通信技术(上)-GPUDirect P2P 浅析GPU通信技术(中)-NVLink 浅析GPU通信技术(下)-GPUDirect RDMA 1. 背景 前两篇文章我们介绍的GPUDirect P2P和NVLink技术可以大大提升GPU服务器单机的GPU通信性...
关于我们
关于我们
CPU拓扑结构详解
本篇旨在熟悉Symmetric multiprocessing (SMP)、Non-uniform memory access (NUMA)、Simultaneous Multi-Threading (SMT)三种CPU拓扑结构。
Linux绑定CPU运行指定进程(绑核)-taskset
最近在x86上测试一些节点的性能,发现节点性能变化很大,尤其是当有其他高消耗的资源起来后,性能就会变得相当不稳定,因此怀疑是多个进程在争抢一个CPU的资源,从而导致该节点的性能变化过大。
Docker中的镜像分层
我们在容器内对删除文件,为什么commit后,无法达到删除文件的效果(镜像大小没有减小)?怎样取优化一个镜像?这些都要深入了解docker中的镜像分层机制。
怎样用好Kubernetes的NUMA对齐?
NUMA的全称叫Non-Uniform Memory Access,非均匀访问存储模型。第一次见到的时候,每个字都认识,但是完全不知道它在说什么。那索性就不要管字面意思,内涵意思就是在服务器上为了支持扩展多处理器而设计的一种硬件架构。现在基本市面上见到的大部分服务器都是NUMA架构的,这是不是就简单了。