Memory Barrier笔记 --- Cache and MESI Protocol Posted on March 5, 2025 尽管前述的缓存结构在重复读写时具有良好性能,但对于首次写入某个缓存行时其性能较差。以图4为例,当CPU0要写入一个被CPU1缓存的缓存行时,必须等待该缓存行到达,导致CPU0长时间停滞。 但是我们其实并没有必要让CPU0长时间停滞,因为它无论如何都会无条件覆盖该缓存行的数据。 [Read More] Tags: Memory Barrier
Memory Barrier笔记 --- Cache and MESI Protocol Posted on March 2, 2025 前人对Memory Barrier的总结已经很完善了,我在这边只是记录下自己对其的理解,并无新意,只是作为个人的笔记而已。想要详细了解的话推荐阅读下面这篇译文,如果英语好的话可以直接看原文。 [Read More] Tags: Memory Barrier
Roofline Model笔记 Posted on February 22, 2025 本文主要介绍roofline model的概念以及其在nsight compute中的作用 [Read More] Tags: cuda learning