固态硬盘、内存、显存——它们里面的”颗粒”到底有什么不同?

你有没有注意到一个有趣的现象?买固态硬盘的时候,商家会跟你说”这是 TLC 颗粒的”;买内存条的时候,包装上写着”DDR5″;而显卡的参数表里又冒出来一个”GDDR6X”或者”HBM3″。它们看上去都是焊在电路板上的黑色小方块,但价格差了十倍都不止。一根 32GB 的内存条可能要好几百块,而同样 32GB 的固态硬盘只要几十块钱就能拿下。

这是怎么回事?这些”颗粒”到底有什么不一样?

首先要搞清楚一件事:它们根本不是同一种东西

很多人会笼统地把它们都叫”闪存颗粒”,但严格来说,只有固态硬盘里的那个才是真正的闪存(Flash Memory)。内存条和显存里的颗粒是 DRAM——动态随机存取存储器,跟闪存是完全不同的两条技术路线。

它们最根本的区别在于一个字:

DRAM 是”易失性”存储器。你可以把它想象成一个漏水的杯子:数据以电荷的形式存在微小的电容里,但这些电容天生就会漏电,所以芯片必须每隔几毫秒就”刷新”一次,重新给电容充上电。一旦断电,所有数据就像水从杯子里漏干一样,彻底消失了。这就是为什么你电脑突然断电的时候,没保存的文档就没了——因为它还在内存里,还没来得及写入硬盘。

而 NAND Flash 是”非易失性”存储器。它的原理完全不同:数据存储在一种叫”浮栅晶体管”的结构里,电子被困在一层绝缘层中间,就像被封在玻璃瓶里一样。即使断了电,电子也跑不出去,数据自然就保住了。这就是为什么你的手机可以关机一个月再开,照片还在。

所以,从底层物理结构上来说,它们就是两种完全不同的东西。一个需要持续供电才能工作,另一个不需要。

固态硬盘里的 NAND Flash:便宜大碗,但有代价

固态硬盘用的 NAND Flash 最大的优势就是便宜和容量大。但它也有自己的烦恼,主要集中在一个问题上:每个存储单元到底塞几个比特的数据。

最早的 NAND 叫 SLC(Single-Level Cell),每个单元只存 1 个比特——要么是 0,要么是 1。这样的好处是读写极快、寿命超长,擦写次数能到 10 万次。但问题是太贵了,容量也做不大,所以现在基本只出现在企业级和工业级的产品里。

后来厂商想办法让一个单元存 2 个比特(MLC)、3 个比特(TLC)、4 个比特(QLC),甚至正在研发存 5 个比特的 PLC。每多存一个比特,容量就翻倍,成本就降低,但代价也很明显:速度变慢、寿命变短、出错概率变高。

为什么会这样呢?因为存的比特数越多,单元内部需要区分的电压等级就越多。SLC 只需要分辨 2 个电压状态,QLC 需要分辨 16 个。想象一下,你在一把尺子上标 2 个刻度和标 16 个刻度,后者对精度的要求显然高得多。时间一长,绝缘层老化、电子泄漏,那些挤在一起的电压等级就容易互相”串门”,数据就出错了。

你现在买到的大多数消费级固态硬盘都是 TLC 颗粒的,少数便宜的用 QLC。厂商通过一系列技巧来弥补它们的先天不足——比如用 SLC 缓存(把一部分 TLC 单元临时当 SLC 用来加速写入)、更强大的纠错算法、磨损均衡技术,等等。所以日常使用起来,你其实很难感觉到 TLC 和 SLC 的差别。

另外值得一提的是 3D NAND 技术。传统的 NAND 是把存储单元平铺在一个平面上(2D),后来厂商开始把它们像摩天大楼一样往上堆叠,现在已经堆到 200 多层了。这大大提升了容量,同时还改善了性能和耐久度,算是近年来存储行业最重要的技术进步之一。

不过不管怎么优化,NAND Flash 有一个根本的限制:它写入数据的时候不能直接覆盖旧数据,必须先把整个数据块擦除干净,再写入新的。这个”先擦后写”的机制注定了它的写入速度不可能像 DRAM 那么快。

内存条里的 DRAM:快到飞起,但也贵到飞起

你电脑里那根内存条,技术上叫 SDRAM(同步动态随机存取存储器),再具体一点,现在主流的是 DDR5 SDRAM。

DRAM 的核心结构很简单:一个晶体管加一个电容,就构成一个存储单元。数据就存在电容里,有电荷代表 1,没有代表 0。这种结构的好处是面积极小,所以同样的芯片面积能塞进去很多存储单元,容量做得比较大。

它比 NAND Flash 快多少呢?大概快两个数量级。DRAM 的访问延迟在 50 到 100 纳秒左右,而 NAND Flash 的读取延迟通常在几十微秒——差了大约 1000 倍。而且 DRAM 支持真正的随机访问,可以直接按字节读写任意位置的数据;NAND Flash 则是按”页”读、按”块”擦,灵活性差得多。

但 DRAM 的劣势也很明显:前面说了,它的电容会漏电,所以需要不断刷新。这个刷新过程本身就消耗电力。有研究指出,在一台计算机中,DRAM 消耗的功率可以占到整个系统功耗的接近一半。而且 DRAM 断电就丢数据,没法用来做持久存储。

再加上 DRAM 的制造成本比 NAND 高得多——毕竟它每个单元只存 1 个比特(不像 TLC 可以存 3 个),所以同样容量的 DRAM 价格是 NAND 的很多倍。这就是为什么你的内存可能只有 16GB 或 32GB,但硬盘轻松就能上 1TB、2TB。

有意思的是,固态硬盘里其实也有 DRAM 的身影。很多 SSD 会板载一颗小容量的 DRAM 芯片,专门用来存储数据映射表(FTL mapping table)——可以理解为一张”目录”,告诉控制器每块数据存在 NAND 的哪个物理位置。有了这张目录在速度飞快的 DRAM 里,SSD 找数据就快多了。当然也有些便宜的 SSD 省掉了这颗 DRAM,改用主机的内存来充当缓冲区(HMB 技术),性能会稍差一些。

显存:一种为 GPU “量身定制”的 DRAM

显存的英文叫 VRAM(Video RAM),但它本质上也是 DRAM,只不过做了针对图形处理的特殊优化。

你电脑里的内存条(DDR5)是为 CPU 设计的。CPU 做事的方式是”少量数据、反复访问”——它需要极低的延迟,能快速跳到任意一个内存地址去读写。所以 DDR 内存的设计重点是低延迟和灵活的随机访问。

GPU 做事的方式完全不同。它有成千上万个小核心在同时工作,处理大量像素、纹理、矩阵运算,本质上是”大量数据、并行流过”。GPU 不太在乎单次访问的延迟有多低,它在乎的是每秒钟能喂进来多少数据——也就是带宽。

所以显存(GDDR)虽然也基于 DRAM 技术,但在电路设计上做了很大的调整:它牺牲了一些延迟性能,换来了更高的时钟频率和更大的数据吞吐量。举个例子,DDR5 内存的带宽通常在 50-60 GB/s 左右,而一块配备 GDDR6X 显存的 RTX 4090 显卡,显存带宽可以达到 1 TB/s 以上。差距非常巨大。

除了 GDDR 系列,还有一种更高端的显存技术叫 HBM(High Bandwidth Memory,高带宽内存)。HBM 的思路非常有趣:它不是像 GDDR 那样把内存芯片平铺在电路板上、围绕着 GPU 摆放,而是把多层 DRAM 芯片像叠积木一样堆叠起来,通过硅穿孔(TSV)技术连通上下层,然后整个贴在 GPU 旁边的硅中介层上。

这种堆叠结构的好处是数据传输的物理距离极短,可以使用极宽的数据总线——一个 HBM 堆栈就有 1024 位的总线宽度,而 GDDR6 通常是 32 位。虽然 HBM 每个引脚的速度其实比 GDDR 慢,但架不住总线宽啊,一次性能传输的数据量大得多。最终效果就是:NVIDIA H100 上的 HBM3 显存带宽达到了 3.35 TB/s,是消费级显卡的好几倍。

当然,HBM 非常非常贵。目前它主要出现在 AI 训练用的数据中心 GPU 上,比如 NVIDIA 的 H100 和 AMD 的 MI300X。你买的游戏显卡用的基本都是 GDDR6 或 GDDR6X,价格友好得多,性能对游戏和日常使用来说也完全够用。

写在最后

所以你看,虽然它们都是”颗粒”,都是焊在电路板上的黑色小芯片,但底层的技术路线、设计取舍和应用场景是完全不同的。NAND Flash 追求的是大容量、低成本和持久保存;DRAM 追求的是极速响应和灵活访问;而显存则是在 DRAM 的基础上,把一切都往”带宽”方向拉满。

每一种存储技术都是在速度、容量、成本、功耗和持久性之间做取舍。没有哪一种是”万能的”,它们各自守着自己最擅长的位置,共同撑起了你面前这台能流畅运行的电脑。

下次有人跟你说”都是颗粒有啥区别”的时候,你就可以告诉他:区别大了。


发布于

分类

作者

标签:

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注