天硕工业级M.2 NVMe SSD固态硬盘LDPC纠错引擎升级
2025-07-01 16:23 来源:天硕
一次微不足道的数据错误,可能导致数十万的亏损风险。在严苛的工业环境中,数据的精准不是优选项,而是生死线。天硕 (TOPSSD) 凭借自研主控芯片和深厚的固件技术积累,结合自研4K LDPC ECC算法,将产品的UBER(不可纠正错误比特率)降至超低的 10^(-17),为核心数据铸就坚不可摧的屏障。
天硕G55 Pro M.2 NVMe工业级固态硬盘以自研PCIe Gen3x4主控+100%纯国产元器件实现了3600MB/s高速读取,-55℃~85℃的超宽温域稳定运行;以硬件级PLP掉电与固件协同保护全盘,支持智能软销毁功能。产品设计满足工业级抗振耐冲击标准,拥有200万小时+ MTBF高可靠认证及GJB2017体系背书,精准契合国产化存储对高性能、高可靠、高耐用的严苛需求。该产品已广泛应用于智能制造、雷达系统、电力等领域。
坏块
要理解SSD为什么需要ECC (Error-Correcting Code;纠错码),就需要先理解什么是坏块。坏块指含有一个或多个无效位的内存块,可能出厂即存在或在使用中产生,导致数据不可访问、容量降低、性能下降,直至设备故障。
NAND闪存性能下降和位错误
为了管理坏块,固态硬盘会通过编程实现 ECC 和 NAND 块映射。当检测到坏块时,坏 块中的数据将传输至空闲块,并执行特定的纠错码来检测和纠正位错误,以减少无效数据。随着单元尺寸缩小和每单元比特数增加,以下因素会加剧性能下降和误码率上升:
(P/E)周期:写入和擦除的恒定周期要求对NAND单元施加高压,从而在隧穿氧化层上造成应力并削弱隧穿氧化层。这会导致电子从浮栅泄漏,NAND闪存单元性能下降。
每单元更多位: 新的闪存技术为提高密度,每单元存储更多位会缩小电压阈值分布的间隙,引起电压偏移,并因单元间更紧凑而产生干扰,导致误码。
天硕NAND闪存设备中的错误检测和纠正
ECC是纠正NAND错误的关键技术。与其他采用简单纠错算法的产品不同,天硕G55 Pro M.2 NVMe SSD所使用是更高级的机制:天硕自研的4K LDPC ECC。
LDPC(低密度奇偶校验)
LDPC码,也称Gallagher码,它们具有解码软位数据和硬位数据的能力。在Gallagher的论文中,低密度奇偶校验码被定义为“一种校验矩阵中1的分布非常稀疏的线性二进制分组码”,这意味着1比0要少。其具有以下优势:
1.低解码复杂度
2.能够同时利用NAND中的硬位和软位信息进行解码
3.良好的短块性能
4.为长块提供“近容量”(接近香农极限)性能
LDPC码是目前最先进的纠错算法。而天硕自主研发的4K LDPC ECC技术,则在原有技术基础上进一步强化,实现了更低的数据错误率,增强了产品可靠性:
纠错强度倍增:天硕的4K LDPC通过优化奇偶校验矩阵密度和解码算法,纠错能力较传统LDPC提升数倍,尤其在处理高误码率场景(如极端温度、辐照环境)时表现更稳定。
适配高密度闪存:针对长江存储等3D NAND的高密度架构,4K LDPC优化了电压阈值分布偏移的容错性,减少因单元干扰导致的数据错误。
天硕的先进错误检测和纠正技术,将数据出错的可能性降至极限,为工业存储产品带来了更强大的可靠性。