一种NAND闪存错误率预测方法及系统转让专利

申请号 : CN202010046777.7

文献号 : CN111459706B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴非刘伟华朱奥刘嘉宏谢长生

申请人 : 华中科技大学

摘要 :

本发明公开了一种NAND闪存错误率预测方法及系统,属于计算机存储领域,包括:从NAND闪存的历史数据中获取M个前期干扰特征,及各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的原始比特错误率作为一条预测样本,从而得到M条预测样本;将预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征所对应的原始比特误码率;其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;错误率预测模型为多输入多输出模型,用于根据前期的干扰特征及对应的原始比特误码率预测后期干扰特征所对应的原始比特误码率。本发明能够预测NAND闪存的错误率,并预测出NAND闪存错误率的变化趋势,为数据存储安全提供量化的、可靠的判断依据。

权利要求 :

1.一种NAND闪存错误率预测方法,其特征在于,包括:从NAND闪存的历史数据中获取M个干扰特征作为前期干扰特征,同时获取各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的原始比特错误率作为一条预测样本,从而得到M条预测样本;

将所得到的M条预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征中,各后期干扰特征所对应的原始比特误码率;

其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;所述错误率预测模型为多输入多输出模型,用于根据前期的干扰特征及对应的原始比特误码率预测后期干扰特征所对应的原始比特误码率;后期干扰特征在时间顺序上晚于前期干扰特征;M和N均为正整数。

2.如权利要求1所述的NAND闪存错误率预测方法,其特征在于,所述干扰特征包括编程/擦除周期、数据保存时间、编程干扰、读干扰以及层间干扰中的一种或多种干扰。

3.如权利要求1所述的NAND闪存错误率预测方法,其特征在于,所述错误率预测模型的训练方法包括:

(S1)从NAND闪存的历史数据中获取M+N个干扰特征,以及各干扰特征所对应的原始比特错误率,将所获取的干扰特征划分为前期的M个干扰特征和后期的N个干扰特征,由前期的干扰特征及其对应的原始比特错误率构成训练数据,由后期的干扰特征及其对应的原始比特错误率构成标签数据,从而得到一条由训练数据和标签数据组成的训练样本;

(S2)重复执行步骤(S1),直至获取到T条训练样本;

(S3)基于多输入多输出模型建立错误率预测模型后,利用所获取到的所有训练样本对其进行训练,从而在训练结束后得到已训练好的错误率预测模型;

其中,T为正整数。

4.如权利要求1‑3任一项所述的NAND闪存错误率预测方法,其特征在于,干扰特征及原始比特错误率均以块为单位获取。

5.如权利要求1‑3任一项所述的NAND闪存错误率预测方法,其特征在于,干扰特征及原始比特错误率均以页为单位获取。

6.如权利要求1‑3任一项所述的NAND闪存错误率预测方法,其特征在于,所述错误率预测模型为人工神经网络模型或者循环神经网络模型。

7.如权利要求1‑3任一项所述的NAND闪存错误率预测方法,其特征在于,还包括:若在从NAND闪存的历史数据中获取干扰特征及对应的原始比特错误率时,数据获取失败,则通过数据补齐的方式补充缺失的数据,以保证能够成功获取到所需数据。

8.一种NAND闪存错误率预测系统,其特征在于,包括:预测样本获取模块和预测模块;

所述预测样本获取模块,用于从NAND闪存的历史数据中获取M个干扰特征作为前期干扰特征,同时获取各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的原始比特错误率作为一条预测样本,从而得到M条预测样本;

所述预测模块,用于所述预测样本获取模块获取到的M条预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征中,各后期干扰特征所对应的原始比特误码率;

其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;所述错误率预测模型为多输入多输出模型,用于根据前期的干扰特征及对应的原始比特误码率预测后期干扰特征所对应的原始比特误码率;后期干扰特征在时间顺序上晚于前期干扰特征;M和N均为正整数。

说明书 :

一种NAND闪存错误率预测方法及系统

技术领域

[0001] 本发明属于计算机存储领域,更具体地,涉及一种NAND闪存错误率预测方法及系统。

背景技术

[0002] 近年来,NAND闪存以速度快、存储密度高、抗震性好等特点逐渐成为主流存储介质,被广泛应用在嵌入式系统、个人电脑以及高性能服务器等诸多系统中。但随着特征工艺
的尺寸减小、多级存储的增长以及三维堆叠层数的增加,各种干扰对NAND闪存可靠性提出
了巨大挑战。
[0003] NAND闪存在使用过程中,编程/擦除(Program/Erase,P/E)操作,会对氧化层造成磨损;随着磨损的增加,写入的数据读取时会出现读错误。并且当把写入的数据放置一段时
间再读后,也会出现读错误。原始比特错误率(Raw Bit Error Rate,RBER)表示所读取的数
据在未经译码的情况下,其中的错误比特占所有比特数量的比例。当原始比特错误率较低
时,错误数据能被错误纠正码纠正。然而,随着氧化层的磨损以及时间的流逝,存储单元内
存储的电荷数量也会发生较大变化,导致较高的RBER和读失败。数据对于企业或者消费者
来说其价值不可估量的,其价值甚至高于NAND闪存存储介质的价值,如果能够预知NAND闪
存中何时会出现坏块,就能在闪存出现坏块之前NAND闪存出现坏块之前将其中存储的数据
转移到新的NAND闪存中,从而避免数据丢失。
[0004] 目前,为了保证NAND闪存中存储的数据的安全,大多研究都集中在闪存的寿命预测上。传统的预测NAND闪存寿命的方法,只能粗略地完成好块和坏块的分类,并不利于在
NAND闪存即将出现坏块时,及时采取相应的措施。专利申请“一种SSD内实现的闪存寿命预
测方法”(申请号:201811514746.9)中公开了一种预测闪存芯片的寿命预测值的方法。该方
法预测的闪存寿命是指闪存产品在失效或到达纠错码上限之前可以执行的编程/擦除周期
数;具体地,将闪存特征量中的一种或几种进行运算操作,得到运算处理值,将闪存特征量
及运算处理值构成集合,取集合中的子集作为预测模型的输入,并且,该方法只使用基因编
程算法执行预测模型训练。总的来说,由于依赖于特定的特征量和特定的执行算法,该方法
对于闪存寿命预测的准确率得不到保障,也无法为存储于NAND闪存中的数据的安全性提供
可靠的分析依据。

发明内容

[0005] 针对现有技术的缺陷和改进需求,本发明提供了一种NAND闪存错误率预测方法及系统,其目的在于,实现对NAND闪存中原始比特错误率的预测,保障数据存储安全。
[0006] 为实现上述目的,按照本发明的第一方面,提供了一种NAND闪存错误率预测方法,包括:
[0007] 从NAND闪存的历史数据中获取M个干扰特征作为前期干扰特征,同时获取各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的原始比特错误率作为一条
预测样本,从而得到M条预测样本;
[0008] 将所得到的M条预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征中,各后期干扰特征所对应的原始比特误码率;
[0009] 其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;错误率预测模型为多输入多输出模型,用于根据前期的干扰特征及对应的原始比特误码率预测后期干
扰特征所对应的原始比特误码率;后期干扰特征在时间顺序上晚于前期干扰特征;M和N均
为正整数。
[0010] NAND闪存的前期干扰特征下的RBER与后期干扰特征下RBER之间有一定的规律,本发明根据前期干扰特征及对应的原始比特错误率预测后期干扰特征所对应的原始比特错
误率,既实现了对NAND闪存的错误率预测,能够为数据存储安全提供量化的、可靠的判断依
据,同时本发明能够预测出NAND闪存错误率的变化趋势,有利于准确地确定进行数据迁移
的时机。
[0011] 进一步地,干扰特征包括编程/擦除周期、数据保存时间、编程干扰、读干扰以及层间干扰中的一种或多种干扰。
[0012] 多维干扰特征和RBER之间有一定的规律,以数据保存时间(Data Retention Time,DR)和编程/擦除周期(P/E cycles)为例,RBER随着DR和P/E cycles的增加而震荡上
升,是可预测的,但是P/E cycles、DR和RBER之间的增长曲线不是完全平滑的单调递增曲
线,有一定的波动和平缓、甚至下降变化;本发明能够针对多维特征干扰进行NAND闪存错误
率的预测,能够应用NAND闪存本身的特性,最大程度上保证预测准确度。
[0013] 进一步地,错误率预测模型的训练方法包括:
[0014] (S1)从NAND闪存的历史数据中获取M+N个干扰特征,以及各干扰特征所对应的原始比特错误率,将所获取的干扰特征划分为前期的M个干扰特征和后期的N个干扰特征,由
前期的干扰特征及其对应的原始比特错误率构成训练数据,由后期的干扰特征及其对应的
原始比特错误率构成标签数据,从而得到一条由训练数据和标签数据组成的训练样本;
[0015] (S2)重复执行步骤(S1),直至获取到T条训练样本;
[0016] (S3)基于多输入多输出模型建立错误率预测模型后,利用所获取到的所有训练样本对其进行训练,从而在训练结束后得到已训练好的错误率预测模型;
[0017] 其中,T为正整数。
[0018] 进一步地,干扰特征及原始比特错误率均以块为单位获取。
[0019] 进一步地,干扰特征及原始比特错误率均以页为单位获取。
[0020] 闪存块间的可靠性差异较大,相应地,块间的RBER差异较大,因此,无法用统一的方法或参数进行错误率估计,本发明以块为单位获取数据,进行模型训练和错误率预测,能
够准确地预测每个闪存块的原始比特错误率;同样地,闪存页间的可靠性和RBER差异较大,
无法用统一的方法或参数进行错误率估计,本发明以页为单位获取数据,进行模型训练和
错误率预测,能够准确地预测每个闪存页的原始比特错误率;随着闪存页容量的不断增长,
本发明实现页级的错误率预测,有着重要的实际意义。
[0021] 进一步地,错误率预测模型为人工神经网络模型或者循环神经网络模型;基于人工神经网络模型或者循环神经网络模型建立错误率预测模型,能够获得较高的预测精度。
[0022] 进一步地,本发明第一方面提供的NAND闪存错误率预测方法,还包括:若在从NAND闪存的历史数据中获取干扰特征及对应的原始比特错误率时,数据获取失败,则通过数据
补齐的方式补充缺失的数据,以保证能够成功获取到所需数据。
[0023] 本发明利用数据补齐的方式补充缺失的数据,能够保证在任意一个预测点,都能获取到足够的输入数据,实现对NAND闪存错误率的预测;也能够保证在模型训练的过程中,
能够获取到足够的训练样本,从而保证模型的训练效果。
[0024] 按照本发明的第二方面,还提供了一种NAND闪存错误率预测系统,包括:预测样本获取模块和预测模块;
[0025] 预测样本获取模块,用于从NAND闪存的历史数据中获取M个干扰特征作为前期干扰特征,同时获取各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的
原始比特错误率作为一条预测样本,从而得到M条预测样本;
[0026] 预测模块,用于预测样本获取模块获取到的M条预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征中,各后期干扰特征所对应的原始比特误码率;
[0027] 其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;错误率预测模型为多输入多输出模型,用于根据前期的干扰特征及对应的原始比特误码率预测后期干
扰特征所对应的原始比特误码率;后期干扰特征的绝对值均大于前期干扰特征的绝对值;M
和N均为正整数。
[0028] 总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
[0029] (1)本发明根据前期干扰特征及对应的原始比特错误率预测后期干扰特征所对应的原始比特错误率,既实现了对NAND闪存的错误率预测,能够为数据存储安全提供量化的、
可靠的判断依据,同时本发明能够预测出NAND闪存错误率的变化趋势,有利于准确地确定
进行数据迁移的时机。
[0030] (2)本发明实现NAND闪存错误率的预测,仅需采集影响NAND闪存错误率的特征及原始比特错误率,而不依赖于NAND闪存的结构特征,因此,本发明能够适用于各种类型、各
种工艺尺寸的NAND闪存。
[0031] (3)本发明既能实现块级的错误率预测,也能实现页级的错误率预测,有着重要的实际意义。
[0032] (4)在本发明的优选实施方案中,基于人工神经网络模型或者循环神经网络模型建立错误率预测模型,能够获得较高的预测精度。

附图说明

[0033] 图1为本发明实施例提供的NAND闪存错误率预测方法流程图;
[0034] 图2为本发明实施例提供的错误率预测模型示意图;
[0035] 图3为本发明实施例提供的错误率预测模型训练方法流程图。

具体实施方式

[0036] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并
不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要
彼此之间未构成冲突就可以相互组合。
[0037] 在本发明中,本发明及附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0038] 为了实现对NAND闪存中原始比特错误率的预测,保障数据存储安全,本发明提供的NAND闪存错误率预测方法,如图1所示,包括:
[0039] 从NAND闪存的历史数据中获取M个干扰特征作为前期干扰特征,同时获取各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的原始比特错误率作为一条
预测样本,从而得到M条预测样本;
[0040] 将所得到的M条预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征中,各后期干扰特征所对应的原始比特误码率;
[0041] 其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;错误率预测模型为多输入多输出模型,如图2所示,用于根据前期的干扰特征及对应的原始比特误码率
预测后期干扰特征所对应的原始比特误码率;后期干扰特征在时间顺序上晚于前期干扰特
征;M和N均为正整数;在具体应用中,M和N的具体取值,即前期干扰特征的数量和后期干扰
特征的具体数量,可根据NAND闪存错误率的变化情况相应确定;例如,若NAND闪存错误率的
变化较为剧烈,则相应地M取值较大,N的取值较小,以保证能够准确学习到RBER随干扰特征
变化的规律,并准确预测后期干扰特征下的RBER;相反,若NAND闪存错误率的变化较为平
缓,则相应地M取值较小,N的取值较大,由此能够在保证预测精度的情况下,简化模型训练
和错误率预测。
[0042] NAND闪存的前期干扰特征下的RBER与后期干扰特征下RBER之间有一定的规律,上述NAND闪存错误率预测方法,根据前期干扰特征及对应的原始比特错误率预测后期干扰特
征所对应的原始比特错误率,既实现了对NAND闪存的错误率预测,能够为数据存储安全提
供量化的、可靠的判断依据,同时本发明能够预测出NAND闪存错误率的变化趋势,有利于准
确地确定进行数据迁移的时机。
[0043] 基于本实施例的预测结果,能够预知NAND闪存在干扰特征为何值时会出现坏块,从而能够提前采取相应措施(例如数据迁移),以保证数据的存储安全。
[0044] 在一个可选的实施方式中,干扰特征包括编程/擦除周期、数据保存时间、编程干扰、读干扰以及层间干扰中的一种或多种干扰;
[0045] 多维干扰特征和RBER之间有一定的规律,以数据保存时间(Data Retention Time,DR)和编程/擦除周期(P/E cycles)为例,RBER随着DR和P/E cycles的增加而震荡上
升,是可预测的,但是P/E cycles、DR和RBER之间的增长曲线不是完全平滑的单调递增曲
线,有一定的波动和平缓、甚至下降变化;上述NAND闪存错误率预测方法,能够针对多维特
征干扰进行NAND闪存错误率的预测,能够应用NAND闪存本身的特性,最大程度上保证预测
准确度;
[0046] 应当说明的是,上述干扰特征仅为NAND闪存中常见的会影响NAND闪存错误率的特征,但不应理解为对本发明的唯一限定,随着NAND闪存特性的不同,其他会对NAND闪存错误
率产生影响的干扰特征,也可应用于本发明;具体选用哪种或哪些特征作为错误率预测的
干扰特征,可根据各特征对NAND闪存错误率的影响程度、数据采集成本以及模型训练成本
等因素综合确定。
[0047] 在一个可选的实施方式中,如图3所示,错误率预测模型的训练方法包括:
[0048] (S1)从NAND闪存的历史数据中获取M+N个干扰特征,以及各干扰特征所对应的原始比特错误率,将所获取的干扰特征划分为前期的M个干扰特征和后期的N个干扰特征,由
前期的干扰特征及其对应的原始比特错误率构成训练数据,由后期的干扰特征及其对应的
原始比特错误率构成标签数据,从而得到一条由训练数据和标签数据组成的训练样本;
[0049] (S2)重复执行步骤(S1),直至获取到T条训练样本;
[0050] (S3)基于多输入多输出模型建立错误率预测模型后,利用所获取到的所有训练样本对其进行训练,从而在训练结束后得到已训练好的错误率预测模型;
[0051] 其中,T为正整数;T的具体取值可根据模型的训练效果要求确定,以保证既能够学习到NAND闪存的原始比特错误率随干扰特征的变化规律,又不会出现过拟合。
[0052] 可选地,干扰特征及原始比特错误率均以块为单位获取;或者,干扰特征及原始比特错误率均以页为单位获取。
[0053] 闪存块间的可靠性差异较大,相应地,块间的RBER差异较大,因此,无法用统一的方法或参数进行错误率估计,上述NAND闪存错误率预测方法,以块为单位获取数据,进行模
型训练和错误率预测,能够准确地预测每个闪存块的原始比特错误率;同样地,闪存页间的
可靠性和RBER差异较大,无法用统一的方法或参数进行错误率估计,上述NAND闪存错误率
预测方法,以页为单位获取数据,进行模型训练和错误率预测,能够准确地预测每个闪存页
的原始比特错误率;随着闪存页容量的不断增长,本发明实现页级的错误率预测,有着重要
的实际意义。
[0054] 为了进一步保证错误率预测模型的预测精度,在一个可选的实施方式中,错误率预测模型为人工神经网络模型或者循环神经网络模型;基于人工神经网络模型或者循环神
经网络模型建立错误率预测模型,能够获得较高的预测精度;
[0055] 应当说明的是,上述模型的具体实施,仅为本发明的一种优选实施方式,而不应理解为对本发明的唯一限定,其他的多输入多输出模型,同样可以应用于本发明,实现对NAND
闪存错误率的预测。
[0056] 在一个可选的实施方式中,上述NAND闪存错误率预测方法,还可包括:若在从NAND闪存的历史数据中获取干扰特征及对应的原始比特错误率时,数据获取失败,则通过数据
补齐的方式补充缺失的数据,以保证能够成功获取到所需数据。
[0057] 利用数据补齐的方式补充缺失的数据,能够保证在任意一个预测点,都能获取到足够的输入数据,实现对NAND闪存错误率的预测;也能够保证在模型训练的过程中,能够获
取到足够的训练样本,从而保证模型的训练效果。
[0058] 总的来说,上述NAND闪存错误率预测方法,不仅能预测NAND闪存在失效或到达纠错码上限之前可以执行的编程/擦除周期数,还可以预测任意编程/擦除周期数下NAND闪存
的保存时间;其中,预测模型的输入为同一预测单位下确定维度的前期干扰特征下的RBER,
且预测模型可为人工神经网络、循环神经网络或其他多输入多输出模型,最终通过模型计
算得到NAND闪存多维干扰特征对应的闪存错误率。
[0059] 上述NAND闪存错误率预测方法,不依赖于NAND闪存的结构特征,因此,能够适用于各种类型、各种工艺尺寸的NAND闪存;具体来说,不仅适用干平面NAND闪存,也可适用于三
维NAND闪存,还可适用于各种工艺尺寸以及浮动门型(Floating Gate)和电荷捕获(Charge 
Trap)型闪存,并且适用于未来复杂RBER变化规律的NAND闪存。
[0060] 本发明还提供了一种NAND闪存错误率预测系统,包括:预测样本获取模块和预测模块;
[0061] 预测样本获取模块,用于从NAND闪存的历史数据中获取M个干扰特征作为前期干扰特征,同时获取各前期干扰特征所对应的原始比特错误率,将前期干扰特征及其对应的
原始比特错误率作为一条预测样本,从而得到M条预测样本;
[0062] 预测模块,用于预测样本获取模块获取到的M条预测样本输入已训练好的错误率预测模型中,预测N个后期干扰特征中,各后期干扰特征所对应的原始比特误码率;
[0063] 其中,干扰特征为影响NAND闪存原始比特错误率的特征或特征组合;错误率预测模型为多输入多输出模型,用于根据前期的干扰特征及对应的原始比特误码率预测后期干
扰特征所对应的原始比特误码率;后期干扰特征在时间顺序上晚于前期干扰特征;M和N均
为正整数;
[0064] 在本发明实施例中,各模块的具体实施方式,可参考上述方法实施例中的描述,在此将不作复述。
[0065] 本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含
在本发明的保护范围之内。