三维集成芯片及其构建方法、数据处理方法、电子设备转让专利
申请号 : CN202111237509.4
文献号 : CN113674772B
文献日 : 2022-04-12
发明人 : 周小锋
申请人 : 西安紫光国芯半导体有限公司
摘要 :
权利要求 :
1.一种三维集成芯片,其特征在于,所述三维集成芯片至少包括存储器单元以及逻辑单元,
所述存储器单元包括至少一个存储阵列和至少一个第一三维集成端口,其中:所述存储阵列包括至少一个存储体;
每个存储体对应一个第一三维集成端口;
所述逻辑单元包括至少一个逻辑子单元,所述逻辑子单元至少包括第二三维集成端口、至少一个计算核和内存控制器,其中:所述第二三维集成端口与所述至少一个第一三维集成端口连接,进而将所述存储器单元以及所述逻辑单元三维异质集成连接;
所述计算核被配置为对所述至少一个存储体进行访问,并且利用访问的数据实现对应的计算功能;
所述内存控制器与所述计算核连接且与所述第二三维集成端口选择性地连接,所述内存控制器被配置为经由所述第二三维集成端口和所述至少一个第一三维集成端口的连接而控制所述计算核与所述至少一个存储体之间进行存储访问;
其中,所述逻辑单元进一步包括:测试和修复单元,所述测试和修复单元与所述第二三维集成端口选择性地连接,所述测试和修复单元被配置为经由所述第二三维集成端口和所述第一三维集成端口的连接而对所述至少一个存储体进行测试和修复。
2.根据权利要求1所述的三维集成芯片,其特征在于,所述内存控制器基于从所述计算核所接收的访问指令中的访问地址,通过所述第二三维集成端口以及与所述访问地址所对应的第一三维集成端口的连接,实现所述计算核对相应存储体的访问。
3.根据权利要求1所述的三维集成芯片,其特征在于,所述逻辑单元还包括:多路选择开关,所述多路选择开关连接所述内存控制器以及所述测试和修复单元,所述多路选择开关被配置为选择性地将所述内存控制器与所述第二三维集成端口连接,以实现存储访问,或者将所述测试和修复单元与所述第二三维集成端口连接,以实现测试和修复。
4.根据权利要求1或2所述的三维集成芯片,其特征在于,所述三维集成芯片包括至少两个存储阵列以及至少两个逻辑子单元,并且所述逻辑子单元进一步包括至少一个路由单元,所述路由单元被配置为将所述至少两个逻辑子单元连接;
其中,源逻辑子单元中的路由单元被配置为基于从所述源逻辑子单元中的计算核所接收的访问指令中的目标访问地址,至少通过所述源逻辑子单元中的路由单元以及目标逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核对相应目标访问地址的访问。
5.根据权利要求4所述的三维集成芯片,其特征在于,所述目标访问地址为目标逻辑子单元中的计算核的地址,其中
所述源逻辑子单元中的路由单元被配置为基于从源逻辑子单元中的计算核所接收的访问指令中的所述目标逻辑子单元中的计算核的地址,至少通过所述源逻辑子单元中的路由单元以及目标逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核对所述目标逻辑子单元中的计算核的访问。
6.根据权利要求4所述的三维集成芯片,其特征在于,所述目标访问地址为目标存储阵列的存储体的地址,其中
所述源逻辑子单元中的路由单元被配置为基于从源逻辑子单元中的计算核所接收的访问指令中的所述目标存储阵列的存储体的地址,至少通过所述源逻辑子单元中的路由单元、所述目标存储阵列所对应的逻辑子单元中的路由单元和第二三维集成端口与所述目标存储阵列的存储体所对应的第一三维集成端口的连接,实现所述源逻辑子单元中的计算核对所述目标存储阵列的存储体的访问。
7.根据权利要求1或2所述的三维集成芯片,其特征在于,所述存储器单元还包括:至少一个纠错码ECC单元,其中所述至少一个存储体各自具有ECC单元,所述ECC单元被配置用于对每个存储体中所存储的数据进行检错和纠错。
8.根据权利要求1所述的三维集成芯片,其特征在于,所述逻辑子单元还包括:缓存模块,所述缓存模块被配置用于在所述逻辑单元对所述存储器单元进行存储访问时,将所述逻辑单元的工作电压转换成所述存储器单元的工作电压或者将所述存储器单元的工作电压转换成所述逻辑单元的工作电压。
9.根据权利要求1或2所述的三维集成芯片,其特征在于,所述逻辑单元为高性能计算逻辑单元或超算逻辑单元。
10.一种三维集成芯片的构建方法,其特征在于,所述三维集成芯片至少包括存储器单元以及逻辑单元,所述构建方法包括:构建所述存储器单元,所述存储器单元包括至少一个存储阵列和至少一个第一三维集成端口,其中:
所述存储阵列包括至少一个存储体;
每个存储体对应一个第一三维集成端口;
构建所述逻辑单元,所述逻辑单元包括至少一个逻辑子单元,所述逻辑子单元至少包括第二三维集成端口、至少一个计算核和内存控制器,其中:所述第二三维集成端口与所述至少一个第一三维集成端口连接;
所述计算核被配置为对所述至少一个存储体进行访问,并且利用访问的数据实现对应的计算功能;
所述内存控制器与所述计算核连接且与所述第二三维集成端口选择性地连接,所述内存控制器被配置为经由所述第二三维集成端口和所述至少一个第一三维集成端口的连接而控制所述计算核与所述至少一个存储体之间进行存储访问;
其中,所述逻辑单元进一步包括:测试和修复单元,所述测试和修复单元与所述第二三维集成端口选择性地连接,所述测试和修复单元被配置为经由所述第二三维集成端口和所述第一三维集成端口的连接而对所述至少一个存储体进行测试和修复。
11.一种电子设备,其特征在于,所述电子设备包括根据权利要求1‑9中的任一项所述的三维集成芯片。
12.一种三维集成芯片的数据处理方法,其特征在于,所述数据处理方法基于上述权利要求1‑9中的任一项所述的三维集成芯片,所述方法包括:从计算核接收访问指令,并基于所述访问指令获取访问地址;
通过第二三维集成端口和至少一个第一三维集成端口的连接而控制计算核与至少一个存储体之间进行存储访问。
说明书 :
三维集成芯片及其构建方法、数据处理方法、电子设备
技术领域
及其构建方法、数据处理方法、电子设备。
背景技术
在高带宽存储器中,首先将存储裸片堆叠起来,然后利用硅通孔(Through Si Vias,TSV)将
这些堆叠的存储裸片连接在一起,从而以增加存储访问I/O和速率的方式提供更高带宽给
CPU/GPU。高带宽存储器标准以2.5D封装的形式实现,通过硅中介层(interposer)将高带宽
存储器的I/O与CPU/GPU的I/O互连。与传统存储器中通过PCB将存储器与CPU/GPU互连相比,
通过硅中介层(interposer)将高带宽存储器的I/O与CPU/GPU的I/O互连在速率和功耗方面
有较大优势。
器(Dynamic Random Access Memory,DRAM)与GPU/CPU/SoC互连。然而,微凸点的间距为约
40微米。这使得集成密度低的问题凸显,从而限制了I/O和带宽的进一步增长。第二,通过硅
通孔方式互连堆叠的存储裸片会产生较大寄生电容和热阻。这些较大的寄生参数会导致高
的传输延时以及高的功耗,限制了系统带宽和功耗的进一步升级。
发明内容
能计算系统及超算计算系统。另外,还可以通过纵向堆叠多层存储器晶圆或存储器芯片来
实现存储器容量和存储器带宽的扩展。
连接而控制所述计算核与所述至少一个存储体之间进行存储访问。
对应的第一三维集成端口的连接,实现所述计算核对相应存储体的访问。
接而对所述至少一个存储体进行测试和修复。
接,以实现存储访问,或者将所述测试和修复单元与所述第二三维集成端口连接,以实现测
试和修复。
元,所述路由单元被配置为将所述至少两个逻辑子单元连接;
逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核对相应目标访问地址
的访问。
的路由单元以及目标逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核
对所述目标逻辑子单元中的计算核的访问。
由单元、所述目标存储阵列所对应的逻辑子单元中的路由单元和第二三维集成端口与所述
目标存储阵列的存储体所对应的第一三维集成端口的连接,实现所述源逻辑子单元中的计
算核对所述目标存储阵列的存储体的访问。
述逻辑单元的工作电压转换成所述存储器单元的工作电压或者将所述存储器单元的工作
电压转换成所述逻辑单元的工作电压。
连接而控制所述计算核与所述至少一个存储体之间进行存储访问。
述访问指令获取访问地址;通过第二三维集成端口和至少一个第一三维集成端口的连接而
控制计算核与至少一个存储体之间进行存储访问。
附图说明
具体实施方式
成。
的存储器晶圆220(即,图2中上方的存储器晶圆220)首先通过混合键合技术(图2中示意性
示出为“ ”)连接至靠近逻辑晶圆210的存储器晶圆220(即,图2中下方的存储器晶圆220),
然后贯穿靠近逻辑晶圆210的存储器晶圆220(即,图2中下方的存储器晶圆220)的硅通孔
TSV 240(图2中示意性示出为“ ”)且之后经由靠近逻辑晶圆210的存储器晶圆220(即,图2
中下方的存储器晶圆220)通过混合键合技术(图2中示意性示出为“ ”)连接至逻辑晶圆
210。
经过一系列半导体制造工艺形成极微小的电路结构,再经切割、封装、测试成为芯片。本发
明不限于逻辑晶圆和存储器晶圆,实际上逻辑晶圆210也可以是逻辑芯片,存储器晶圆220
也可以是存储器芯片。优选地,存储器晶圆220可以为动态随机存取存储器晶圆或者动态随
机存取存储器芯片。
于4层、6层等。另外,在多层存储器晶圆的同一层中还可以设置多个存储器晶圆。例如,同一
层存储器晶圆层中设置两个存储器晶圆,两个存储器晶圆之间相互独立。
210的上方,另一存储器晶圆220设置于逻辑晶圆210的下方。由此,缩短了逻辑晶圆210至存
储器晶圆220之间的存储访问路径,提高了存储访问效率。
出为“ ”)连接至下方的存储器晶圆220,然后贯穿下方的存储器晶圆220的硅通孔TSV 240
(图3中示意性示出为“ ”)且之后通过凸点工艺连接至基板230。
括如图4中所示的逻辑单元以及如图5中所示的存储器单元,并且所述逻辑单元和存储器单
元之间堆叠集成,且优选地通过键合方式堆叠集成,或者更优选地通过混合键合方式堆叠
集成。
图中的两行“ ”示意性示出),这些三维异质集成端口区域 将逻辑单元与存储器单元
(例如,图5中所示的存储器单元)连接。在图4中,输入输出三维异质集成端口区域 (即,
混合键合的端口,通过图中的两行“ ”示意性示出)位于缓存模块460(两行“ ”所在的方
框)中。图4中仅为示意性的,输入输出三维异质集成端口区域也可以位于其他模块中。缓存
模块460被配置用于进行电压转换,用于在所述逻辑单元对存储器单元进行存储访问时,将
逻辑单元的工作电压转换成存储器单元的工作电压,或者将存储器单元的工作电压转换成
逻辑单元的工作电压。
中的两行“ ”示意性示出),这些三维异质集成端口区域 将逻辑单元(例如,图4中所
示的逻辑单元)与存储器单元连接。
质集成端口区域 (即,混合键合的端口,通过图中的两行“ ”示意性示出)。需要说明
的是,图5中存储器单元具有8个存储体(Memory Bank),每个存储体对应的存储空间为
128Mb且对应的数据位宽为128bits,且每个存储体对应有独立的三维异质集成端口区域,8
个存储体对应的三维异质集成端口区域分别为 。图4中逻辑单元的三维异质集成端
口区域 对应连接至图5中存储器单元的三维异质集成端口区域 ,也即是将图4中
逻辑单元与图5中存储器单元的8个存储体分别连接,由此能够实现逻辑单元对8个存储体
的存储访问。
发明不在此方面进行限定。
可以采用现有技术中已知的ECC算法来实现。另外,ECC单元的存储容量也不限于8Mb。ECC单
元的存储容量可以根据存储体的带宽和存储容量、所采用的ECC算法等而改变。
过逻辑单元的三维异质集成端口区域 与左上角的存储体对应的三维异质集成端口区域
所形成的物理连接端口对左上角的存储体进行访问。具体地,访问指令例如包括读取指
令以及写入指令。当访问指令为读取指令时,内存控制器420基于读取指令通过区域 与
区域 所形成的物理连接端口从左上角的存储体中读取数据。当访问指令为写入指令时,
访问指令同时还包括需要写入的数据,内存控制器420基于写入指令通过区域 与区域
所形成的物理连接端口将需要写入的数据写入左上角的存储体中。
通过逻辑单元的三维异质集成端口区域 与右上角的存储体对应的三维异质集成端口区
域 所形成的物理连接端口对右上角的存储体进行访问。具体地,访问指令例如包括读取
指令以及写入指令。当访问指令为读取指令时,内存控制器420基于读取指令通过区域 与
区域 所形成的物理连接端口从右上角的存储体中读取数据。当访问指令为写入指令时,
访问指令同时还包括需要写入的数据,内存控制器420基于写入指令通过区域 与区域
所形成的物理连接端口将需要写入的数据写入右上角的存储体中。
片能够进一步提高带宽和访问效率。
体。具体过程如上面所描述的。
维异质集成端口区域 之间的通路。此时,测试和修复单元440对存储器单元的每个存储体
进行测试和修复。例如,测试和修复单元440通过三维异质集成端口区域 和三维异质集成
端口区域 所形成的物理连接端口对存储器单元的左上角的存储体进行测试和修复;又
例如,测试和修复单元440通过三维异质集成端口区域 和三维异质集成端口区域 所形
成的物理连接端口对存储器单元的右上角的存储体进行测试和修复。
统。
系统。图6中的逻辑子单元可以由图4中的逻辑单元构成,图6中的存储器子单元可以由图5
中的存储器单元构成。通过位于逻辑子单元中的路由单元互连形成片上系统。
的一个逻辑子单元中的计算核还能够通过路由单元430来间接地访问另一逻辑子单元中的
计算核或者另一逻辑子单元所属的存储体。
为“第二逻辑子单元”)的存储器单元的存储体时,第一逻辑子单元的内存控制器基于访问
地址,通过第一逻辑子单元中的路由单元(以下称为“第一路由单元”)、第一行的中间逻辑
子单元(以下称为“中间逻辑子单元”)中的路由单元(以下称为“中间路由单元”)、第二逻辑
子单元中的路由单元(以下称为“第二路由单元”)所形成的访问路径,并且通过第二逻辑子
单元中的三维异质集成端口区域 与访问地址所对应的存储体的三维异质集成端口区域
所形成的物理连接端口,对访问地址所对应的存储体进行访问。
控制器基于访问地址,通过第一逻辑子单元中的第一路由单元、中间逻辑子单元中的中间
路由单元、第二逻辑子单元中的第二路由单元以及内存控制器所形成的访问路径,对第二
逻辑子单元中的计算核进行访问。
式能够实现更高密度的集成,所以有利于实现更高的存储器带宽;另外,由于本发明的高性
能计算系统具有更低的寄生参数(电容),所以能够实现更低的存储访问功耗。此外,由于存
储器晶圆也可以纵向多层堆叠,所以能够进一步实现存储器容量和存储器带宽的扩展。
所以高性能计算逻辑单元中的高性能计算核能够对其所属存储阵列中的不同存储体进行
独立的存储访问,不同存储体之间的存储访问过程互不干扰,能够显著提高访问带宽和访
问效率。
址,通过高性能逻辑单元的三维异质集成端口区域与右上角的存储体对应的三维异质集成
端口区域所形成的物理连接端口对右上角的存储体进行访问。又例如,当高性能计算核接
收到访问指令,并且访问指令所携带的访问地址为图5所示的存储器单元中左下角的存储
体时,高性能逻辑单元中的内存控制器基于访问地址,通过高性能逻辑单元的三维异质集
成端口区域与左下角的存储体对应的三维异质集成端口区域所形成的物理连接端口对左
下角的存储体进行访问。也就是说,由于右上角以及左下角的存储体各自具有对应的三维
异质集成端口区域,所以高性能计算核对右上角的存储体与左下角的存储体的存储访问可
以并行独立进行,能够大大提高访问带宽和访问效率。
够实现更高密度的集成,所以有利于实现更高的存储器带宽;另外,由于本发明的分布式超
算计算核提高了计算并行度,从而进一步提高了超算芯片的计算速度。
且缓存模块备被配置用于进行电压转换。通过缓存模块中的输入输出三维异质集成端口区
域与存储阵列中的输入输出三维异质集成端口区域的连接,内存控制器对超算逻辑单元所
属的存储阵列进行直接访问。
高速缓存器和数据高速缓存器中,则从指令高速缓存器和数据高速缓存器将访问结果返回
至超算计算核。如果访问指令和访问数据未存储在指令高速缓存器和数据高速缓存器中,
则内存控制器基于所述访问指令中所携带的访问地址,通过缓存模块中的输入输出三维异
质集成端口区域与存储阵列中的输入输出三维异质集成端口区域所形成的物理连接端口,
访问存储阵列且将访问结果返回至超算计算核。
缓存策略,将所述访问指令和所述访问数据写入指令高速缓存器和数据高速缓存器或者写
入存储阵列。在超算逻辑单元中,指令高速缓存器和数据高速缓存器的存在进一步提高了
计算速度。
算逻辑子单元中的超算计算核能够通过路由单元来间接地访问另一超算逻辑子单元中的
超算计算核或者另一超算逻辑子单元所属的存储体。
控制器基于访问地址,通过源超算逻辑子单元中的路由单元、一个或多个中间超算逻辑子
单元中的路由单元、目标超算逻辑子单元中的路由单元所形成的访问路径,并且通过目标
超算逻辑子单元中的三维异质集成端口区域与访问地址所对应的存储体的三维异质集成
端口区域所形成的物理连接端口,对访问地址所对应的存储体进行访问。
制器基于访问地址,通过源超算逻辑子单元中的路由单元、一个或多个中间超算逻辑子单
元中的中间路由单元、目标超算逻辑子单元中的路由单元以及内存控制器所形成的访问路
径,对目标超算逻辑子单元中的超算计算核进行访问。
属的存储阵列进行访问,显著提高了计算速度。
存储装置),以用于存储数据和/或计算机代码。三维集成芯片可以是或包括非瞬态易失性
存储器或非易失性存储器等。
过第二三维集成端口和至少一个第一三维集成端口的连接而控制计算核与至少一个存储
体之间进行存储访问。可以理解的,所述数据处理方法还包括上述三维集成芯片所能够实
现的功能,具体在此不再赘述。
权利要求限定。