三维集成芯片及其构建方法、数据处理方法、电子设备转让专利

申请号 : CN202111237509.4

文献号 : CN113674772B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周小锋

申请人 : 西安紫光国芯半导体有限公司

摘要 :

本发明涉及一种三维集成芯片及其构建方法、数据处理方法、电子设备。本发明涉及通过三维异质集成的逻辑晶圆或逻辑芯片以及存储器晶圆或存储器芯片所实现的高性能及超算计算系统,所述高性能及超算计算系统能够实现更高的存储器带宽、更低的存储器功耗以及更低的延迟,还可以通过纵向堆叠多层存储器晶圆来实现存储器容量和存储器带宽的扩展。

权利要求 :

1.一种三维集成芯片,其特征在于,所述三维集成芯片至少包括存储器单元以及逻辑单元,

所述存储器单元包括至少一个存储阵列和至少一个第一三维集成端口,其中:所述存储阵列包括至少一个存储体;

每个存储体对应一个第一三维集成端口;

所述逻辑单元包括至少一个逻辑子单元,所述逻辑子单元至少包括第二三维集成端口、至少一个计算核和内存控制器,其中:所述第二三维集成端口与所述至少一个第一三维集成端口连接,进而将所述存储器单元以及所述逻辑单元三维异质集成连接;

所述计算核被配置为对所述至少一个存储体进行访问,并且利用访问的数据实现对应的计算功能;

所述内存控制器与所述计算核连接且与所述第二三维集成端口选择性地连接,所述内存控制器被配置为经由所述第二三维集成端口和所述至少一个第一三维集成端口的连接而控制所述计算核与所述至少一个存储体之间进行存储访问;

其中,所述逻辑单元进一步包括:测试和修复单元,所述测试和修复单元与所述第二三维集成端口选择性地连接,所述测试和修复单元被配置为经由所述第二三维集成端口和所述第一三维集成端口的连接而对所述至少一个存储体进行测试和修复。

2.根据权利要求1所述的三维集成芯片,其特征在于,所述内存控制器基于从所述计算核所接收的访问指令中的访问地址,通过所述第二三维集成端口以及与所述访问地址所对应的第一三维集成端口的连接,实现所述计算核对相应存储体的访问。

3.根据权利要求1所述的三维集成芯片,其特征在于,所述逻辑单元还包括:多路选择开关,所述多路选择开关连接所述内存控制器以及所述测试和修复单元,所述多路选择开关被配置为选择性地将所述内存控制器与所述第二三维集成端口连接,以实现存储访问,或者将所述测试和修复单元与所述第二三维集成端口连接,以实现测试和修复。

4.根据权利要求1或2所述的三维集成芯片,其特征在于,所述三维集成芯片包括至少两个存储阵列以及至少两个逻辑子单元,并且所述逻辑子单元进一步包括至少一个路由单元,所述路由单元被配置为将所述至少两个逻辑子单元连接;

其中,源逻辑子单元中的路由单元被配置为基于从所述源逻辑子单元中的计算核所接收的访问指令中的目标访问地址,至少通过所述源逻辑子单元中的路由单元以及目标逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核对相应目标访问地址的访问。

5.根据权利要求4所述的三维集成芯片,其特征在于,所述目标访问地址为目标逻辑子单元中的计算核的地址,其中

所述源逻辑子单元中的路由单元被配置为基于从源逻辑子单元中的计算核所接收的访问指令中的所述目标逻辑子单元中的计算核的地址,至少通过所述源逻辑子单元中的路由单元以及目标逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核对所述目标逻辑子单元中的计算核的访问。

6.根据权利要求4所述的三维集成芯片,其特征在于,所述目标访问地址为目标存储阵列的存储体的地址,其中

所述源逻辑子单元中的路由单元被配置为基于从源逻辑子单元中的计算核所接收的访问指令中的所述目标存储阵列的存储体的地址,至少通过所述源逻辑子单元中的路由单元、所述目标存储阵列所对应的逻辑子单元中的路由单元和第二三维集成端口与所述目标存储阵列的存储体所对应的第一三维集成端口的连接,实现所述源逻辑子单元中的计算核对所述目标存储阵列的存储体的访问。

7.根据权利要求1或2所述的三维集成芯片,其特征在于,所述存储器单元还包括:至少一个纠错码ECC单元,其中所述至少一个存储体各自具有ECC单元,所述ECC单元被配置用于对每个存储体中所存储的数据进行检错和纠错。

8.根据权利要求1所述的三维集成芯片,其特征在于,所述逻辑子单元还包括:缓存模块,所述缓存模块被配置用于在所述逻辑单元对所述存储器单元进行存储访问时,将所述逻辑单元的工作电压转换成所述存储器单元的工作电压或者将所述存储器单元的工作电压转换成所述逻辑单元的工作电压。

9.根据权利要求1或2所述的三维集成芯片,其特征在于,所述逻辑单元为高性能计算逻辑单元或超算逻辑单元。

10.一种三维集成芯片的构建方法,其特征在于,所述三维集成芯片至少包括存储器单元以及逻辑单元,所述构建方法包括:构建所述存储器单元,所述存储器单元包括至少一个存储阵列和至少一个第一三维集成端口,其中:

所述存储阵列包括至少一个存储体;

每个存储体对应一个第一三维集成端口;

构建所述逻辑单元,所述逻辑单元包括至少一个逻辑子单元,所述逻辑子单元至少包括第二三维集成端口、至少一个计算核和内存控制器,其中:所述第二三维集成端口与所述至少一个第一三维集成端口连接;

所述计算核被配置为对所述至少一个存储体进行访问,并且利用访问的数据实现对应的计算功能;

所述内存控制器与所述计算核连接且与所述第二三维集成端口选择性地连接,所述内存控制器被配置为经由所述第二三维集成端口和所述至少一个第一三维集成端口的连接而控制所述计算核与所述至少一个存储体之间进行存储访问;

其中,所述逻辑单元进一步包括:测试和修复单元,所述测试和修复单元与所述第二三维集成端口选择性地连接,所述测试和修复单元被配置为经由所述第二三维集成端口和所述第一三维集成端口的连接而对所述至少一个存储体进行测试和修复。

11.一种电子设备,其特征在于,所述电子设备包括根据权利要求1‑9中的任一项所述的三维集成芯片。

12.一种三维集成芯片的数据处理方法,其特征在于,所述数据处理方法基于上述权利要求1‑9中的任一项所述的三维集成芯片,所述方法包括:从计算核接收访问指令,并基于所述访问指令获取访问地址;

通过第二三维集成端口和至少一个第一三维集成端口的连接而控制计算核与至少一个存储体之间进行存储访问。

说明书 :

三维集成芯片及其构建方法、数据处理方法、电子设备

技术领域

[0001] 本发明涉及存储器领域,尤其涉及三维集成(3D‑IC)的高性能计算(High Performance Computing,HPC)及超算计算系统领域。更具体地,本发明涉及三维集成芯片
及其构建方法、数据处理方法、电子设备。

背景技术

[0002] 已知现有技术中存在高带宽存储器(High Bandwidth Memory,HBM),这是一种新型的由堆叠存储技术实现的存储器。图1示出了现有技术中的高带宽存储器的系统结构图。
在高带宽存储器中,首先将存储裸片堆叠起来,然后利用硅通孔(Through Si Vias,TSV)将
这些堆叠的存储裸片连接在一起,从而以增加存储访问I/O和速率的方式提供更高带宽给
CPU/GPU。高带宽存储器标准以2.5D封装的形式实现,通过硅中介层(interposer)将高带宽
存储器的I/O与CPU/GPU的I/O互连。与传统存储器中通过PCB将存储器与CPU/GPU互连相比,
通过硅中介层(interposer)将高带宽存储器的I/O与CPU/GPU的I/O互连在速率和功耗方面
有较大优势。
[0003] 现有技术中的高带宽存储器技术方案主要有两个不足之处:第一,在高带宽存储器中,使用微凸点(micro‑bump)的重布线层(Redistribution Layer)将动态随机存取存储
器(Dynamic Random Access Memory,DRAM)与GPU/CPU/SoC互连。然而,微凸点的间距为约
40微米。这使得集成密度低的问题凸显,从而限制了I/O和带宽的进一步增长。第二,通过硅
通孔方式互连堆叠的存储裸片会产生较大寄生电容和热阻。这些较大的寄生参数会导致高
的传输延时以及高的功耗,限制了系统带宽和功耗的进一步升级。
[0004] 因此,亟需解决现有技术中的上述技术问题。

发明内容

[0005] 本发明涉及能实现更高的存储器带宽、更低的存储器功耗以及更低的访问延迟的系统。通过三维异质集成的逻辑晶圆或逻辑芯片以及存储器晶圆或存储器芯片来实现高性
能计算系统及超算计算系统。另外,还可以通过纵向堆叠多层存储器晶圆或存储器芯片来
实现存储器容量和存储器带宽的扩展。
[0006] 根据本发明的第一方面,提供了一种三维集成芯片,所述三维集成芯片至少包括存储器单元以及逻辑单元,
[0007] 所述存储器单元包括至少一个存储阵列和至少一个第一三维集成端口,其中:
[0008] 所述存储阵列包括至少一个存储体;
[0009] 每个存储体对应一个第一三维集成端口;
[0010] 所述逻辑单元包括至少一个逻辑子单元,所述逻辑子单元至少包括第二三维集成端口、至少一个计算核和内存控制器,其中:
[0011] 所述第二三维集成端口与所述至少一个第一三维集成端口连接,进而将所述存储器单元以及所述逻辑单元三维异质集成连接;
[0012] 所述计算核被配置为对所述至少一个存储体进行访问,并且利用访问的数据实现对应的计算功能;
[0013] 所述内存控制器与所述计算核连接且与所述第二三维集成端口选择性地连接,所述内存控制器被配置为经由所述第二三维集成端口和所述至少一个第一三维集成端口的
连接而控制所述计算核与所述至少一个存储体之间进行存储访问。
[0014] 根据本发明的三维集成芯片的一个优选实施方案,所述内存控制器基于从所述计算核所接收的访问指令中的访问地址,通过所述第二三维集成端口以及与所述访问地址所
对应的第一三维集成端口的连接,实现所述计算核对相应存储体的访问。
[0015] 根据本发明的三维集成芯片的一个优选实施方案,所述逻辑单元进一步包括:
[0016] 测试和修复单元,所述测试和修复单元与所述第二三维集成端口选择性地连接,所述测试和修复单元被配置为经由所述第二三维集成端口和所述第一三维集成端口的连
接而对所述至少一个存储体进行测试和修复。
[0017] 根据本发明的三维集成芯片的一个优选实施方案,所述逻辑单元还包括:
[0018] 多路选择开关,所述多路选择开关连接所述内存控制器以及所述测试和修复单元,所述多路选择开关被配置为选择性地将所述内存控制器与所述第二三维集成端口连
接,以实现存储访问,或者将所述测试和修复单元与所述第二三维集成端口连接,以实现测
试和修复。
[0019] 根据本发明的三维集成芯片的一个优选实施方案,所述三维集成芯片包括至少两个存储阵列以及至少两个逻辑子单元,并且所述逻辑子单元进一步包括至少一个路由单
元,所述路由单元被配置为将所述至少两个逻辑子单元连接;
[0020] 其中,源逻辑子单元中的路由单元被配置为基于从所述源逻辑子单元中的计算核所接收的访问指令中的目标访问地址,至少通过所述源逻辑子单元中的路由单元以及目标
逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核对相应目标访问地址
的访问。
[0021] 根据本发明的三维集成芯片的一个优选实施方案,所述目标访问地址为目标逻辑子单元中的计算核的地址,其中
[0022] 所述源逻辑子单元中的路由单元被配置为基于从源逻辑子单元中的计算核所接收的访问指令中的所述目标逻辑子单元中的计算核的地址,至少通过所述源逻辑子单元中
的路由单元以及目标逻辑子单元中的路由单元的连接,实现所述源逻辑子单元中的计算核
对所述目标逻辑子单元中的计算核的访问。
[0023] 根据本发明的三维集成芯片的一个优选实施方案,所述目标访问地址为目标存储阵列的存储体的地址,其中
[0024] 所述源逻辑子单元中的路由单元被配置为基于从源逻辑子单元中的计算核所接收的访问指令中的所述目标存储阵列的存储体的地址,至少通过所述源逻辑子单元中的路
由单元、所述目标存储阵列所对应的逻辑子单元中的路由单元和第二三维集成端口与所述
目标存储阵列的存储体所对应的第一三维集成端口的连接,实现所述源逻辑子单元中的计
算核对所述目标存储阵列的存储体的访问。
[0025] 根据本发明的三维集成芯片的一个优选实施方案,所述存储器单元还包括:
[0026] 至少一个纠错码ECC单元,其中所述至少一个存储体各自具有ECC单元,所述ECC单元被配置用于对每个存储体中所存储的数据进行检错和纠错。
[0027] 根据本发明的三维集成芯片的一个优选实施方案,所述逻辑子单元还包括:缓存模块,所述缓存模块被配置用于在所述逻辑单元对所述存储器单元进行存储访问时,将所
述逻辑单元的工作电压转换成所述存储器单元的工作电压或者将所述存储器单元的工作
电压转换成所述逻辑单元的工作电压。
[0028] 根据本发明的三维集成芯片的一个优选实施方案,所述逻辑单元为高性能计算逻辑单元或超算逻辑单元。
[0029] 根据本发明的第二方面,提供了一种三维集成芯片的构建方法,所述三维集成芯片至少包括存储器单元以及逻辑单元,所述构建方法包括:
[0030] 构建所述存储器单元,所述存储器单元包括至少一个存储阵列和至少一个第一三维集成端口,其中:
[0031] 所述存储阵列包括至少一个存储体;
[0032] 每个存储体对应一个第一三维集成端口;
[0033] 构建所述逻辑单元,所述逻辑单元包括至少一个逻辑子单元,所述逻辑子单元至少包括第二三维集成端口、至少一个计算核和内存控制器,其中:
[0034] 所述第二三维集成端口与所述至少一个第一三维集成端口连接;
[0035] 所述计算核被配置为对所述至少一个存储体进行访问,并且利用访问的数据实现对应的计算功能;
[0036] 所述内存控制器与所述计算核连接且与所述第二三维集成端口选择性地连接,所述内存控制器被配置为经由所述第二三维集成端口和所述至少一个第一三维集成端口的
连接而控制所述计算核与所述至少一个存储体之间进行存储访问。
[0037] 根据本发明的第三方面,提供了一种电子设备,所述电子设备包括根据本发明的第一方面所述的三维集成芯片。
[0038] 根据本发明的第四方面,提供一种三维集成芯片的数据处理方法,所述数据处理方法基于第一方面提供的三维集成芯片,所述方法包括:从计算核接收访问指令,并基于所
述访问指令获取访问地址;通过第二三维集成端口和至少一个第一三维集成端口的连接而
控制计算核与至少一个存储体之间进行存储访问。

附图说明

[0039] 通过下文结合对附图的说明,将更容易理解本发明,在附图中:
[0040] 图1示出了现有技术中的高带宽存储器的系统结构图。
[0041] 图2示意性示出了根据本发明的三维集成芯片的一个实施例。
[0042] 图3示意性示出了根据本发明的三维集成芯片的另一实施例。
[0043] 图4示意性示出了根据本发明的三维集成芯片的逻辑单元的实施例。
[0044] 图5示意性示出了本发明中所使用的典型的存储器单元。
[0045] 图6示意性示出了根据本发明的存储器网络的一个实施例。

具体实施方式

[0046] 下面将结合附图来对本发明的实施方案进行进一步详述。
[0047] 图2示意性示出了根据本发明的三维集成芯片的一个实施例。
[0048] 图2所示的三维集成芯片包括一个逻辑晶圆210和两个存储器晶圆220。逻辑晶圆210是用于实现逻辑功能的晶圆,存储器晶圆220是用于实现存储器功能的晶圆。
[0049] 如图2中所示,逻辑晶圆210、两个存储器晶圆220在竖向方向上堆叠集成。此处的“竖向方向”指的是逻辑晶圆210、存储器晶圆220的厚度方向。
[0050] 另外,相邻的两个存储器晶圆220、相邻的存储器晶圆220和逻辑晶圆210之间通过三维异质集成的方式键合连接,以实现逻辑晶圆210与两个存储器晶圆220的三维异质集
成。
[0051] 具体而言,靠近逻辑晶圆210的存储器晶圆220(即,图2中下方的存储器晶圆220)通过混合键合技术(图2中示意性示出为“ ”)直接连接至逻辑晶圆210;而远离逻辑晶圆210
的存储器晶圆220(即,图2中上方的存储器晶圆220)首先通过混合键合技术(图2中示意性
示出为“ ”)连接至靠近逻辑晶圆210的存储器晶圆220(即,图2中下方的存储器晶圆220),
然后贯穿靠近逻辑晶圆210的存储器晶圆220(即,图2中下方的存储器晶圆220)的硅通孔
TSV 240(图2中示意性示出为“ ”)且之后经由靠近逻辑晶圆210的存储器晶圆220(即,图2
中下方的存储器晶圆220)通过混合键合技术(图2中示意性示出为“ ”)连接至逻辑晶圆
210。
[0052] 由此,逻辑晶圆210能够实现对图2中上方的存储器晶圆220和下方的存储器晶圆220的独立存储访问。
[0053] 从图2中还可看到,逻辑晶圆210通过凸点(Bump)工艺被连接至基板230。凸点工艺包括但不限于现有技术中已知的BOPCOA、BOAC、HOTROD。
[0054] 另外,在图2中结合逻辑晶圆和存储器晶圆进行了描述。已知的是,晶圆是制造半导体器件的基础性原材料,极高纯度的半导体经过拉晶、切片等工艺被制备成为晶圆。晶圆
经过一系列半导体制造工艺形成极微小的电路结构,再经切割、封装、测试成为芯片。本发
明不限于逻辑晶圆和存储器晶圆,实际上逻辑晶圆210也可以是逻辑芯片,存储器晶圆220
也可以是存储器芯片。优选地,存储器晶圆220可以为动态随机存取存储器晶圆或者动态随
机存取存储器芯片。
[0055] 图2中示出的是两个存储器晶圆220,这两个存储器晶圆220分别构成了两层存储器晶圆。应理解,为了满足带宽和存储容量需求,存储器晶圆220可以是更多层,包括但不限
于4层、6层等。另外,在多层存储器晶圆的同一层中还可以设置多个存储器晶圆。例如,同一
层存储器晶圆层中设置两个存储器晶圆,两个存储器晶圆之间相互独立。
[0056] 此外,多层存储器晶圆可以分别设置于逻辑晶圆的两侧。图3以两个存储器晶圆220为例,示意性示出了这种实施方案。如图3中所示,一个存储器晶圆220设置于逻辑晶圆
210的上方,另一存储器晶圆220设置于逻辑晶圆210的下方。由此,缩短了逻辑晶圆210至存
储器晶圆220之间的存储访问路径,提高了存储访问效率。
[0057] 具体而言,逻辑晶圆210两侧的存储器晶圆220通过混合键合技术(图3中示意性示出为“ ”)直接连接至逻辑晶圆210;而逻辑晶圆210首先通过混合键合技术(图3中示意性示
出为“ ”)连接至下方的存储器晶圆220,然后贯穿下方的存储器晶圆220的硅通孔TSV 240
(图3中示意性示出为“ ”)且之后通过凸点工艺连接至基板230。
[0058] 图4示意性示出了根据本发明的三维集成芯片的逻辑单元的实施例。图5示意性示出了本发明中所使用的典型的存储器单元(即,存储阵列)。本发明的三维集成芯片至少包
括如图4中所示的逻辑单元以及如图5中所示的存储器单元,并且所述逻辑单元和存储器单
元之间堆叠集成,且优选地通过键合方式堆叠集成,或者更优选地通过混合键合方式堆叠
集成。
[0059] 如图4中所示,逻辑单元至少包括计算核410以及与计算核410连接的内存控制器420。另外,逻辑单元还包括输入输出三维异质集成端口区域 (即,混合键合的端口,通过
图中的两行“ ”示意性示出),这些三维异质集成端口区域 将逻辑单元与存储器单元
(例如,图5中所示的存储器单元)连接。在图4中,输入输出三维异质集成端口区域 (即,
混合键合的端口,通过图中的两行“ ”示意性示出)位于缓存模块460(两行“ ”所在的方
框)中。图4中仅为示意性的,输入输出三维异质集成端口区域也可以位于其他模块中。缓存
模块460被配置用于进行电压转换,用于在所述逻辑单元对存储器单元进行存储访问时,将
逻辑单元的工作电压转换成存储器单元的工作电压,或者将存储器单元的工作电压转换成
逻辑单元的工作电压。
[0060] 如图5中所示,示意性示出了本发明中所使用的典型的存储器单元。图5中示出的存储器单元也包括输入输出三维异质集成端口区域 (即,混合键合的端口,也通过图
中的两行“ ”示意性示出),这些三维异质集成端口区域 将逻辑单元(例如,图4中所
示的逻辑单元)与存储器单元连接。
[0061] 针对图4中的逻辑单元与图5中的存储器单元,逻辑单元的三维异质集成端口区域(即,混合键合的端口,通过图中的两行“ ”示意性示出)对应连接存储器单元的三维异
质集成端口区域 (即,混合键合的端口,通过图中的两行“ ”示意性示出)。需要说明
的是,图5中存储器单元具有8个存储体(Memory Bank),每个存储体对应的存储空间为
128Mb且对应的数据位宽为128bits,且每个存储体对应有独立的三维异质集成端口区域,8
个存储体对应的三维异质集成端口区域分别为 。图4中逻辑单元的三维异质集成端
口区域 对应连接至图5中存储器单元的三维异质集成端口区域 ,也即是将图4中
逻辑单元与图5中存储器单元的8个存储体分别连接,由此能够实现逻辑单元对8个存储体
的存储访问。
[0062] 另外,图5中示出的是8个存储体。应理解,为了满足带宽和存储容量需求,存储器单元中的存储体还可以为16个、32个等,每个存储体的存储空间还可以为64Mb、32Mb等。本
发明不在此方面进行限定。
[0063] 此外,图5中还示出了每个存储体包括容量为8Mb的纠错码ECC单元。这些ECC单元用于存储额外的校验位,从而对每个存储体中所存储的数据进行检错和纠错。这些ECC单元
可以采用现有技术中已知的ECC算法来实现。另外,ECC单元的存储容量也不限于8Mb。ECC单
元的存储容量可以根据存储体的带宽和存储容量、所采用的ECC算法等而改变。
[0064] 返回参考图4, 在三维集成芯片的正常工作模式下,逻辑单元中的计算核410能够直接访问通过其三维异质集成端口区域 所连接的存储体。
[0065] 例如,当计算核410接收到访问指令,并且访问指令所携带的访问地址为图5所示的存储器单元中左上角的存储空间为128Mb的存储体时,内存控制器420基于访问地址,通
过逻辑单元的三维异质集成端口区域 与左上角的存储体对应的三维异质集成端口区域
所形成的物理连接端口对左上角的存储体进行访问。具体地,访问指令例如包括读取指
令以及写入指令。当访问指令为读取指令时,内存控制器420基于读取指令通过区域 与
区域 所形成的物理连接端口从左上角的存储体中读取数据。当访问指令为写入指令时,
访问指令同时还包括需要写入的数据,内存控制器420基于写入指令通过区域 与区域
所形成的物理连接端口将需要写入的数据写入左上角的存储体中。
[0066] 又例如,当计算核410接收到访问指令,并且访问指令所携带的访问地址为图5所示的存储器单元中右上角的存储空间为128Mb的存储体时,内存控制器420基于访问地址,
通过逻辑单元的三维异质集成端口区域 与右上角的存储体对应的三维异质集成端口区
域 所形成的物理连接端口对右上角的存储体进行访问。具体地,访问指令例如包括读取
指令以及写入指令。当访问指令为读取指令时,内存控制器420基于读取指令通过区域 与
区域 所形成的物理连接端口从右上角的存储体中读取数据。当访问指令为写入指令时,
访问指令同时还包括需要写入的数据,内存控制器420基于写入指令通过区域 与区域
所形成的物理连接端口将需要写入的数据写入右上角的存储体中。
[0067] 因此,在本发明的三维集成芯片中,逻辑单元能够对存储器单元的不同存储体进行独立的存储访问,不同存储体之间的存储访问过程互不干扰。因而,本发明的三维集成芯
片能够进一步提高带宽和访问效率。
[0068] 另外,如图4中所示,逻辑单元还包括用于对至少一个存储器单元进行测试和修复的测试和修复单元440。另外,逻辑单元还包括多路选择开关450。
[0069] 在三维集成芯片的正常工作模式下,多路选择开关450将计算核410、内存控制器420、三维异质集成端口区域 连接,从而直接访问至少一个存储器单元的至少一个存储
体。具体过程如上面所描述的。
[0070] 在三维集成芯片的测试工作模式下,多路选择开关450将测试和修复单元440与三维异质集成端口区域 连接,以测试和修复至少一个存储器单元的至少一个存储体。
[0071] 具体而言,在需要对存储器进行测试和修复时,多路选择开关450关断计算核410、内存控制器420至三维异质集成端口区域 之间的通路,并且导通测试和修复单元440至三
维异质集成端口区域 之间的通路。此时,测试和修复单元440对存储器单元的每个存储体
进行测试和修复。例如,测试和修复单元440通过三维异质集成端口区域 和三维异质集成
端口区域 所形成的物理连接端口对存储器单元的左上角的存储体进行测试和修复;又
例如,测试和修复单元440通过三维异质集成端口区域 和三维异质集成端口区域 所形
成的物理连接端口对存储器单元的右上角的存储体进行测试和修复。
[0072] 另外,如图4中所示,逻辑单元还包括路由单元430,路由单元430连接多路选择开关450以及三维异质集成端口区域 。路由单元430用于将多个存储器互连,以形成片上系
统。
[0073] 图6示意性示出了根据本发明的存储器网络(即,片上系统)的一个实施例。图6中所示出的片上系统是多个逻辑子单元和多个存储器子单元经由路由单元集成得到的片上
系统。图6中的逻辑子单元可以由图4中的逻辑单元构成,图6中的存储器子单元可以由图5
中的存储器单元构成。通过位于逻辑子单元中的路由单元互连形成片上系统。
[0074] 上面针对图4和图5讨论了逻辑单元中的计算核410能够直接访问通过其三维异质集成端口区域所连接的存储体。在形成图6中所示出的片上系统的情况下,三维集成芯片中
的一个逻辑子单元中的计算核还能够通过路由单元430来间接地访问另一逻辑子单元中的
计算核或者另一逻辑子单元所属的存储体。
[0075] 例如,当图6所示左上角的逻辑子单元(以下称为“第一逻辑子单元”)中的计算核接收到访问指令,并且访问指令所携带的访问地址为图6所示右上角的逻辑子单元(以下称
为“第二逻辑子单元”)的存储器单元的存储体时,第一逻辑子单元的内存控制器基于访问
地址,通过第一逻辑子单元中的路由单元(以下称为“第一路由单元”)、第一行的中间逻辑
子单元(以下称为“中间逻辑子单元”)中的路由单元(以下称为“中间路由单元”)、第二逻辑
子单元中的路由单元(以下称为“第二路由单元”)所形成的访问路径,并且通过第二逻辑子
单元中的三维异质集成端口区域 与访问地址所对应的存储体的三维异质集成端口区域
所形成的物理连接端口,对访问地址所对应的存储体进行访问。
[0076] 又例如,当图6所示的第一逻辑子单元中的计算核接收到访问指令,并且访问指令所携带的访问地址为图6所示的第二逻辑子单元中的计算核时,第一逻辑子单元中的内存
控制器基于访问地址,通过第一逻辑子单元中的第一路由单元、中间逻辑子单元中的中间
路由单元、第二逻辑子单元中的第二路由单元以及内存控制器所形成的访问路径,对第二
逻辑子单元中的计算核进行访问。
[0077] 图6中仅示意性示出了网状拓扑结构的存储器网络。本发明的存储器网络包括但不限于总线型、星型、环型、树型、网状和混合型拓扑结构。
[0078] 本发明的应用可以包括但不限于高性能计算系统、超算系统等。
[0079] 当逻辑晶圆210为高性能计算逻辑晶圆时,所获得的对应三维集成芯片为三维集成高性能计算芯片。
[0080] 现有技术中,高性能计算系统的性能受到存储器带宽和功耗的限制。然而,在本发明中,由于高性能计算逻辑晶圆和存储器晶圆通过混合键合方式堆叠集成,而混合键合方
式能够实现更高密度的集成,所以有利于实现更高的存储器带宽;另外,由于本发明的高性
能计算系统具有更低的寄生参数(电容),所以能够实现更低的存储访问功耗。此外,由于存
储器晶圆也可以纵向多层堆叠,所以能够进一步实现存储器容量和存储器带宽的扩展。
[0081] 由此,本发明所获得的三维集成芯片能够实现更高的存储器带宽、存储器容量以及更低的存储访问功耗,能够满足高性能计算系统的需求。
[0082] 另外,由于高性能计算逻辑单元的三维异质集成端口区域所连接的存储阵列(即,高性能计算核所属的存储阵列)中的不同存储体各自具有对应的三维异质集成端口区域,
所以高性能计算逻辑单元中的高性能计算核能够对其所属存储阵列中的不同存储体进行
独立的存储访问,不同存储体之间的存储访问过程互不干扰,能够显著提高访问带宽和访
问效率。
[0083] 例如,当高性能计算核接收到访问指令,并且访问指令所携带的访问地址为诸如图5所示的存储器单元中右上角的存储体时,高性能逻辑单元中的内存控制器基于访问地
址,通过高性能逻辑单元的三维异质集成端口区域与右上角的存储体对应的三维异质集成
端口区域所形成的物理连接端口对右上角的存储体进行访问。又例如,当高性能计算核接
收到访问指令,并且访问指令所携带的访问地址为图5所示的存储器单元中左下角的存储
体时,高性能逻辑单元中的内存控制器基于访问地址,通过高性能逻辑单元的三维异质集
成端口区域与左下角的存储体对应的三维异质集成端口区域所形成的物理连接端口对左
下角的存储体进行访问。也就是说,由于右上角以及左下角的存储体各自具有对应的三维
异质集成端口区域,所以高性能计算核对右上角的存储体与左下角的存储体的存储访问可
以并行独立进行,能够大大提高访问带宽和访问效率。
[0084] 当逻辑晶圆210为超算逻辑晶圆时,所获得的对应三维集成芯片为三维集成超算芯片。
[0085] 现有技术中,超算计算系统的性能受到存储器带宽和访问延迟的限制。然而,在本发明中,由于超算逻辑晶圆和存储器晶圆通过混合键合方式堆叠集成,而混合键合方式能
够实现更高密度的集成,所以有利于实现更高的存储器带宽;另外,由于本发明的分布式超
算计算核提高了计算并行度,从而进一步提高了超算芯片的计算速度。
[0086] 超算逻辑单元包括超算计算核、指令高速缓存器、数据高速缓存器、内存控制器和缓存模块。类似于上面所描述的,在缓存模块中会存在输入输出三维异质集成端口区域,并
且缓存模块备被配置用于进行电压转换。通过缓存模块中的输入输出三维异质集成端口区
域与存储阵列中的输入输出三维异质集成端口区域的连接,内存控制器对超算逻辑单元所
属的存储阵列进行直接访问。
[0087] 例如,当超算计算核接收到访问指令时,超算计算核首选确定访问指令和访问数据是否存储在指令高速缓存器和数据高速缓存器中。如果访问指令和访问数据存储在指令
高速缓存器和数据高速缓存器中,则从指令高速缓存器和数据高速缓存器将访问结果返回
至超算计算核。如果访问指令和访问数据未存储在指令高速缓存器和数据高速缓存器中,
则内存控制器基于所述访问指令中所携带的访问地址,通过缓存模块中的输入输出三维异
质集成端口区域与存储阵列中的输入输出三维异质集成端口区域所形成的物理连接端口,
访问存储阵列且将访问结果返回至超算计算核。
[0088] 在超算逻辑单元中,指令高速缓存器和数据高速缓存器的缓存策略是根据超算计算核访问频率或者写入时间先后顺序来制定的。根据指令高速缓存器和数据高速缓存器的
缓存策略,将所述访问指令和所述访问数据写入指令高速缓存器和数据高速缓存器或者写
入存储阵列。在超算逻辑单元中,指令高速缓存器和数据高速缓存器的存在进一步提高了
计算速度。
[0089] 另外,在以类似于图6中所示的方式形成三维集成超算芯片的情况下,上述的超算逻辑单元可以形成三维集成超算芯片的超算逻辑子单元。类似于关于图6所描述的,一个超
算逻辑子单元中的超算计算核能够通过路由单元来间接地访问另一超算逻辑子单元中的
超算计算核或者另一超算逻辑子单元所属的存储体。
[0090] 例如,当源超算逻辑子单元中的超算计算核接收到访问指令,并且访问指令所携带的访问地址为目标超算逻辑子单元的存储器单元的存储体时,源超算逻辑子单元的内存
控制器基于访问地址,通过源超算逻辑子单元中的路由单元、一个或多个中间超算逻辑子
单元中的路由单元、目标超算逻辑子单元中的路由单元所形成的访问路径,并且通过目标
超算逻辑子单元中的三维异质集成端口区域与访问地址所对应的存储体的三维异质集成
端口区域所形成的物理连接端口,对访问地址所对应的存储体进行访问。
[0091] 又例如,当源超算逻辑子单元中的超算计算核接收到访问指令,并且访问指令所携带的访问地址为目标超算逻辑子单元中的超算计算核时,源超算逻辑子单元中的内存控
制器基于访问地址,通过源超算逻辑子单元中的路由单元、一个或多个中间超算逻辑子单
元中的中间路由单元、目标超算逻辑子单元中的路由单元以及内存控制器所形成的访问路
径,对目标超算逻辑子单元中的超算计算核进行访问。
[0092] 通过以类似于图6中所示的方式形成超算片上系统,各个超算核以上述方式对其所述的存储阵列独立访问以及独立计算,或者经由路由单元对另外的超算核或者超算核所
属的存储阵列进行访问,显著提高了计算速度。
[0093] 本发明中所提出的三维集成芯片是存储芯片或存储晶圆(例如,ROM、SDRAM、RAM、DRAM、SRAM、FLASH、EPROM、EEPROM、CD‑ROM或其他光盘存储装置、磁盘存储装置或其他磁性
存储装置),以用于存储数据和/或计算机代码。三维集成芯片可以是或包括非瞬态易失性
存储器或非易失性存储器等。
[0094] 本发明还提出一种数据处理方法,数据处理方法基于上述任一实施例所述的三维集成芯片,所述方法包括:从计算核接收访问指令,并基于所述访问指令获取访问地址;通
过第二三维集成端口和至少一个第一三维集成端口的连接而控制计算核与至少一个存储
体之间进行存储访问。可以理解的,所述数据处理方法还包括上述三维集成芯片所能够实
现的功能,具体在此不再赘述。
[0095] 应注意,上文所提及的实施方案例示而非限制本发明,且在不脱离所附权利要求的范围的前提下,本领域技术人员将能够设计许多替代实施方案。应理解,本发明的范围由
权利要求限定。