宽带信号多天线合成方法转让专利

申请号 : CN202210327683.6

文献号 : CN114928388B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 毛飞龙马宏焦义文吴涛李冬高泽夫李超滕飞卢志伟陈雨迪周扬

申请人 : 中国人民解放军战略支援部队航天工程大学

摘要 :

本发明提出一种基于GPU的多操作队列并发架构的宽带信号多天线合成方法,以GPU操作队列并发作为并行基础,每一个操作队列用于处理天线子带的一个数据块,以多操作队列并发实现天线信号与参考天线信号快速互相关求相位差;同时,多个GPU并发同时处理各个子带的数据,与传统的宽带信号多天线合成方法相比,本发明实时性和并行性更好;本发明的多操作队列并发方法不仅可以对计算模块进行加速,还可以较好地隐藏数据在主机与设备端或设备端之间传输所耗费的时间,并行性更好,实时性更佳;可实现对多天线、多子带、多数据块的并行处理;与传统基于多天线信号合成方法相比,本发明精度更高、实时性更好,扩展性更强。

权利要求 :

1.一种宽带信号多天线合成方法,其特征在于,包括:

第一步:获得并行的L路天线信号;其中,L为天线数量;

第二步:将L路并行的天线信号发给空闲的GPU,利用多个线程并行的方式将每路天线信号进行子带拆分操作,拆分为中心频率不同的多个子带信号数据,设子带数量为N;

第三步:将L个天线中的参考天线的N个子带信号数据一一对应发送至N个GPU中,设为GPU1‑GPUN;在该N个GPU的每个GPU中,将L个天线的子带拆成M个数据块,利用多个操作队列并发的方式,对M个数据块分别进行复制,将非参考天线与参考天线对应子带、对应数据块进行互相关运算,求得相位差;针对每个GPU中的子带信号数据,得到L‑1个非参考天线对应的M个相位差结果;

第五步:对每个子带得到的所述M个相位差结果进行拟合,拟合曲线的截距即为子带的相位差的取值,之后用该相位差对各子带数据进行相位补偿,待所有子带相位补偿完成之后,将各天线的对应子带信号数据进行相加;

第六步:将第五步中每个GPU得到的子带信号数据进行重构,得到和原始信号带宽相同的信号,实现合成。

2.如权利要求1所述的一种宽带信号多天线合成方法,其特征在于,所述第一步中,天线信号的模拟数据经过幅度调节后再进行采样,之后将采样后的数据进行串并变换,得到并行的L路天线信号。

3.如权利要求1所述的一种宽带信号多天线合成方法,其特征在于,所述第一步在主机端进行。

4.如权利要求1所述的一种宽带信号多天线合成方法,其特征在于,所述第二步中将L路并行的天线信号通过DDS中间件技术发给空闲的GPU。

说明书 :

宽带信号多天线合成方法

技术领域

[0001] 本发明属于通信技术领域,具体涉及一种基于GPU的多操作队列并发架构的宽带信号多天线合成方法,适用于通信系统中对卫星或其他航天器发送的宽带信号通过多天线进行接收合成。

背景技术

[0002] 表1为主流卫星互联网星座和高通量卫星的下行信号参数对比,StarLink和OneWeb星座的下行信号带宽为250MHz,传输速率达到了600Mbit/s,ViaSat‑1与终端的下行信号带宽为500MHz,传输速率也达到了550Mbit/s。可见,主流宽带卫星的下行信号带宽已达到 250‑500MHz水平。参照超宽带信号的概念,定义带宽为20~500MHz的信号为宽带信号。
[0003] 表1卫星互联网星座和GEO‑HTS参数对比
[0004]
[0005] 宽带卫星的通信与数传业务为地面接收设备带来了前所未有的挑战。目前卫星地面站通常采用大口径抛物面天线进行数传业务,口径一般在4m‑12m。我国遥感卫星的数据接收站的数据接收码速率达到2×1200Mbps(X频段)和4×1.5Gbps(Ka频段)。但大口径天线应用于实际中存在以下几个缺点:(1)机动性、隐蔽性、抗毁性较差。(2)数传业务Ka等频段频率高,波束宽度窄(以12m口径天线为例,S频段的半功率波束宽度为0.79°,而Ka频段的半功率波束宽度仅为0.065°),如何可靠实现Ka频段卫星数据的高动态捕获与跟踪,也对地面站的数据接收技术能力提出很高的要求。(3)卫星距离地面较远,信号在传输过程中会受到自由损耗和噪声的干扰,导致天线接收到的信号信噪比(Signal‑to‑Noise Ratio,SNR) 较低,直接影响信号的后端处理。因此,迫切需要寻求一种宽带卫星信号接收方式:具有机动性强、隐蔽性好、接收信噪比高的优点。
[0006] 借鉴深空天线组阵技术,将多个小口径天线构成组阵,接收同一颗卫星信号,并利用信号的相关性和噪声的不相关性,对各路信号加权合成,从而实现对宽带卫星信号的高质量接收。但利用多个小口径天线加权合成提高宽带信号的接收信噪比,势必会引入以下两个问题:天线数量多导致算法复杂度倍增、传统信号处理平台依靠专用硬件与固件,软硬件紧密耦合,设备灵活性与扩展性不高,难以进行数据融合处理。
[0007] 由此可见多天线信号合成系统的算法复杂度高、并行程度高。多天线信号合成系统总体所需的计算能力超出了普通多核中央处理器(Central Processing Unit,CPU)所能够承受的范围。同时,传统的硬件处理平台也制约了多天线信号合成系统的发展。近年来,随着高性能计算技术的发展,图形处理器(Graphic Processing Unit,GPU)从专用于图像领域的处理器逐渐向着通用并行计算平台转变。GPU的运算核心数远多于CPU,更适合于数据密集型计算的并行加速处理。NVIDIA于2007年推出了计算统一设备架构(Compute Unified Device Architecture,CUDA),简化了GPU系统的开发流程,使得GPU通用计算技术在信号处理领域得到更为广泛的应用。因此,在通用硬件处理平台下,采用软件的方法进行宽带卫星信号合成是一种较好的途径。
[0008] 在多天线信号合成系统中,面对高复杂度的信号处理任务,实时性是关键问题。因此,需要针对信号实时处理难点问题,结合虚拟化技术、并行计算技术,研究新的系统体系结构与实时处理技术。
[0009] 现有的宽带信号合成主要是频域全频谱合成方法,如图1所示,其主要思想是:首先对宽带信号进行降速,利用信道化、分析滤波器、FFT等技术将宽带信号拆成子带。然后利用相位差估计算法得到不同天线子带间的相位差,进而估计出宽带信号间的残余时延和相位,之后对子带独立进行相位补偿并对各天线子带进行合成,最后对各天线合成后的子带进行重构,得到原始的宽带合成信号。
[0010] 现有的宽带信号多天线合成方法的不足主要体现在以下几个方面:
[0011] (1)天线数量多、信号频带宽导致算法复杂度倍增,传统的FPGA硬件平台难以满足计算量大且成本低的需求;
[0012] (2)传统信号处理平台依靠专用硬件与固件,软硬件紧密耦合,设备灵活性与扩展性不高,硬件资源不可分割和按需分配。

发明内容

[0013] 有鉴于此,本发明的目的是提供一种基于GPU的多操作队列并发架构的宽带信号多天线合成方法,可以提高实时性。
[0014] 一种宽带信号多天线合成方法,包括:
[0015] 第一步:获得并行的L路天线信号;其中,L为天线数量;
[0016] 第二步:将L路并行的天线信号发给空闲的GPU,利用多个线程并行的方式将每路天线信号进行子带拆分操作,拆分为中心频率不同的多个子带信号数据,设子带数量为N;
[0017] 第三步:将L个天线中的参考天线的N个子带信号数据一一对应发送至N个GPU中,设为GPU1‑GPUN;在该N个GPU的每个GPU中,将L个天线的子带拆成M个数据块,利用多个操作队列并发的方式,对M个数据块分别进行复制,将非参考天线并与参考天线对应子带、对应数据块进行互相关运算,求得相位差;针对每个GPU中的子带信号数据,得到L‑1个非参考天线对应的M个相位差结果;
[0018] 第五步:对每个子带得到的所述M个相位差结果进行拟合,拟合曲线的截距即为子带的相位差的取值,之后用该相位差对各子带数据进行相位补偿,待所有子带相位补偿完成之后,将各天线的对应子带信号数据进行相加;
[0019] 第六步:将第五步中每个GPU得到的子带信号数据进行重构,得到和原始信号带宽相同的信号,实现合成。
[0020] 较佳的,所述第一步中,天线信号的模拟数据经过幅度调节后再进行采样,之后将采样后的数据进行串并变换,得到并行的L路天线信号。
[0021] 较佳的,所述第一步中在主机端进行。
[0022] 较佳的,所述第二步中将L路并行的天线信号通过DDS中间件技术发给空闲的GPU。
[0023] 本发明具有如下有益效果:
[0024] 本发明提出一种基于GPU的多操作队列并发架构的宽带信号多天线合成方法,以GPU操作队列并发作为并行基础,每一个操作队列用于处理天线子带的一个数据块,以多操作队列并发实现天线信号与参考天线信号快速互相关求相位差;同时,多个GPU并发同时处理各个子带的数据,与传统的宽带信号多天线合成方法相比,本发明实时性和并行性更好;传统的线程并行方法只能实现对计算时间的加速,而无法对数据传输时间进行加速;本发明的多操作队列并发方法不仅可以对计算模块进行加速,还可以较好地隐藏数据在主机与设备端或设备端之间传输所耗费的时间,并行性更好,实时性更佳;可实现对多天线、多子带、多数据块的并行处理;与传统基于多天线信号合成方法相比,本发明精度更高、实时性更好,扩展性更强。

附图说明

[0025] 图1为现有的频域全频谱合成方法框图。
[0026] 图2位本发明的方法流程图。

具体实施方式

[0027] 下面结合附图并举实施例,对本发明进行详细描述。
[0028] 本发明解决的技术问题为:提出了一种基于GPU的多操作队列并发架构的宽带信号多天线合成方法,该系统以GPU作为核心的数据处理器件,可以有效降低运算量对系统的压力,利用GPU的浮点运算能力可提高信号合成的性能,降低合成损失。该方法采用GPU多操作队列并发作为并行运算基础,同时应用多GPU并发、多操作队列并发、多线程并发等并行优化方式。由于GPU平台的运算耗时主要集中在数据传输和实际的运算。若采用传统的GPU线程并行操作方法,可以实现多路信号的同时并行处理,但某一路信号的处理过程中数据传输与运算模块相互独立,在该路信号所有的数据传输完成后才能进行运算操作,而一次性传输一路信号的所有数据将耗费大量的时间。本专利提出的多操作队列并发的架构,每个操作队列用于处理一路天线信号中的一个数据块,多操作队列并发可较好的隐藏数据在GPU之间传输所耗费的时间同时实现多路信号的并发操作。
[0029] 本发明基于GPU平台,将一段较长的数据拆分成多个数据块,利用多操作队列并发的方式同时处理提高系统的并行性,进而提高系统的实时性能。
[0030] 传统线程并行方法中,以某一路信号为例,在运算之前,需要将该路信号的所有数据传输至GPU之后,同时启动多个线程对数据进行运算,每个线程处理其中的部分数据,待所有线程都计算完之后,将所有的数据传输至CPU或下一设备。该方法利用线程并行加速的方法可以对计算的时间进行加速,使得耗时主要集中在数据的传输。该方法也是基于GPU做加速的主流方法与普遍使用的方法。
[0031] 本发明采用多操作队列并发架构,将计算之前的数据进行分块成为N个数据块。利用N 个GPU构建多个操作队列,每个操作队列处理其中的一个数据块,这样,每个操作队列的数据传输时间变短为之前的1/N,计算时间没有改变。且多个操作队列由于使用了不同的GPU,其互不干扰,实现多个操作队列的并发就可以从整体上减少数据传输所耗费的时间。
[0032] 当每路信号的点数过多时,可以采用将数据分为更多的数据块来实现,这样就需要的GPU 的数量也就越多。理论上可以将数据分为任意多数量的数据块进行操作,可以使得整体的耗时最少,但是数据块划分的越多,所需要的GPU也就越多。因此可以在同时考虑实时性(整体耗时)和资源成本(GPU的数量)的基础上,合理设置数据块的数量以达到最大的效益。
[0033] 如图2为基于GPU的宽带信号多天线合成方法的具体流程框图。
[0034] 第一步:在数据接收模块,模拟数据经过幅度调节后送至模数转换(ADC)模块进行采样,之后将采样后的数据进行串并变换,将ADC采集到的串行的L个天线信号转换为并行的 L路天线信号,此步操作在主机端进行。
[0035] 第二步:将L路并行的天线信号通过DDS中间件技术发给空闲的GPU0,利用多个线程并行的方式将每路天线信号进行子带拆分操作,拆分为中心频率不同的多个子带,设子带数量为N。
[0036] 第三步:将L个天线中的参考天线的N个子带分别发送至N个GPU中,设为GPU1‑GPUN;以GPU1为例分析,在GPU1中,所有天线的子带1需要与参考天线的子带1进行互相关运算求相位差。此时利用多操作队列并发架构对流程进行优化,即每个天线的每个子带拆成M个数据块,利用多个操作队列并发的方式对M个数据块分别进行复制,并与参考天线对应子带、对应数据块进行互相关运算求相位差。每个天线需要M个操作队列,除参考天线外共L‑1个天线,因此每个GPU中需要(L‑1)*M个操作队列,因此每个GPU至少需要包含(L‑1)*M个非默认流处理器。针对每个子带,L‑1个非参考天线的每个数据块与参考天线对应子带、对应数据块之间均计算得到一个相位差结果;
[0037] 第五步:对每个子带得到的所述相位差结果进行拟合,拟合曲线的截距即为相位差的取值,之后用该相位差对各子带数据独立进行相位补偿,待所有子带相位补偿完成之后,将各天线的对应子带信号数据进行相加,得到信噪比更高的子带数据。
[0038] 第六步:将第五步中每个GPU得到的各子带数据进行重构,得到和原始信号带宽相同的信号,该信号的信噪比得到的增强。
[0039] 综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。