主声源删除方法及系统、多声源识别方法及系统、装置转让专利

申请号 : CN202211654484.2

文献号 : CN115662383B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 袁芳魏明晏敏锋李屹超陈强民季亮杜有权任俊全孙景

申请人 : 杭州爱华智能科技有限公司

摘要 :

本发明公开了主声源删除方法及系统、多声源识别方法及系统、装置,方法包括:设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系计算时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出;定位出最大声源位置;根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列面上的平均时间函数,原始波形减去最大声源在传声器阵列面上的平均时间函数,完成主声源删除。以上方案简单利用减法可以将主声源及其旁瓣成分从原始信号中删除,进一步循环该方法可以识别和定位多声源。

权利要求 :

1.主声源删除方法,其特征在于,是基于时域的主声源删除方法,包括以下步骤:设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;

根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系计算时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出;定位出最大声源位置;根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列面上的平均时间函数,原始波形减去最大声源在传声器阵列面上的平均时间函数,完成主声源删除;

其中,所述聚焦点的波束输出函数f(t)根据公式1计算:                   (公式1)

其中,M为传声器个数,  为每个传声器的加权因子, 为时延;

其中,获取最大声源在声源聚焦面上的波束输出的方法为:以s1为最大声源聚焦点,则根据公式2计算s1位置处的时域波束输出函数 ,                (公式2)

其中,M为传声器个数,  为每个传声器的加权因子,  为最大声源聚焦点s1相对于传声器阵列坐标点的时延;

其中,所述根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数的方法,包括:根据公式3计算平均时间函数 ,        (公式3)

其中,M为传声器个数, 为每个传声器的加权因子,  为最大声源聚焦点s1相对于传声器阵列坐标点的时延;

其中,所述原始波形减去最大声源在传声器阵列面上的平均时间函数用公式4计算:                   (公式4)

其中, 为清除主声源后的声源波形,  为声源在传声器阵列面上的平均时间函数, 为原始波形。

2.多声源识别方法,其特征在于,采用权利要求1所述的主声源删除方法,包括以下方法:原始波形减去最大声源在传声器阵列面上的平均时间函数,得到清除当前主声源的新原始波形,重复主声源删除方法,定位出新原始波形中的最大声源之后清除当前最大声源,直至定位出所有声源。

3.根据权利要求2所述的多声源识别方法,其特征在于,所述重复主声源删除方法,定位出新原始波形中的最大声源之后清除当前最大声源的方法,包括:将清除主声源的原始波形,采用延时求和方法重新执行每一个聚焦点的波束输出计算,重新得到聚焦面内聚焦点的波束输出,定位出当前最大声源。

4.主声源删除系统,其特征在于,包括:

主声源定位单元,用于设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;根据传感器阵列实时同步采集的声源原始波形以及传感器阵列与每个聚焦点的位置关系产生的时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出;

主声源识别单元,定位出最大声源,获取最大声源在声源聚焦面上的波束输出;

反向重构单元,用于根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数;

清除单元,用于计算原始波形减去最大声源在传声器阵列面上的平均时间函数;

其中,所述聚焦点的波束输出函数f(t)根据公式1计算:                   (公式1)

其中,M为传声器个数,  为每个传声器的加权因子, 为时延,其中,所述获取最大声源在声源聚焦面上的波束输出的方法为:以s1为最大声源聚焦点,则根据公式2计算s1位置处的时域波束输出函数 ,                (公式2)

其中,M为传声器个数,  为每个传声器的加权因子,  为最大声源聚焦点s1相对于传声器阵列坐标点的时延,其中,所述根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数的方法,包括:根据公式3计算平均时间函数 ,        (公式3)

其中,M为传声器个数, 为每个传声器的加权因子,  为最大声源聚焦点s1相对于传声器阵列坐标点的时延,其中,所述原始波形减去最大声源在传声器阵列面上的平均时间函数用公式4计算:                   (公式4)

其中, 为清除主声源后的声源波形,  为声源在传声器阵列面上的平均时间函数, 为原始波形。

5.多声源识别系统,其特征在于,包括权利要求4所述的主声源删除系统,还包括循环清除单元,用于在删除当前最大声源之后循环执行主声源定位单元、主声源识别单元、反向重构单元和清除单元上的处理内容。

6.多声源识别装置,其特征在于,包括传感器阵列和处理器,所述处理器接收传感器阵列输出的声源波形,实现权利要求2所述的多声源识别方法。

说明书 :

主声源删除方法及系统、多声源识别方法及系统、装置

技术领域

[0001] 本申请涉及声学测量领域,尤其涉及主声源删除方法及系统、多声源识别方法及系统、装置。

背景技术

[0002] 标准波束形成技术是声学成像领域的成熟技术之一,主要用于远场以及中高频率的声源定位以及声场可视化,具有计算速度快,测量方便等优点。但是该技术因为成像频率以及传声器阵列阵型的设计会产生高的旁瓣,导致低能量的声源很容易被高能量声源旁瓣掩盖,限制了波束形成的多声源识别与定位能力。如果简单通过增加传声器的数量或者改变阵型设计去提高空间分辨力不仅增加成本而且计算耗时会增加,且效果并不显著。另外采用高分辨率的反卷积波束形成可以显著提高分辨率但计算耗时大,主要用于后处理。

发明内容

[0003] 本发明针对现有技术中的缺点,提供了一种主声源删除方法。
[0004] 本发明提出的主声源删除方法,包括以下步骤:
[0005] 设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;
[0006] 根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系计算时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出;定位出最大声源位置;根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列面上的平均时间函数,原始波形减去最大声源在传声器阵列面上的平均时间函数,完成主声源删除。
[0007] 作为一种可选方式,所述聚焦点的波束输出函数f(t)根据公式1计算:
[0008]                        (公式1)
[0009] 其中,M为传声器个数, 为每个传声器的加权因子, 为时延。
[0010] 作为一种可选方式,所述获取最大声源在声源聚焦面上的波束输出的方法为:以S1为最大声源聚焦点,则根据公式2计算S1位置处的时域波束输出函数 ,
[0011]                    (公式2)
[0012] 其中,M为传声器个数, 为每个传声器的加权因子, 为最大声源聚焦点S1的时延。
[0013] 作为一种可选方式,所述根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数的方法,包括:根据公式3计算平均时间函数,
[0014]            (公式3)
[0015] 其中,M为传声器个数, 为每个传声器的加权因子, 为最大声源聚焦点S1相对于传声器阵列坐标的时延。
[0016] 作为一种可选方式,所述原始波形减去最大声源在传声器阵列面上的平均时间函数用公式4计算:
[0017]                       (公式4)
[0018] 其中, 为清除主声源后的声源波形, 为声源在传声器阵列面的平均时间函数, 为原始波形。
[0019] 进一步提出一种多声源识别方法,采用所述主声源删除方法,包括以下方法:
[0020] 原始波形减去最大声源在传声器阵列面上的平均时间函数,得到清除当前主声源的新原始波形,重复主声源删除方法,定位出新原始波形中的最大声源之后清除当前最大声源,直至定位出所有声源。
[0021] 其中,所述重复主声源删除方法,定位出新原始波形中的最大声源之后清除当前最大声源的方法,包括:
[0022] 将清除主声源的原始波形,采用延时求和方法重新执行每一个聚焦点的波束输出计算,重新得到聚焦面内聚焦点的波束输出,定位出当前最大声源。
[0023] 进一步提出一种主声源删除系统,包括以下结构:
[0024] 主声源定位单元,用于设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系产生的时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出;
[0025] 主声源识别单元,定位出最大声源,获取最大声源在声源聚焦面上的波束输出;
[0026] 反向重构单元,用于根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数;
[0027] 清除单元,用于计算原始波形减去最大声源在传声器阵列面上的平均时间函数。
[0028] 进一步提出一种多声源识别系统,包括所述主声源删除系统,还包括循环清除单元,用于在删除当前最大声源之后循环执行主声源定位单元、主声源识别单元、反向重构单元和清除单元上的处理内容。
[0029] 进一步提出一种多声源识别装置,包括传感器阵列和处理器,所述处理器接收传感器阵列输出的声源波形,实现所述多声源识别方法。
[0030] 本发明提出的主声源删除方法采用延时求和扫描整个聚焦面的波束输出,从而找到主声源的位置以及声源在聚焦面的空间坐标映射。利用主声源与传声器阵列之间的空间坐标关系以及波形移位技术估计声源在聚焦面的时间函数,进一步利用声源在聚焦面的时间函数反推声源在传声器平面的平均时间函数,也就是原始信号中主声源的成分。该方法简单利用减法可以将主声源及其旁瓣成分从原始信号中删除。
[0031] 本发明提出的一种多声源识别方法,基于上述公开的主声源删除方法,循环上述主声源定位和删除操作,可实现多声源的识别和定位,对于被强声源掩盖的较弱声源的识别和定位提供了一种简单的方法。
[0032] 本发明提出的以上方案是一种基于时域的处理方法,因为只涉及到波形移位和简单的加减计算,因此计算速度快,可实时地“擦除”声源并显示,为多声源实时定位与测量提供可能。与现有的基于频域的CLEAN技术相比,计算过程中不需要计算庞大的声源点传播函数与耗时的卷积运算,同时避免了频域交叉谱矩阵计算造成的时间分辨率损失和加窗引起的频谱泄露以及平均误差。

附图说明

[0033] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0034] 图1是主声源删除方法以及多声源识别的流程图;
[0035] 图2是波束形成原理图;
[0036] 图3是声源S1在声源聚焦面上的时间函数重构示意图;
[0037] 图4是声源S1的清除减法示意图;
[0038] 图5是声源S1空间位置坐标示意图;
[0039] 图6是声源S1在传声器阵列面的平均时间函数示意图;
[0040] 图7是去除声源S1的原始波形图。

具体实施方式

[0041] 下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
[0042] 其中,下文描述的步骤(1)‑步骤(5)并非严格的流程顺序限制,而是为了方便描述的编号。
[0043] 参考图1,公开一种主声源删除方法,在多声源的场景下,采用简单的方法找到主声源删除,突显出其他声源,对于多声源数据的各种应用场景有前置处理效果,该方法包括以下步骤:
[0044] 步骤(1),设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;
[0045] 步骤(2),根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系计算时延,采用延时求和方法计算所有真实声源在声源聚焦面上的时间函数;
[0046] 步骤(3),定位出最大声源,以及该最大声源的坐标;
[0047] 步骤(4),根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数;
[0048] 步骤(5),原始波形减去最大声源在传声器阵列面上的平均时间函数,完成主声源删除。
[0049] 具体的,参考图2,步骤(1)设定声源聚焦面200,构建真实声源在声源聚焦面上的坐标映射为聚焦点,具体如下:
[0050] 假设数量为M的传声器分布在不同的空间位置组成传声器阵列100,传声器空间坐标为 ,M个传声器实时同步采集声源波形 。为了搜寻声源位置,将声源聚焦面设定于空间某个平面或曲面(下称“声源聚焦面”)上,并将真实声源离散为一系列的空间坐标点,聚焦点坐标为 。其中,声源聚焦面,是真实声源
在聚焦面上的空间坐标映射。
[0051] 具体的描述步骤(2),根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系计算时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出。
[0052] 以声源聚焦面其中一个聚焦点为例,根据该聚焦点和传声器阵列的空间位置关系计算时延 ,将每个传声器的时域波形进行延时求和,得到该聚焦点的波束输出。
[0053]              (公式1)
[0054] 上式中, 为每个传声器的加权因子,例如,常规波束形成一般设定 =1。为该聚焦点相对于每个传声器位置处的时延。根据声源的类型与所处的空间位置,时延可分别按照远场平面波或近场球面波的传播模型进行计算。
[0055] 对声源聚焦面上每一个聚焦点重复执行延时求和计算,得出声源聚焦面内所有聚焦点的波束输出。其中,波束输出能量最大的聚焦点就是声源的位置。由于主声源的主瓣宽度宽以及旁瓣水平高,通常情况下只有主声源才会被定位与识别出来,即所有聚焦点的波束输出中能量最大的聚焦点及所在位置。
[0056] 假设声源能量最大的聚焦点为S1,则S1位置处的时域波束输出为:
[0057]            (公式2)
[0058] 相对时延 根据定位出的声源S1位置与传声器阵列的每个传声器位置之间的空间关系确定。在理想的情况下(精确的聚焦点设定,没有噪声,没有其它源或失真),将是对真实声源S1在聚焦面上的时间函数的完美估计。参考图3。
[0059] 为了删除主声源,需要从原始信号中移除最强声源S1的相关信号,为了得到声源S1在传声器阵列面上的时间函数,将声源S1在聚焦面上的时间函数中的时延反向构建声源S1在传声器阵列面上的平均时间函数 ,具体的根据公式3计算平均时间函数 。
[0060] 参考图4,用每个传声器采集到的原始波形 减去声源S1的在传声器阵列面上的平均时间函数,公式4计算,就可以将最强声源S1及其旁瓣信号从原始信号中进行删除。由于整个处理过程都是基于时域信号,进行一次清除减法,最强声源S1以及所有相关频率成分的旁瓣都会被清除。
[0061]             (公式3)
[0062]         (公式4)
[0063] 进一步的,移除主声源之后,次强声源能够被识别和定位,依此逻辑就能在多声源混合的数据中识别和定位每一个声源。即原始波形减去最大声源在传声器阵列面上的平均时间函数,得到清除当前主声源的新原始波形,重复主声源删除方法,定位出当前原始波形中的最大声源之后清除当前最大声源,直至定位出所有声源。移除最强声源S1后,将应用了清除减法的新原始波形 基于延时求和方法和公式(1),重新执行每一个聚焦点的波束输出扫描,重构一张新的声源聚焦面。由于不包含最强声源S1及其所有相关的旁瓣,因此新的声源聚焦面,最大能量位置为次强声源S2的位置。
[0064] 通过重构‑清除‑再重构的过程,被掩盖的较弱的声源变得可见。因此在多声源情况下,通过递归地进行主声源删除方法,所有声源可按照能量大小依次实现识别与定位。
[0065] 基于上述方法,公开一组仿真模拟数据,以佐证本方案的可行性,假设空间中有两个声源,且这两个声源在声源聚焦面上的映射分别为S1与S2。以传声器阵列坐标中心为空间坐标原点,传声器的数目为60。预设声源聚焦面位于传声器阵列面正前方1m位置处,大小为1.2m*1.2m,为了将声源聚焦面离散化,设置离散间隔均为0.1m。
[0066] 为了模拟传声器阵列面上的传声器采集到的原始波形并验证方案准确性,假设声源1与2在聚焦面的映射坐标分别为S1(‑0.2,‑0.2)m和S2(0.1,0.1)m,声源1频率为3000Hz,声源2频率为2000Hz,幅值大小分别为2 Pa和0.05 Pa。两个声源同时发声,传声器阵列采集到原始波形包含声源1和声源2波形成分,由于声源1幅值大于声源2幅值,因此在进行声源定位的时候,声源2容易被声源1的能量掩盖。
[0067] 当采用上述方法以及公式(1)进行声源定位,声源聚焦面波束输出能量最大的位置的坐标为(‑0.2,‑0.2)m,与前面预设的声源S(1 主声源)的坐标相符。将声源定位声压级云图(图5)显示的动态范围设置成3 dB,声源S1清晰可见,声源S2不可见。因为声源S1幅值比声源S2大,且幅值差值超过3 dB。
[0068] 利用时域波束形成定位出主声源(声源S1)坐标为(‑0.2,‑0.2)m,根据公式(3)反向构建声源S1在传声器阵列面上的平均时间函数,如图6所示,代表声源S1在原始波形中的成分,其幅值与预设声源1的幅值基本相符。然后根据公式(4)的减法将主声源(声源S1)波形成分从原始波形中删除,如图7所示剩余波形主要成分是声源2 的波形,其大小也与预设声源2幅值大小基本相符。
[0069] 基于上述范例可以看出本申请提出的方案是可行的,并且能够实际应用。
[0070] 基于上述方法,进一步公开一种主声源删除系统,包括:
[0071] 主声源定位单元,用于设定声源聚焦面,构建真实声源在声源聚焦面上的坐标映射为聚焦点;根据传感器阵列实时同步采集的原始声源波形以及传感器阵列与每个聚焦点的位置关系产生的时延,采用延时求和方法计算所有真实声源在声源聚焦面上的波束输出;
[0072] 主声源识别单元,定位出最大声源,获取最大声源在声源聚焦面上的波束输出;
[0073] 反向重构单元,用于根据最大声源在聚焦面上的时间函数中的时延反向构建最大声源在传声器阵列上的平均时间函数;
[0074] 清除单元,用于计算原始波形减去最大声源在传声器阵列面上的平均时间函数。
[0075] 与多声源识别方法相对应的,还有一种多声源识别系统,包括上述主声源删除系统,还包括循环清除单元,用于在删除当前最大声源之后循环执行主声源定位单元、主声源识别单元、反向重构单元和清除单元上的处理内容。
[0076] 多声源识别装置,包括传感器阵列和处理器,所述处理器接收传感器阵列输出的声源波形,实现多声源识别方法。该装置可以是特制的用于多声源识别的工业设备,也可以是集成多声源识别功能的台式计算机、笔记本电脑、掌上电脑,或其他移动终端。
[0077] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
[0078] 所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0079] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0080] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read‑Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0081] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。