拍摄方法、装置及电子设备转让专利

申请号 : CN202110999017.2

文献号 : CN113727021B

文献日 : 2023-07-11

相似专利: 请登录后查看

本申请公开了一种拍摄方法、装置及电子设备，属于摄像技术领域。该方法包括：在显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息；在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理；其中，所述第一变焦倍率与所述第一声音强度相关联。

1.一种拍摄方法，其特征在于，包括：

在显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息；

在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理；

其中，所述第一变焦倍率与所述第一声音强度相关联；

其中，所述按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理之前，还包括：根据所述第一语音信号的第一声音强度，确定第一中间倍率；

获取所述第一语音信号中干扰信号的第二声音强度；

根据所述第二声音强度和所述第一中间倍率，确定第二中间倍率；

在预设时间段内未接收到拍摄者的第二语音信号的情况下，将所述第二中间倍率确定为所述第一变焦倍率。

2.根据权利要求1所述的方法，其特征在于，所述按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理之前，还包括：在所述第一声音强度小于或等于预设强度阈值的情况下，将与所述第一声音强度对应的第一预设倍率确定为第一变焦倍率；

在所述第一声音强度大于所述预设强度阈值的情况下，将与所述第一声音强度对应的第二预设倍率确定为第一变焦倍率；

其中，所述第一预设倍率大于所述第二预设倍率。

3.根据权利要求1所述的方法，其特征在于，所述根据所述第二声音强度和所述第一中间倍率，确定第二中间倍率之后，还包括：在预设时间段内接收到拍摄者的第二语音信号的情况下，获取目标信息，所述目标信息包括以下至少一项：所述第二语音信号的第三声音强度、所述第二语音信号中的关键字；

根据所述目标信息和所述第二中间倍率，确定所述第一变焦倍率。

4.根据权利要求1所述的方法，其特征在于，所述获取第一语音信号的语音信息之后，还包括：在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面外的对象的情况下，根据所述声源信息，确定所述发声对象的方位信息；

基于所述方位信息，输出提示信息，所述提示信息用于指示拍摄者转动拍摄装置的方向，以使所述发声对象显示于所述拍摄预览界面中。

5.根据权利要求1所述的方法，其特征在于，所述获取第一语音信号的语音信息之前，还包括：获取第三语音信号，所述第三语音信号包括M个发声对象的M个子语音信号；

根据每个子语音信号的优先级，将所述M个子语音信号中的至少一个子语音信号确定为第一语音信号；

其中，M为大于或等于2的整数。

6.根据权利要求1所述的方法，其特征在于，所述获取第一语音信号的语音信息之前，还包括：获取第四语音信号，所述第四语音信号包括至少一个发声对象的子语音信号；

获取所述第四语音信号中的目标发声对象的子语音信号；

将目标发声对象的子语音信号确定为第一语音信号；

其中，所述目标发声对象满足预设条件，所述预设条件包括：所述目标发声对象位于所述拍摄预览界面中的预设区域，或者所述目标发声对象的对象特征与预设对象特征匹配。

7.一种拍摄装置，其特征在于，包括：

获取模块，用于在显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息；

处理模块，用于在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理；

其中，所述第一变焦倍率与所述第一声音强度相关联；

其中，所述处理模块，还用于：根据所述第一语音信号的第一声音强度，确定第一中间倍率；获取所述第一语音信号中干扰信号的第二声音强度；根据所述第二声音强度和所述第一中间倍率，确定第二中间倍率；在预设时间段内未接收到拍摄者的第二语音信号的情况下，将所述第二中间倍率确定为所述第一变焦倍率。

8.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1‑6中任一项所述的拍摄方法的步骤。

拍摄方法、装置及电子设备

技术领域

[0001] 本申请属于摄像技术领域，具体涉及一种拍摄方法、装置及电子设备。

背景技术

[0002] 目前，手机相机的变焦方式都是通过双指手势来完成的，双指划开进行变焦放大，双指收拢进行变焦缩小。但是这种变焦的方式在用户手持手机时需要双手同时使用，即，一只手握持手机，另一只手使用手指缩放变焦，操作方式不方便。

发明内容

[0003] 本申请实施例的目的是提供一种拍摄方法、装置及电子设备，能够解决现有的变焦操作的操作方式不方便的问题。

[0004] 第一方面，本申请实施例提供了一种拍摄方法，该方法包括：

[0005] 在显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息；

[0006] 在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理；

[0007] 其中，所述第一变焦倍率与所述第一声音强度相关联。

[0008] 第二方面，本申请实施例提供了一种拍摄装置，该装置包括：

[0009] 获取模块，用于在显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息；

[0010] 处理模块，用于在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理；

[0011] 其中，所述第一变焦倍率与所述第一声音强度相关联。

[0012] 第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

[0013] 第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

[0014] 第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

[0015] 在本申请实施例中，其在显示拍摄预览界面的情况下，会获取第一语音信号的第一声音强度和声源信息，并在声源信息指示该语音信号的发声对象为拍摄预览界面中显示的对象的情况下，通过与第一声音强度相关联的第一变焦倍率，对拍摄预览界面中的预览图像执行变焦处理。该方法是通过与拍摄预览界面中所显示对象的语音信号的声音强度相关联的变焦倍率，对拍摄预览界面中的预览图像执行自动变焦，不需要用户手动执行变焦，简化了用户的变焦操作。

附图说明

[0016] 图1是本申请实施例提供的拍摄方法的流程图；

[0017] 图2是本申请实施例提供的电子设备的界面显示示意图之一；

[0018] 图3是本申请实施例提供的电子设备的界面显示示意图之二；

[0019] 图4是本申请实施例提供的电子设备的界面显示示意图之三；

[0020] 图5是本申请实施例提供的电子设备的界面显示示意图之四；

[0021] 图6是本申请实施例提供的电子设备的界面显示示意图之五；

[0022] 图7是本申请实施例提供的拍摄装置的结构示意图；

[0023] 图8是本申请实施例提供的电子设备的结构示意图之一；

[0024] 图9是本申请实施例提供的电子设备的结构示意图之二。

具体实施方式

[0025] 下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

[0026] 本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

[0027] 下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的图像展示方法进行详细地说明。

[0028] 如图1所示，本申请实施例提供一种拍摄方法，该方法可以应用于电子设备中，该电子设备可以为手机、平板电脑、笔记本电脑等。如图1所示，该方法可以包括步骤1100～步骤1400，以下予以详细说明。

[0029] 步骤1100，在显示拍摄预览界面的情况下，获取第一语音信号的语音信息。

[0030] 拍摄预览界面为进入拍照应用程序后所显示的界面。其中，拍摄预览界面中显示有拍摄对象。

[0031] 被拍摄者可以基于设定的语音与电子设备进行交互，该设定的语音可以是带有方向性的语音。例如，该设定的语音可以是“看这里”、“我在这”等。

[0032] 本实施例中，在执行本步骤1100在显示拍摄预览界面的情况下，获取第一语音信号的语音信息之前，本公开的拍摄方法还可以包括：在显示拍摄预览界面的情况下，提供进行语音配置的配置入口，并获取通过该配置入口输入的语音作为设定的语音。

[0033] 如图2所示，在显示拍摄预览界面的情况下，拍摄者可以点击“设置”，进入语音录入的页面，点击“开始录音语音”后，便可录音设定的语音，例如“看这里”、“我在这”等。

[0034] 第一语音信号可以为拍摄预览界面中显示的对象发出的声音，也可以为拍摄预览界面外的对象发出的声音。

[0035] 语音信息包括第一声音强度和声源信息。

[0036] 本实施例中，可以通过检测第一语音信号的振幅来确定出该第一语音信号的第一声音强度。

[0037] 本实施例中，可以是先获取电子设备中两个麦克风所拾取的第一语音信号的相位差，并结合这两个麦克风之间的距离和角度，确定出第一语音信号的声源信息。

[0038] 示例1，当电子设备开始运行拍照应用程序后，便可在电子设备的显示屏幕上显示拍摄预览界面。在显示拍摄预览界面的情况下，拍摄预览界面中显示的对象便可通过设定的语音与电子设备进行交互，如图3和图4所示，拍摄预览界面中显示有两个对象，其中一个对象喊出“我在这”。

[0039] 当拍摄预览界面中的其中一个对象喊出“我在这”之后，电子设备将“我在这”作为第一语音信号。通过第一语音信号“我在这”的振幅来确定出第一语音信号“我在这”的声音强度作为第一声音强度。通过两个麦克风所拾取的第一语音信号“我在这”的相位差，并结合两个麦克风之间的距离和角度来确定出第一语音信号“我在这”的声源信息。其中，图3和图4所对应的第一语音信号的声源信息均指示，第一语音信号的发声对象为拍摄预览界面中显示的对象。

[0040] 在显示拍摄预览界面的情况下，获取第一语音信号的语音信息之后，进入：

[0041] 步骤1200，在声源信息指示第一语音信号的发声对象为拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对拍摄预览界面中的预览图像执行变焦处理。

[0042] 第一变焦倍率与第一声音强度相关联。可以得知，其在第一语音信号来源于拍摄预览界面中显示的对象的情况下，会根据与第一语音信号的强度相关联的第一变焦倍率，对拍摄预览界面中的预览图像执行自动变焦处理。

[0043] 在一个实施例中，在按照第一变焦倍率，对拍摄预览界面中的预览图像执行变焦处理之前，还可以根据以下步骤2100～步骤2200确定出第一变焦倍率，进而根据第一变焦倍率，对拍摄预览界面中的预览图像执行自动变焦处理，该实施例中，该拍摄方法还可以包括如下步骤2100～步骤2200：

[0044] 步骤2100，在第一声音强度小于或等于预设强度阈值的情况下，将与第一声音强度对应的第一预设倍率确定为第一变焦倍率。

[0045] 预设强度阈值可以是根据实际应用场景和实际需求设置的数值。

[0046] 本步骤2100中，电子设备中预先存储有反映不同第一声音强度与不同第一预设倍率之间的映射关系的第一映射数据，在获取第一声音强度之后，便可从第一映射数据中匹配出该第一声音强度所对应的第一预设倍率。

[0047] 可以理解的是，在第一声音强度小于或等于预设强度阈值的情况下，表明该第一语音信号的声源信息所指示的对象距离摄像装置较远，则需要进行变焦放大，即需要调大变焦倍率。其中，第一声音强度越小，放大的变焦倍率越高，从而能够满足实际场景需求。

[0048] 继续上述步骤1100中的示例1，图3中的“我在这”为拍摄预览界面中显示的对象发出的声音，则将该对象作为需要进行变焦的区域，由于“我在这”的强度较小，则表明该对象离摄像装置较远，此时需要对该对象进行变焦放大，将从以上第一映射数据中获取到“我在这”的第一声音强度所对应的第一预设倍率5x作为第一变焦倍率，即将当前变焦倍率1x调大为第一变焦倍率5x。

[0049] 步骤2200，在第一声音强度大于预设强度阈值的情况下，将与第一声音强度对应的第二预设倍率确定为第一变焦倍率。

[0050] 第一预设倍率大于第二预设倍率。

[0051] 本步骤2100中，电子设备中预先存储有反映不同第一声音强度与不同第二预设倍率之间的映射关系的第二映射数据，在获取第一声音强度之后，便可从第二映射数据中匹配出该第一声音强度所对应的第二预设倍率。

[0052] 可以理解的是，在第一声音强度大于预设强度阈值的情况下，表明该第一语音信号的声源信息所指示的对象距离摄像装置较近，则需要进行变焦缩小，即需要调小变焦倍率。其中，第一声音强度越大，缩小的变焦倍率越高，从而能够满足实际场景需求。

[0053] 继续上述步骤1100中的示例1，图4中的“我在这”为拍摄预览界面中显示的对象发出的声音，则将该对象作为需要进行变焦的区域，由于“我在这”的强度较大，则表明该对象离摄像装置较近，此时需要对该对象进行变焦缩小，将从以上第二映射数据中获取到“我在这”的第一声音强度所对应的第二预设倍率1x作为第一变焦倍率，则将当前变焦倍率5x调小为第一变焦倍率1x。

[0054] 本实施例中，以上按照第一变焦倍率，对拍摄预览界面中的预览图像执行变焦处理可以进一步包括：按照第一变焦倍率，以拍摄预览界面中显示的该对象为中心，对拍摄预览界面中的预览图像执行变焦处理。

[0055] 如图3所示，可以以拍摄预览界面中显示的喊出“我在这”的对象为中心，将拍摄预览界面中的预览图像自动变焦至5X。

[0056] 如图4所示，可以以拍摄预览界面中显示的喊出“我在这”的对象为中心，将拍摄预览界面中的预览图像自动变焦至1X。

[0057] 根据本实施例的方法，其在显示拍摄预览界面的情况下，会获取第一语音信号的第一声音强度和声源信息，并在声源信息指示该语音信号的发声对象为拍摄预览界面中显示的对象的情况下，通过与第一声音强度相关联的第一变焦倍率，对拍摄预览界面中的预览图像执行变焦处理。该方法是通过与拍摄预览界面中显示的对象的语音信号的声音强度相关联的变焦倍率，对拍摄预览界面中的预览图像执行自动变焦，不需要用户手动执行变焦，简化了用户的变焦操作。

[0058] 在一个实施例中，在按照第一变焦倍率，对拍摄预览界面中的预览图像执行变焦处理之前，还可以根据以下步骤3100～步骤3400确定出第一变焦倍率，进而根据第一变焦倍率，对拍摄预览界面中的预览图像执行自动变焦处理该实施例中，该拍摄方法还可以包括如下步骤3100～步骤3400：

[0059] 步骤3100，根据第一语音信号的第一声音强度，确定第一中间倍率。

[0060] 本步骤3100中，电子设备中预先存储有第一映射数据和第二映射数据，其中，第一映射数据反映不同第一声音强度与不同第一预设倍率之间的映射关系，第二映射数据反映不同第一声音强度与不同第二预设倍率之间的映射关系。通常，在第一声音强度小于或等于预设强度阈值时，会从第一映射数据中匹配出与第一声音强度对应的第一预设倍率作为第一中间倍率。在第一声音强度大于预设强度阈值时，会从第二映射数据中匹配出第一声音强度对应的第二预设倍率作为第一中间倍率。本申请实施例的第一映射数据和第二映射数据可以是通过映射表或者其他映射关系的存储形式进行存储，在此不做具体限定。

[0061] 本步骤3100中，可以先将第一声音强度与预设强度阈值进行比较，以从以上第一语音信号的第一映射数据或以上第二映射数据匹配出第一声音强度所对应的第一预设倍率或第二预设倍率，作为第一中间倍率。

[0062] 继续上述步骤2100的示例1，在第一声音强度小于或等于预设强度阈值时，可以根据第一语音信号的第一声音强度和第一映射数据，确定出第一预设倍率5x作为第一中间倍率。

[0063] 继续上述步骤2200的示例1，在第一声音强度大于预设强度阈值时，可以根据第一语音信号的第一声音强度和第二映射数据，确定出第二预设倍率1x作为第一中间倍率。

[0064] 步骤3200，获取第一语音信号中干扰信号的第二声音强度。

[0065] 可以理解的是，实际拍摄场景中，声音源往往会受到外界干扰。干扰信号可以是各种噪声信号，例如汽车、火车的鸣笛声等。

[0066] 本步骤3200中，电子设备中预先存储有反映不同干扰信号与不同第二声音强度之间的映射关系的第三映射数据。本步骤3200中，可以是先获取第一语音信号中干扰信号的振幅，以根据干扰信号的振幅和第三映射数据来确定出该干扰信号对应的第二声音强度。

[0067] 步骤3300，根据第二声音强度和第一中间倍率，确定第二中间倍率。并执行如下步骤3400或步骤3500。

[0068] 可以理解的是，在存在干扰信号的情况下，通常会调低第一中间倍率。其中，第二声音强度越大，第一中间倍率调低的越多，得到的第二中间倍率也就越小。

[0069] 本步骤3300中，当接收到拍摄预览界面中显示的对象的第一语音信号中存在干扰信号的情况下，会根据该干扰信号的第二声音强度，对以上步骤3100中得到的第一中间倍率进行调整得到第二中间倍率。同时，在拍摄预览界面显示提示信息“不进行变焦操作，等待拍摄者语音反馈”。

[0070] 步骤3400，在预设时间内未接收到拍摄者的第二语音信号的情况下，将第二中间倍率确定为第一变焦倍率。

[0071] 本步骤3400中，如果在预设时间内未接收到拍摄者的语音信号，则会将该第二中间倍率作为第一变焦倍率，进而根据该目标变焦倍率对拍摄预览界面中的预览图像执行变焦处理。

[0072] 继续上述步骤3100的示例1，在确定出5x作为第一中间倍率的情况下，由于干扰信号有所干扰，此时，可以根据干扰信号的强度，将第一中间倍率调低为3x作为第二中间倍率。同时，如果在预设时间内未接收到拍摄者的语音信号，则会将该第二中间倍率3x作为第一变焦倍率，进而根据该第一变焦倍率对拍摄预览界面中的预览图像执行变焦处理。

[0073] 继续上述步骤3100的示例1，在确定出1x作为第一中间倍率的情况下，由于干扰信号有所干扰，此时，可以根据干扰信号的强度，将第一中间倍率调低为0.8x作为第二中间倍率。同时，如果在预设时间内未接收到拍摄者的语音信号，则会将该第二中间倍率0.8x作为第一变焦倍率，进而根据该第一变焦倍率对拍摄预览界面中的预览图像执行变焦处理。

[0074] 步骤3500，在预设时间内接收到拍摄者的第二语音信号的情况下，获取目标信息。

[0075] 目标信息包括以下至少一项：第二语音信号的第三声音强度、第二语音信号中的关键字。

[0076] 本步骤3500中，如果在预设时间内接收到拍摄者的第二语音信号，则会对该拍摄者的第二语音信号进行识别，得到第二语音信号的第三声音强度和该第二语音信号中的关键字，进而根据该第二语音信号的第二声音强度和/或第二语音信号中的关键字调整第二中间倍率，得到第一变焦倍率，并基于该第一变焦倍率对拍摄预览界面中的预览图像执行变焦处理。

[0077] 继续上述步骤3400的示例1，电子设备在预设时间内接收到拍摄者的第二语音信号“大一点”，则会根据第二语音信号“大一点”的第二声音强度和/或关键词“大”，将第二中间倍率调大，例如将该第二中间倍率3x调大为5x作为第一变焦倍率，进而根据该第一变焦倍率对拍摄预览界面中的预览图像执行变焦处理。

[0078] 根据本实施例，其在拍摄对象发出的声音受到干扰的情况下，会结合干扰信号的强度，提供预期变焦倍率对拍摄预览界面中的预览图像执行变焦处理，不需要用户手动执行变焦，简化了用户的变焦操作。同时，支持用户语音反馈对该预期变焦倍率进行调整，使得到的变焦倍率更加符合用户需求。

[0079] 在一个实施例中，在执行以上步骤1100获取第一语音信号的语音信息之后，本公开实施例的拍摄方法还可以包括如下步骤4100～步骤4200：

[0080] 步骤4100，在声源信息指示第一语音信号的发声对象为拍摄预览界面外的对象的情况下，根据声源信息，确定发声对象的方位信息。

[0081] 本实施例中，其在第一语音信号的声源信息指示第一语音信号的发声对象为拍摄预览界面外的对象的情况下，会基于该第一语音信号的声源信息，先确定发声对象的方位信息。

[0082] 示例2，当电子设备开始运行拍照应用程序后，便可在电子设备显示屏幕显示拍摄预览界面。在显示拍摄预览界面的情况下，被拍摄者可以通过设定的语音进行交互，如图5所示，拍摄预览界面中虽然未显示对象，但是该拍摄预览界面之外存在语音源“我在这”，此时，电子设备会先基于该“我在这”的声源信息，确定出发声对象的方位信息。

[0083] 步骤4200，基于方位信息，输出提示信息。

[0084] 提示信息用于指示拍摄者转动拍摄装置的方向，以使发声对象显示于拍摄预览界面中。

[0085] 本实施例中，其在确定发声对象的方位信息的情况下，会在电子设备的显示界面显示出用于指示拍摄者转动拍摄装置的方向的提示信息，进而使得拍摄者基于该提示信息转动摄像装置的方向，实现发声对象显示于拍摄预览界面中。

[0086] 继续上述步骤4100的示例2，如图5所示，电子设备的显示界面输出提示信息，该提示信息不仅包括“请转动手机”的文字信息，还包括指向该语音源“我在这”的指向信息，该指向信息为图5中的箭头。

[0087] 根据本实施例，其实现了拍摄预览画面以外的语音源的提示和交互，使得在拍摄对象丢失的情况下，可以帮助拍摄者更快找到需要拍摄的对象。

[0088] 在一个实施例中，在执行以上步骤1100获取第一语音信号的语音信息之前，本公开实施例的拍摄方法还可以包括如下步骤5100～步骤5200：

[0089] 步骤5100，获取第四语音信号。

[0090] 第四语音信号包括至少一个发声对象的子语音信号。

[0091] 示例3，如图6所示，在显示拍摄预览界面的情况下，如果拍摄预览界面中显示的三个对象同时发声，则电子设备会获取到三个子语音信号，即，对象1的子语音信号1，对象2的子语音信号2，以及对象3的子语音信号3。

[0092] 步骤5200，获取第四语音信号中的目标发声对象的子语音信号。

[0093] 目标发声对象可以为满足预设条件的对象，该预设条件包括：目标发声对象位于拍摄预览界面中的预设区域，或者目标发声对象的对象特征与预设对象特征匹配。也就是说，在第四语音信号中存在满足预设条件的发声对象的声音的情况下，便可将该满足预设条件的发声对象的声音确定为目标发声对象的子语音信号。

[0094] 在一个例子中，预设条件包括目标发声对象的对象特征与预设对象特征匹配。

[0095] 以上预设对象特征可以是预先存储的人脸信息，以及所备注的每一个人脸信息对应的属性信息，该属性信息可以包括姓名和与拍摄者的关系。在此，本公开的拍摄方法还可以进一步包括：接收第一输入，响应于第一输入，获取预设对象特征。

[0096] 该例子中，在显示拍摄预览界面的情况下，电子设备会获取至少一个发声对象的子语音信号，同时，电子设备进一步识别至少一个发声对象的子语音信号中是否存在目标发声对象的子语音信息。例如先识别发声对象的对象特征是否与预设对象特征匹配，在匹配到的情况下，将对应的发声对象作为目标发声对象，并获取目标发声对象的子语音信号。

[0097] 继续上述步骤5100的示例3，在电子设备获取到以上三个子语音信号后，会将这三个发声对象的对象特征与预设对象特征匹配，在这三个发声对象中的对象1的对象特征与预设对象特征匹配成功的情况下，便将对象1作为目标发声对象，并获取对象1的子语音信号。

[0098] 在一个例子中，预设条件包括目标发声对象位于拍摄预览界面中的预设区域。预设区域可以是拍摄预览界面的中心区域。

[0099] 该例子中，在显示拍摄预览界面的情况下，电子设备会获取至少一个发声对象的子语音信号，同时，电子设备进一步判断至少一个发声对象中是否存在位于拍摄预览界面的中心区域的对象，如果存在位于拍摄预览界面中的对象，则将该对象作为主体对象即目标发声对象。

[0100] 可以理解的是，越靠近拍摄预览界面的中心区域的人脸，作为主体的可能性就越大。

[0101] 继续上述步骤5100的示例3，在显示拍摄预览界面的情况下，电子设备会获取至少一个发声对象的子语音信号，同时，电子设备进一步识别这三个发声对象中是否存在位于拍摄预览界面的中心区域的对象，在这三个发声对象中的对象1位于拍摄预览界面中的中心区域的情况下，将对象1作为目标发声对象，并获取目标发声对象的子语音信号。

[0102] 步骤5300，将目标发声对象的子语音信号确定为第一语音信号。

[0103] 继续上述步骤5200的示例3，在确定出目标发声对象即对象1的子语音信号之后，便可将对象1的子语音信号确定为第一语音信号，进而根据与该第一语音信号的第一声音强度关联的第一变焦倍率，以拍摄预览界面中的对象1为中心，对拍摄预览界面中的预览图像执行变焦处理。

[0104] 根据本实施例，其在拍摄预览画面中的多个对象同时发出声音的情况下，会确定拍摄预览画面中的主体对象即目标发声对象发出的声音，从而保证能够以目标发声对象为中心对拍摄预览界面中的预览图像进行变焦。

[0105] 在一个实施例中，在执行以上步骤1100获取第一语音信号的语音信息之后，本公开实施例的拍摄方法还可以包括如下步骤6100～步骤6200：

[0106] 步骤6100，获取第三语音信号。

[0107] 第三语音信号包括M个发声对象的M个子语音信号。M为大于或等于2的正整数。

[0108] 示例4，在显示拍摄预览界面的情况下，如果拍摄预览界面中显示的两个对象和拍摄预览界面外的一个对象同时发声，其中，对象1和对象2显示于拍摄预览界面中，对象2位于拍摄预览画面以外。则电子设备会获取到三个子语音信号，即，对象1的子语音信号1，对象2的子语音信号2，以及对象3的子语音信号3。

[0109] 步骤6200，根据每个子语音信号的优先级，将M个子语音信号中的至少一个子语音信号确定为第一语音信号。

[0110] 本步骤6200中，可以根据每个子语音信号的优先级的降序排序次序，从M个子语音信号中获取至少一个子语音信号确定为第一语音信号。

[0111] 本步骤6200中，在获取到M个子语音信号的情况下，可以先对该M个子语音信号的优先级进行从大到小的排序得到每个子语音信号的降序排序次序，排序原则为：拍摄预览界面中的对象的子语音信号的优先级大于拍摄预览界面外的子语音信号的优先级。声音强度大的子语音信号的优先级大于声音强度小的子语音信号的优先级。距离拍摄预览画面界面中的预设区域越近的子语音信号的优先级大于距离拍摄预览界面中的预设区域越远的子语音信号的优先级。预设区域可以为拍摄预览界面的中心区域。

[0112] 在一个例子中，可以基于每个子语音信号的优先级的降序排序次序，直接选取优先级最高的子语音信号确定为第一语音信号。

[0113] 继续上述步骤6100的示例4，电子设备获取到三个子语音信号，其中，子语音信号1和子语音信号2为拍摄预览界面中显示的对象发出的语音信号，子语音信号3为拍摄预览界面以外的对象发出的语音信号。则子语音信号1的优先级和子语音信号2的优先级均高于子语音信号3的优先级。同时，由于子语音信号1的声音强度大于子语音信号2的声音强度，则子语音信号1的优先级大于子语音信号2的优先级。在此，可以直接选择子语音信号1为第一语音信号。

[0114] 在一个例子中，可以基于每个子语音信号优先级的降序排序次序，选取优先级排序为第一和第二的子语音信号作为第一语音信号。

[0115] 继续上述步骤6100的示例4，电子设备获取到三个子语音信号，其中，子语音信号1和子语音信号2为拍摄预览界面中显示的对象发出的语音信号，子语音信号3为拍摄预览界面以外的对象发出的语音信号。则子语音信号1的优先级和子语音信号2的优先级均高于子语音信号3的优先级，则选择子语音信号1和子语音信号2作为第一语音信号。

[0116] 可以理解的是，在同时可以选择子语音信号1和子语音信号2作为第一语音信号的情况下，可以是获取与子语音信号1的声音强度关联的变焦倍率1，以及，获取与子语音信号2的声音强度关联的变焦倍率2。同时，将变焦倍率1和变焦倍率2进行比较，如果变焦倍率1和变焦倍率2接近，则将变焦倍率1和变焦倍率2进行融合得到融合倍率，并将融合倍率作为第一变焦倍率，进而根据第一变焦倍率对拍摄预览界面中的预览图像执行变焦操作，例如以对象1和对象2为中心，对拍摄预览界面中的预览图像执行变焦处理。

[0117] 如果变焦倍率1和变焦倍率2不接近，此时根据以上分析可知，对象1的子语音信号1的优先级高于对象2的子语音信号2的优先级，则将子语音信号1关联的变焦倍率1作为第一变焦倍率，并按照第一变焦倍率对拍摄预览界面中的预览图像执行变焦操作，例如以对象1为中心，对拍摄预览界面中的预览图像执行变焦处理。

[0118] 根据本实施例，其在拍摄预览画面中的多个对象同时发出声音的情况下，会基于声音的优先级排序，对优先级高的声音所对应的对象进行变焦。

[0119] 与上述实施例相对应，如图7所示，本申请实施例还提供一种拍摄装置700，包括：

[0120] 获取模块710，用于在显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息。

[0121] 处理模块720，用于在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理。

[0122] 其中，所述第一变焦倍率与所述第一声音强度相关联。

[0123] 在一个实施例中，所述处理模块720，还用于：在所述第一声音强度小于或等于预设强度阈值的情况下，将与所述第一声音强度对应的第一预设倍率确定为第一变焦倍率；在所述第一声音强度大于所述预设强度阈值的情况下，将与所述第一声音强度对应的第二预设倍率确定为第一变焦倍率。

[0124] 其中，所述第一预设倍率大于所述第二预设倍率。

[0125] 在一个实施例中，所述处理模块720，还用于：根据所述第一语音信号的第一声音强度，确定第一中间倍率；获取所述第一语音信号中干扰信号的第二声音强度；根据所述第二声音强度和所述第一中间倍率，确定第二中间倍率；在预设时间段内未接收到拍摄者的第二语音信号的情况下，将所述第二中间倍率确定为所述第一变焦倍率。

[0126] 在一个实施例中，所述处理模块720，还用于：在预设时间段内接收到拍摄者的第二语音信号的情况下，获取目标信息，所述目标信息包括以下至少一项：所述第二语音信号的第三声音强度、所述第二语音信号中的关键字；根据所述目标信息和所述第二中间倍率，确定所述第一变焦倍率。

[0127] 在一个实施例中，所述处理模块720，还用于：在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面外的对象的情况下，根据所述声源信息，确定所述发声对象的方位信息；基于所述方位信息，输出提示信息，所述提示信息用于指示拍摄者转动拍摄装置的方向，以使所述发声对象显示于所述拍摄预览界面中。

[0128] 在一个实施例中，所述获取模块710，还用于获取第三语音信号，所述第三语音信号包括M个发声对象的M个子语音信号。

[0129] 所述处理模块720，还用于根据每个子语音信号的优先级，将所述M个子语音信号中的至少一个子语音信号确定为第一语音信号。

[0130] 其中，M为大于或等于2的整数。

[0131] 在一个实施例中，所述获取模块710，还用于获取第四语音信号，所述第四语音信号包括至少一个发声对象的子语音信号；以及，获取所述第四语音信号中的目标发声对象的子语音信号。

[0132] 所述处理模块720，还用于将目标发声对象的子语音信号确定为第一语音信号。

[0133] 其中，所述目标发声对象满足预设条件，所述预设条件包括：所述目标发声对象位于所述拍摄预览界面中的预设区域，或者所述目标发声对象的对象特征与预设对象特征匹配。

[0134] 本申请实施例中的拍摄装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra‑mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

[0135] 本申请实施例中的拍摄装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

[0136] 本申请实施例提供的拍摄装置能够实现上述方法实施例实现的各个过程，为避免重复，这里不再赘述。

[0137] 与上述实施例相对应，可选的，如图8所示，本申请实施例还提供一种电子设备800，包括处理器801，存储器802，存储在存储器802上并可在所述处理器801上运行的程序或指令，该程序或指令被处理器801执行时实现上述拍摄方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

[0138] 需要说明的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

[0139] 图9为实现本申请实施例的一种电子设备的硬件结构示意图。

[0140] 该电子设备900包括但不限于：射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元908、存储器909、以及处理器910等部件。

[0141] 本领域技术人员可以理解，电子设备900还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器910逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图9中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

[0142] 其中，处理器910，用于在显示单元906显示拍摄预览界面的情况下，获取第一语音信号的语音信息，所述语音信息包括第一声音强度和声源信息；在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面中显示的对象的情况下，按照第一变焦倍率，对所述拍摄预览界面中的预览图像执行变焦处理；其中，所述第一变焦倍率与所述第一声音强度相关联。

[0143] 在一个实施例中，处理器910，还用于在所述第一声音强度小于或等于预设强度阈值的情况下，将与所述第一声音强度对应的第一预设倍率确定为第一变焦倍率；在所述第一声音强度大于所述预设强度阈值的情况下，将与所述第一声音强度对应的第二预设倍率确定为第一变焦倍率；其中，所述第一预设倍率大于所述第二预设倍率。

[0144] 在一个实施例中，处理器910，还用于根据所述第一语音信号的第一声音强度，确定第一中间倍率；获取所述第一语音信号中干扰信号的第二声音强度；根据所述第二声音强度和所述第一中间倍率，确定第二中间倍率；在预设时间段内未通过用户输入单元907接收到拍摄者的第二语音信号的情况下，将所述第二中间倍率确定为所述第一变焦倍率。

[0145] 在一个实施例中，处理器910，还用于在预设时间段内通过用户输入单元807接收到拍摄者的第二语音信号的情况下，获取目标信息，所述目标信息包括以下至少一项：所述第二语音信号的第三声音强度、所述第二语音信号中的关键字；根据所述目标信息和所述第二中间倍率，确定所述第一变焦倍率。

[0146] 在一个实施例中，处理器910，还用于在所述声源信息指示所述第一语音信号的发声对象为所述拍摄预览界面外的对象的情况下，根据所述声源信息，确定所述发声对象的方位信息；基于所述方位信息，通过显示单元906输出提示信息，所述提示信息用于指示拍摄者转动拍摄装置的方向，以使所述发声对象显示于所述拍摄预览界面中。

[0147] 在一个实施例中，处理器910，还用于获取第三语音信号，所述第三语音信号包括M个发声对象的M个子语音信号；根据每个子语音信号的优先级，将所述M个子语音信号中的至少一个子语音信号确定为第一语音信号；其中，M为大于或等于2的整数。

[0148] 在一个实施例中，处理器910，还用于获取第四语音信号，所述第四语音信号包括至少一个发声对象的子语音信号；获取所述第四语音信号中的目标发声对象的子语音信号；将目标发声对象的子语音信号确定为第一语音信号；其中，所述目标发声对象满足预设条件，所述预设条件包括：所述目标发声对象位于所述拍摄预览界面中的预设区域，或者所述目标发声对象的对象特征与预设对象特征匹配。

[0149] 应理解的是，本申请实施例中，输入单元904可以包括图形处理器(Graphics Processing Unit，GPU)9041和麦克风9042，图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元906可包括显示面板9061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板
9061。用户输入单元907包括触控面板9071以及其他输入设备9072。触控面板9071，也称为触摸屏。触控面板9071可包括触摸检测装置和触摸控制器两个部分。其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器909可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器910可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器910中。

[0150] 本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述拍摄方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

[0151] 其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read‑Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

[0152] 本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述拍摄方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

[0153] 应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

[0154] 需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

[0155] 通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

[0156] 上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

拍摄方法、装置及电子设备转让专利

申请号 : CN202110999017.2

文献号 : CN113727021B

文献日 : 2023-07-11

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 陈明杨

申请人 : 维沃移动通信(杭州)有限公司

摘要 :

权利要求 :

说明书 :