图像识别方法、装置、计算机设备和存储介质转让专利

申请号 : CN202211602503.7

文献号 : CN115620299B

文献日 : 2023-03-21

本申请涉及一种图像识别方法、装置、计算机设备和存储介质。所述方法包括：获取待识别图像；待识别图像为包含以环形方式展示的字符的环形图像；根据目标切分方向对待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定切分后待识别图像对应的目标识别方式；在目标识别方式为第一识别方式情况下，对切分后待识别图像中的字符区域进行识别，得到待识别图像的第一字符识别结果；在目标识别方式为第二识别方式情况下，基于切分后待识别图像中的字符区域得到调整后字符区域，对调整后字符区域进行识别，得到待识别图像的第二字符识别结果。采用本方法能够简化切分过程，提升了图像切分效率和图像识别效率。

1.一种图像识别方法，其特征在于，所述方法包括：

获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；所述目标切分方向为预设的方向或输入的方向；

在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果；

所述确定所述切分后待识别图像对应的目标识别方式，包括：判断所述切分后待识别图像是否适用于采用所述第一识别方式进行字符识别；

在确认不适用时，确定所述目标识别方式为所述第二识别方式；

所述目标切分方向为预设的N个候选切分方向中的任一候选切分方向，所述N为大于1的整数，所述在确认不适用时，确定所述目标识别方式为所述第二识别方式，包括：在确认不适用时，判断所述N个候选切分方向中是否存在替换切分方向；所述替换切分方向为切分后图像适用于所述第一识别方式的候选切分方向；

若存在所述替换切分方向，将所述替换切分方向设置为所述目标切分方向，并采用所述第一识别方式进行识别；

若不存在所述替换切分方向，则采用所述第二识别方式进行识别。

2.根据权利要求1所述的方法，其特征在于，所述根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，包括：根据所述目标切分方向对所述待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到所述切分后待识别图像。

3.根据权利要求1所述的方法，其特征在于，所述确定所述切分后待识别图像对应的目标识别方式，包括：判断所述切分后待识别图像是否适用于采用所述第一识别方式进行字符识别；

在确认适用时，确定所述目标识别方式为所述第一识别方式。

4.根据权利要求1所述的方法，其特征在于，所述判断所述N个候选切分方向中是否存在替换切分方向，包括：去除所述N个候选切分方向中已使用过的候选切分方向；

针对去除后的候选切分方向，判断每个候选切分方向对应的切分后图像是否适用于所述第一识别方式；

将切分后图像适用于所述第一识别方式所对应的候选切分方向，作为所述替换切分方向。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述切分后待识别图像中的字符区域包括第一字符区域和第二字符区域，所述基于所述切分后待识别图像中的字符区域得到调整后字符区域，包括：按照预设拼接方式，对所述第一字符区域和所述第二字符区域进行拼接，得到拼接后字符区域，作为所述调整后字符区域；

或，按照预设重组方式，对所述第一字符区域和所述第二字符区域进行重组，得到重组后字符区域，作为所述调整后字符区域。

6.根据权利要求5所述的方法，其特征在于，当所述调整后字符区域由所述拼接后字符区域得到，所述对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果，包括：确定所述拼接后字符区域的字符显示结果；所述字符显示结果用于表征所述拼接后字符区域中的字符显示为正向字符或反向字符；

在所述拼接后字符区域中的字符显示为所述正向字符时，对所述正向字符进行识别，得到所述第二字符识别结果；

在所述拼接后字符区域中的字符显示为所述反向字符时，将所述拼接后字符区域旋转预设角度，得到旋转后字符区域，对所述旋转后字符区域中的字符进行识别，得到所述第二字符识别结果。

7.一种图像识别装置，其特征在于，所述装置包括：

图像获取模块，用于获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

图像切分模块，用于根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；所述目标切分方向为预设的方向或输入的方向；

第一识别模块，用于在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

第二识别模块，用于在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果；

所述图像切分模块包括：

图像适用判断子模块，用于判断所述切分后待识别图像是否适用于采用所述第一识别方式进行字符识别；

目标识别方式得到子模块，用于在确认不适用时，确定所述目标识别方式为所述第二识别方式；

所述目标切分方向为预设的N个候选切分方向中的任一候选切分方向，所述N为大于1的整数，所述目标识别方式得到子模块包括：替换方向判断单元，用于在确认不适用时，判断所述N个候选切分方向中是否存在替换切分方向；所述替换切分方向为切分后图像适用于所述第一识别方式的候选切分方向；

存在替换方向单元，用于若存在所述替换切分方向，将所述替换切分方向设置为所述目标切分方向，并采用所述第一识别方式进行识别；

不存在替换方向单元，用于若不存在所述替换切分方向，则采用所述第二识别方式进行识别。

8.根据权利要求7所述的装置，其特征在于，所述图像切分模块包括：切分后展开子模块，用于根据所述目标切分方向对所述待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到所述切分后待识别图像。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

图像识别方法、装置、计算机设备和存储介质

技术领域

[0001] 本申请涉及计算机技术领域，特别是涉及一种图像识别方法、装置、计算机设备和存储介质。

背景技术

[0002] 目前，在对环形图像进行字符识别时，通常需要针对环形图像确定多个参数，以根据多个参数进行切分处理，切分过程繁杂，且根据公式多次推导确定参数的过程容易引入误差，会导致切分过程出现错误。

[0003] 在对大量图像进行处理时，采用上述传统方法需要分别计算每张图像对应的多个参数，并分别根据每张图像对应的多个参数进行切分，切分过程效率低，图像识别效果差。

发明内容

[0004] 基于此，有必要针对上述技术问题，提供一种能够解决上述问题的图像识别方法、装置、计算机设备和存储介质。

[0005] 第一方面，本申请提供了一种图像识别方法，所述方法包括：

[0006] 获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0007] 根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0008] 在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0009] 在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0010] 在其中一个实施例中，所述根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，包括：

[0011] 根据所述目标切分方向对所述待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到所述切分后待识别图像。

[0012] 在其中一个实施例中，所述确定所述切分后待识别图像对应的目标识别方式，包括：

[0013] 判断所述切分后待识别图像是否适用于采用所述第一识别方式进行字符识别；

[0014] 在确认适用时，确定所述目标识别方式为所述第一识别方式；

[0015] 或，在确认不适用时，确定所述目标识别方式为所述第二识别方式。

[0016] 在其中一个实施例中，所述目标切分方向为预设的N个候选切分方向中的任一候选切分方向，所述N为大于1的整数，所述在确认不适用时，确定所述目标识别方式为所述第二识别方式，包括：

[0017] 在确认不适用时，判断所述N个候选切分方向中是否存在替换切分方向；所述替换切分方向为切分后图像适用于所述第一识别方式的候选切分方向；

[0018] 若存在所述替换切分方向，将所述替换切分方向设置为所述目标切分方向，并采用所述第一识别方式进行识别；

[0019] 若不存在所述替换切分方向，则采用所述第二识别方式进行识别。

[0020] 在其中一个实施例中，所述判断所述N个候选切分方向中是否存在替换切分方向，包括：

[0021] 去除所述N个候选切分方向中已使用过的候选切分方向；

[0022] 针对去除后的候选切分方向，判断每个候选切分方向对应的切分后图像是否适用于所述第一识别方式；

[0023] 将切分后图像适用于所述第一识别方式所对应的候选切分方向，作为所述替换切分方向。

[0024] 在其中一个实施例中，所述切分后待识别图像中的字符区域包括第一字符区域和第二字符区域，所述基于所述切分后待识别图像中的字符区域得到调整后字符区域，包括：

[0025] 按照预设拼接方式，对所述第一字符区域和所述第二字符区域进行拼接，得到拼接后字符区域，作为所述调整后字符区域；

[0026] 或，按照预设重组方式，对所述第一字符区域和所述第二字符区域进行重组，得到重组后字符区域，作为所述调整后字符区域。

[0027] 在其中一个实施例中，当所述调整后字符区域由所述拼接后字符区域得到，所述对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果，包括：

[0028] 确定所述拼接后字符区域的字符显示结果；所述字符显示结果用于表征所述拼接后字符区域中的字符显示为正向字符或反向字符；

[0029] 在所述拼接后字符区域中的字符显示为所述正向字符时，对所述正向字符进行识别，得到所述第二字符识别结果；

[0030] 在所述拼接后字符区域中的字符显示为所述反向字符时，将所述拼接后字符区域旋转预设角度，得到旋转后字符区域，对所述旋转后字符区域中的字符进行识别，得到所述第二字符识别结果。

[0031] 第二方面，本申请还提供了一种图像识别装置，所述装置包括：

[0032] 图像获取模块，用于获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0033] 图像切分模块，用于根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0034] 第一识别模块，用于在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0035] 第二识别模块，用于在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0036] 第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上所述的图像识别方法的步骤。

[0037] 第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的图像识别方法的步骤。

[0038] 上述一种图像识别方法、装置、计算机设备和存储介质，通过获取待识别图像，待识别图像为包含以环形方式展示的字符的环形图像，然后根据目标切分方向对待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定切分后待识别图像对应的目标识别方式，进而在目标识别方式为第一识别方式情况下，对切分后待识别图像中的字符区域进行识别，得到待识别图像的第一字符识别结果，在目标识别方式为第二识别方式情况下，基于切分后待识别图像中的字符区域得到调整后字符区域，对调整后字符区域进行识别，得到待识别图像的第二字符识别结果。如此，可以采用预设的一种或几种方向对环形图像进行切分，切分过程简便，无需计算环形图像的多个参数，能够避免切分过程中引入误差，提升了切分效率，且可以针对切分后图像确定对应的字符识别方式，提升了图像识别效率。

附图说明

[0039] 图1为一个实施例中一种图像识别方法的应用环境图；

[0040] 图2为一个实施例中一种图像识别方法的流程示意图；

[0041] 图3为一个实施例中一种环形图像的字符识别流程的示意图；

[0042] 图4为一个实施例中另一种环形图像的字符识别流程的示意图；

[0043] 图5为一个实施例中另一种图像识别方法的流程示意图；

[0044] 图6为一个实施例中一种图像识别装置的结构框图；

[0045] 图7为一个实施例中一种计算机设备的内部结构图。

具体实施方式

[0046] 为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

[0047] 需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于展示的数据、分析的数据等），均为经用户授权或者经过各方充分授权的信息和数据；对应的，本申请还提供有相应的用户授权入口，供用户选择授权或者选择拒绝。

[0048] 本申请实施例提供的图像识别方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他网络服务器上。服务器104可以接收终端102发送的待识别图像，然后可以根据目标切分方向对待识别图像进行切分处理，得到切分后待识别图像，进而可以基于切分后待识别图像对应的目标识别方式进行识别，得到待识别图像的字符识别结果，并可以将该字符识别结果发送至终端102。

[0049] 其中，终端102可以但不限于是个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等，便携式可穿戴设备可为智能手表、智能手环、头戴设备等，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

[0050] 在一个实施例中，如图2所示，提供了一种图像识别方法，以该方法应用于图1中的服务器104为例进行说明，可以理解的是，该方法也可以应用于终端，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

[0051] 步骤201，获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0052] 在实际应用中，可以获取环形图像，该环形图像中可以包含以环形方式展示的字符，进而可以根据环形图像得到待识别图像，以进一步对该待识别图像进行图像识别处理。

[0053] 在一个可选实施例中，可以通过对接收到的原始环形图像进行预处理，得到待识别图像，该预处理可以包括但不限于高斯滤波、中值滤波，均值滤波、增强对比度等操作，从而可以滤除原始环形图像中的噪声等影响因素，还可以包括形态学处理，如开闭运算、膨胀、腐蚀等操作；在原始环形图像较为清晰或易于后续处理的情况下，也可以不通过预处理，将接收到的原始环形图像作为待识别图像。

[0054] 步骤202，根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0055] 其中，目标切分方向可以为预设的方向，或可以为用户输入的方向，在本实施例中不作具体限制，如目标切分方向可以为12点方向。

[0056] 作为一示例，指定形状可以为条形，如通过对环形图像进行切分处理，可以将切分后的环形图像展开为条形图像，该条形图像中的字符为水平排列方式。

[0057] 在得到待识别图像后，通过确定目标切分方向，可以对该待识别图像进行目标切分方向的切分，并可以将切分后图像展开为条形图像，得到切分后待识别图像，进而可以针对切分后待识别图像确定其对应的目标识别方式，以进一步基于该目标识别方式进行字符识别。

[0058] 例如，在确定目标切分方向为12点方向时，可以从环形图像（即待识别图像）中最小邻接矩形的上边缘中间点至最小邻接矩形的中心点位置进行切分，然后可以将切分后环形图像展开为条形图像（即切分后待识别图像）。

[0059] 在一示例中，在得到切分后待识别图像后，可以判断该切分后待识别图像是否可用，即是否适用于采用第一识别方式进行字符识别，具体的，可以将条形图像（即切分后待识别图像）输入至OCR（optical character recognition，光学字符识别）模型，进而可以通过OCR模型确定该条形图像的左侧区域和/或右侧区域中是否存在字符，其中，左侧区域为从该条形图像的左侧边缘至中线的区域，右侧区域为从该条形图像的中线至右侧边缘的区域；OCR模型可以为预先构建的深度学习OCR模型。

[0060] 在又一示例中，若条形图像中仅有一侧区域存在字符，则可以判定条形图像可用，即切分后待识别图像可以适用于采用第一识别方式进行字符识别；若条形图像中的两侧区域均存在字符，则可以判定条形图像不可用，即切分后待识别图像不适用于采用第一识别方式进行字符识别，可以通过第二识别方式进行字符识别。

[0061] 步骤203，在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0062] 在具体实现中，在确定目标识别方式为第一识别方式情况下，可以通过OCR模型对切分后待识别图像中的字符区域进行识别，如条形图像中存在字符的左侧区域或右侧区域，进而可以得到待识别图像的第一字符识别结果。

[0063] 例如，在确定条形图像中仅有一侧区域存在字符时，即针对环形图像中的原始字符，其不存在因切分处理产生的字符拆分情况，可以直接进行字符识别，OCR模型可以输出针对该条形图像进行光学字符识别所获得的字符识别结果（即第一字符识别结果），从而通过OCR模型，不仅可以确定字符在条形图像中所处的一侧位置（如左侧区域或右侧区域），还可以得到字符的识别结果。

[0064] 步骤204，在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0065] 在实际应用中，在确定目标识别方式为第二识别方式情况下，可以对切分后待识别图像中的字符区域进行调整，如可以对条形图像中存在字符的左侧区域和右侧区域进行拼接处理或重组处理，以得到调整后字符区域，进而可以根据调整后字符区域进行识别，得到待识别图像的第二字符识别结果。

[0066] 在一示例中，在确定条形图像中的两侧区域均存在字符时，即针对环形图像中的原始字符，其存在因切分处理产生的字符拆分情况，不便于直接进行字符识别，则可以对条形图像中的字符区域进行拼接，得到拼接后字符区域（即调整后字符区域），如可以根据OCR模型定位得到的字符所处区域，将条形图像的左侧区域与右侧区域拼接在一起，进而可以通过OCR模型对拼接后字符区域进行识别，得到第二字符识别结果，该第二字符识别结果可以用于表征原始环形图像中的真实字符情况。

[0067] 相较于传统方法通过计算环形图像的多个参数，根据多个参数进行切分处理，切分效率低、容易引入误差，本实施例的技术方案，通过根据目标切分方向对环形图形进行切分，将切分后环形图像展开为条形图像，可以判断条形图像是否可用，进而可以在条形图像可用的情况下直接输出字符识别结果，在条形图像不可用的情况下，可以对条形图像中的字符区域进行调整，进而可以输出字符识别结果，能够提升图像切分效率和图像识别效率。

[0068] 上述图像识别方法中，通过获取待识别图像，待识别图像为包含以环形方式展示的字符的环形图像，然后根据目标切分方向对待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定切分后待识别图像对应的目标识别方式，进而在目标识别方式为第一识别方式情况下，对切分后待识别图像中的字符区域进行识别，得到待识别图像的第一字符识别结果，在目标识别方式为第二识别方式情况下，基于切分后待识别图像中的字符区域得到调整后字符区域，对调整后字符区域进行识别，得到待识别图像的第二字符识别结果。如此，可以采用预设的一种或几种方向对环形图像进行切分，切分过程简便，无需计算环形图像的多个参数，能够避免切分过程中引入误差，提升了切分效率，且可以针对切分后图像确定对应的字符识别方式，提升了图像识别效率。

[0069] 在一个实施例中，所述根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，可以包括如下步骤：

[0070] 根据所述目标切分方向对所述待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到所述切分后待识别图像。

[0071] 在一示例中，指定形状可以为条形，通过对待识别图像进行目标切分方向的切分，并将切分后图像（即切分处理结果）展开为条形图像，可以得到切分后待识别图像，以进一步基于该切分后待识别图像进行字符识别，例如，通过对环形图像进行切分处理，可以将切分后的环形图像展开为条形图像，该条形图像中的字符为水平排列方式。

[0072] 例如，可以采用如下方式将切分后环形图像展开得到条形图像：

[0073] 1、可以确定环形的圆心和内外圆半径，如可以使用拟合的方式，通过边缘提取方法找出环形的外圆轮廓，然后以轮廓点拟合成圆，得到圆心和外圆半径R，进而可以采用相同方法找出内圆轮廓，拟合得到内圆半径r（假设环形的内外圆的圆心重叠）；

[0074] 2、所展开的条形图像的长为外圆的周长，条形图像的高为外圆与内圆的差值R‑r；

[0075] 3、以环形的圆心为原点建立一个直角坐标系（环形所在X轴和Y轴），可以设置切分后展开的条形图像的左上角点，与环形和Y轴的上下两个交点中的最高点对应，以及设置条形图像的左下角点，与环形和Y轴的上下两个交点中的最低点对应，得到条形图像与环形图像坐标的对应关系，从而可以将切分后环形图像展开得到条形图像。

[0076] 又如，具体可以采用如下方式得到条形图像与环形图像坐标的对应关系：

[0077] 3‑1、可以将条形图像的长度增加1像素，由于所展开的条形图像的长为外圆的周长，相当于外圆顺时针增加1像素；

[0078] 3‑2、可以计算出外圆增加长度1对应变化的角度alpha，即1像素外圆周长的圆弧段对应的角度；

[0079] 3‑3、以环形的圆心为原点，向环形所在Y轴方向作射线，根据该射线与环形区域的相交点，得到线段AB，其中，A为射线与环形内圆的交点，B为射线与环形外圆的交点；

[0080] 3‑4、以射线为扇形的一边，顺时针增加角度alpha得到该扇形的另一边，以另一边为新射线并重复3‑3的步骤得到新的线段；

[0081] 3‑5、基于条形图像的左上角点、左下角点，与环形和Y轴的上下两个交点的对应关系，通过将线段上的每个点映射到条形图像中，重复步骤3‑4直至经过整个环形外圆的周长，可以得到整个条形图像，若线段上的点存在亚像素情况，可以使用双线性插值方法得到对应的像素值。

[0082] 本实施例中，通过根据目标切分方向对待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到切分后待识别图像，有助于后续字符识别处理。

[0083] 在一个实施例中，所述确定所述切分后待识别图像对应的目标识别方式，可以包括如下步骤：

[0084] 判断所述切分后待识别图像是否适用于采用所述第一识别方式进行字符识别；在确认适用时，确定所述目标识别方式为所述第一识别方式；或，在确认不适用时，确定所述目标识别方式为所述第二识别方式。

[0085] 在实际应用中，在得到切分后待识别图像后，可以判断该切分后待识别图像是否可用，即是否适用于采用第一识别方式进行字符识别，可以在确认适用的情况下，采用第一识别方式进行字符识别，或，可以在确认不适用的情况下，通过第二识别方式进行字符识别。

[0086] 具体地，可以将条形图像（即切分后待识别图像）输入至OCR模型，通过OCR模型确定该条形图像的左侧区域和/或右侧区域中是否存在字符，若条形图像中仅有一侧区域存在字符，则可以判定条形图像可用，若条形图像中的两侧区域均存在字符，则可以判定条形图像不可用。

[0087] 例如，如图3所示，可以根据OCR模型确定展开的条形图像是否可用，在条形图像可用时，即切分后待识别图像可以适用于采用第一识别方式进行字符识别，可以直接输出第一字符识别结果；在条形图像不可用时，即切分后待识别图像不适用于采用第一识别方式进行字符识别，可以通过第二识别方式进行字符识别，如可以对条形图像中的字符区域进行拼接，输出第二字符识别结果。

[0088] 本实施例中，通过判断切分后待识别图像是否适用于采用第一识别方式进行字符识别，在确认适用时，确定目标识别方式为所述第一识别方式，或，在确认不适用时，确定目标识别方式为第二识别方式，可以通过判断条形图像是否可用，在不同情况下采用对应识别方式进行字符识别，提升了图像识别效率。

[0089] 在一个实施例中，所述目标切分方向为预设的N个候选切分方向中的任一候选切分方向，所述N为大于1的整数，所述在确认不适用时，确定所述目标识别方式为所述第二识别方式，可以包括如下步骤：

[0090] 在确认不适用时，判断所述N个候选切分方向中是否存在替换切分方向；所述替换切分方向为切分后图像适用于所述第一识别方式的候选切分方向；若存在所述替换切分方向，将所述替换切分方向设置为所述目标切分方向，并采用所述第一识别方式进行识别；若不存在所述替换切分方向，则采用所述第二识别方式进行识别。

[0091] 其中，可以获取N个预设的候选切分方向，并将任一候选切分方向作为目标切分方向，如通过预设一种或几种方向，可以得到N个预设的候选切分方向，进而可以将N个候选切分方向中的任一候选切分方向作为目标切分方向，以根据该目标切分方向对待识别图像进行切分处理，从而无需计算环形图像的多种参数，可以直接以固定的一种或几种方向对环形图像进行切分，使得切分过程较为简便，避免了在切分过程中引入较多误差，且在待识别图像较多的情况下，也无需针对每张图像计算多种参数以分别进行切分，可以对多张图像使用固定的一种或几种方向进行切分，能够提升图像切分效率。

[0092] 在实际应用中，如图4所示，在确定条形图像不可用的情况下（即确认不适用），可以根据是否存在替换切分方向以确定下一步骤。

[0093] 例如，若确定存在替换切分方向，可以根据替换的下一切分方向对环形图像进行切分，并采用第一识别方式识别字符，从而可以在条形图像不可用时，通过提供更多可用的切分方向，可以使得切分后展开的条形图像可用。

[0094] 又如，在确定不存在替换切分方向的情况下，可以采用第二识别方式，对条形图像中存在字符的左侧区域和右侧区域进行拼接处理或重组处理，得到调整后字符区域，进而可以根据调整后字符区域进行识别，得到待识别图像的第二字符识别结果。

[0095] 本实施例中，通过在确认不适用时，判断N个候选切分方向中是否存在替换切分方向，若存在替换切分方向，将替换切分方向设置为目标切分方向，并采用第一识别方式进行识别，若不存在替换切分方向，则采用第二识别方式进行识别，可以基于多个预设方向，针对条形图像是否可用，在不同情况下采用对应识别方式进行字符识别，提升了图像识别效率。

[0096] 在一个实施例中，所述判断所述N个候选切分方向中是否存在替换切分方向，可以包括如下步骤：

[0097] 去除所述N个候选切分方向中已使用过的候选切分方向；针对去除后的候选切分方向，判断每个候选切分方向对应的切分后图像是否适用于所述第一识别方式；将切分后图像适用于所述第一识别方式所对应的候选切分方向，作为所述替换切分方向。

[0098] 在一示例中，可以针对N个预设的候选切分方向，确定是否存在其它可用的切分方向，该其它可用的切分方向为预设方向中除之前已使用过的切分方向以外的其它方向，如之前已使用过第1个至第n个切分方向，则可以将第n+1个切分方向作为其它可用的切分方向，进而可以针对第n+1个切分方向，判断该第n+1个切分方向对应的切分后图像是否适用于第一识别方式，可以在其切分后图像适用于第一识别方式的情况下，作为替换切分方向。

[0099] 本实施例中，通过去除N个候选切分方向中已使用过的候选切分方向，然后针对去除后的候选切分方向，判断每个候选切分方向对应的切分后图像是否适用于第一识别方式，进而将切分后图像适用于第一识别方式所对应的候选切分方向，作为替换切分方向，能够使用多个预设方向进行替换，提升了图像切分效率。

[0100] 在一个实施例中，切分后待识别图像中的字符区域可以包括第一字符区域和第二字符区域，所述基于所述切分后待识别图像中的字符区域得到调整后字符区域，可以包括如下步骤：

[0101] 按照预设拼接方式，对所述第一字符区域和所述第二字符区域进行拼接，得到拼接后字符区域，作为所述调整后字符区域；或，按照预设重组方式，对所述第一字符区域和所述第二字符区域进行重组，得到重组后字符区域，作为所述调整后字符区域。

[0102] 作为一示例，第一字符区域可以为条形图像的左侧区域，如条形图像中左侧存在字符的区域；第二字符区域可以为条形图像的右侧区域，如条形图像中右侧存在字符的区域。

[0103] 在一示例中，在对条形图像中的字符区域进行拼接时，可以将第二字符区域拼接在第一字符区域之前，得到拼接后字符区域，如可以将右侧区域的右边缘与左侧区域的左边缘拼接在一起。

[0104] 在又一示例中，在确定条形图像中的两侧区域均存在字符的情况下，可以根据OCR模型直接识别出条形图像中左侧区域对应的字符和右侧区域对应的字符，进而在对条形图像中的字符区域进行重组时，可以将左侧区域对应的字符和右侧区域对应的字符进行重组，得到重组后字符所在区域，作为调整后字符区域，以进一步识别出第二字符识别结果，如可以将右侧区域对应的字符排列在左侧区域对应的字符之前，即可以使右侧区域中最后一个字符与左侧区域的第一个字符相邻排列。

[0105] 在实际应用中，通过对环形图像进行第n个方向的切分，可以将切分后环形图像展开为条形图像，然后可以在条形图像不可用的情况下，确定是否存在其它可用的切分方向，进而在确定存在其它可用的切分方向时，可以重新对环形图像进行切分，在确定不存在其它可用的切分方向时，可以对条形图像中的字符区域进行拼接或重组，得到调整后字符区域，以识别输出字符识别结果。

[0106] 本实施例中，通过按照预设拼接方式，对第一字符区域和第二字符区域进行拼接，得到拼接后字符区域，作为调整后字符区域，或，按照预设重组方式，对第一字符区域和第二字符区域进行重组，得到重组后字符区域，作为调整后字符区域，能够在条形图像不可用的情况下，对条形图像中的字符区域进行调整，有助于输出字符识别结果。

[0107] 在一个实施例中，当调整后字符区域由拼接后字符区域得到，所述对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果，可以包括如下步骤：

[0108] 确定所述拼接后字符区域的字符显示结果；所述字符显示结果用于表征所述拼接后字符区域中的字符显示为正向字符或反向字符；在所述拼接后字符区域中的字符显示为所述正向字符时，对所述正向字符进行识别，得到所述第二字符识别结果；在所述拼接后字符区域中的字符显示为所述反向字符时，将所述拼接后字符区域旋转预设角度，得到旋转后字符区域，对所述旋转后字符区域中的字符进行识别，得到所述第二字符识别结果。

[0109] 在实际应用中，由于拼接后字符区域中的字符可以为正向字符或反向字符，可以通过OCR模型，在确定拼接后字符区域中的字符为正向字符时，可以直接将OCR模型输出的字符识别结果作为第二字符识别结果；在确定拼接后字符区域中的字符为反向字符时，可以将拼接后字符区域进行180度旋转（即预设角度），然后根据OCR模型对旋转后的字符区域进行识别，得到第二字符识别结果。

[0110] 在一个可选实施例中，判断拼接后字符区域中的字符为正向字符或反向字符的方式可以包括但不限于：方式一，可以根据环形图像的类型确定，如环形图像中的字符排列方式；方式二，可以根据OCR模型判定为正向字符或反向字符，如若判定结果是期望结果，则可以确认为正向字符，否则可以确认为反向字符，该期望结果可以包括字符格式满足预设格式、或识别到的字符未重复出现、或识别到的字符已记录在预设数据库中且未重复出现等。

[0111] 本实施例中，通过确定拼接后字符区域的字符显示结果，在拼接后字符区域中的字符显示为正向字符时，对正向字符进行识别，得到第二字符识别结果，在拼接后字符区域中的字符显示为反向字符时，将拼接后字符区域旋转预设角度，得到旋转后字符区域，对旋转后字符区域中的字符进行识别，得到第二字符识别结果，能够灵活针对拼接后字符区域中的字符情况进行识别。

[0112] 在一个实施例中，如图5所示，提供了另一种图像识别方法的流程示意图。本实施例中，该方法包括以下步骤：

[0113] 在步骤501中，获取待识别图像；待识别图像为包含以环形方式展示的字符的环形图像。在步骤502中，根据目标切分方向对待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到切分后待识别图像。在步骤503中，判断切分后待识别图像是否适用于采用第一识别方式进行字符识别。在步骤504中，在确认适用时，确定目标识别方式为第一识别方式。在步骤505中，目标切分方向为预设的N个候选切分方向中的任一候选切分方向，N为大于1的整数，在确认不适用时，判断N个候选切分方向中是否存在替换切分方向。在步骤506中，若存在替换切分方向，将替换切分方向设置为目标切分方向，并采用第一识别方式进行识别。在步骤507中，若不存在替换切分方向，则采用第二识别方式进行识别，基于切分后待识别图像中的字符区域得到调整后字符区域，对调整后字符区域进行识别，得到待识别图像的第二字符识别结果。需要说明的是，上述步骤的具体限定可以参见上文对一种图像识别方法的具体限定，在此不再赘述。

[0114] 应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

[0115] 基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的图像识别方法的图像识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个图像识别装置实施例中的具体限定可以参见上文中对于图像识别方法的限定，在此不再赘述。

[0116] 在一个实施例中，如图6所示，提供了一种图像识别装置，包括：

[0117] 图像获取模块601，用于获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0118] 图像切分模块602，用于根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0119] 第一识别模块603，用于在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0120] 第二识别模块604，用于在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0121] 在一个实施例中，所述图像切分模块602包括：

[0122] 切分后展开子模块，用于根据所述目标切分方向对所述待识别图像进行切分处理，并将切分处理结果展开为指定形状，得到所述切分后待识别图像。

[0123] 在一个实施例中，所述图像切分模块602包括：

[0124] 图像适用判断子模块，用于判断所述切分后待识别图像是否适用于采用所述第一识别方式进行字符识别；

[0125] 目标识别方式得到子模块，用于在确认适用时，确定所述目标识别方式为所述第一识别方式；或，在确认不适用时，确定所述目标识别方式为所述第二识别方式。

[0126] 在一个实施例中，所述目标切分方向为预设的N个候选切分方向中的任一候选切分方向，所述N为大于1的整数，所述目标识别方式得到子模块包括：

[0127] 替换方向判断单元，用于在确认不适用时，判断所述N个候选切分方向中是否存在替换切分方向；所述替换切分方向为切分后图像适用于所述第一识别方式的候选切分方向；

[0128] 存在替换方向单元，用于若存在所述替换切分方向，将所述替换切分方向设置为所述目标切分方向，并采用所述第一识别方式进行识别；

[0129] 不存在替换方向单元，用于若不存在所述替换切分方向，则采用所述第二识别方式进行识别。

[0130] 在一个实施例中，所述替换方向判断单元包括：

[0131] 已使用方向去除子单元，用于去除所述N个候选切分方向中已使用过的候选切分方向；

[0132] 方向可用判定子单元，用于针对去除后的候选切分方向，判断每个候选切分方向对应的切分后图像是否适用于所述第一识别方式；

[0133] 替换方向得到子单元，用于将切分后图像适用于所述第一识别方式所对应的候选切分方向，作为所述替换切分方向。

[0134] 在一个实施例中，所述切分后待识别图像中的字符区域包括第一字符区域和第二字符区域，所述第二识别模块604包括：

[0135] 调整后字符区域得到子模块，用于按照预设拼接方式，对所述第一字符区域和所述第二字符区域进行拼接，得到拼接后字符区域，作为所述调整后字符区域；或，按照预设重组方式，对所述第一字符区域和所述第二字符区域进行重组，得到重组后字符区域，作为所述调整后字符区域。

[0136] 在一个实施例中，当所述调整后字符区域由所述拼接后字符区域得到，所述第二识别模块604包括：

[0137] 字符显示结果确定子模块，用于确定所述拼接后字符区域的字符显示结果；所述字符显示结果用于表征所述拼接后字符区域中的字符显示为正向字符或反向字符；

[0138] 正向字符处理子模块，用于在所述拼接后字符区域中的字符显示为所述正向字符时，对所述正向字符进行识别，得到所述第二字符识别结果；

[0139] 负向字符处理子模块，用于在所述拼接后字符区域中的字符显示为所述反向字符时，将所述拼接后字符区域旋转预设角度，得到旋转后字符区域，对所述旋转后字符区域中的字符进行识别，得到所述第二字符识别结果。上述图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。

[0140] 上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

[0141] 在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像识别数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别方法。

[0142] 本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

[0143] 在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

[0144] 获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0145] 根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0146] 在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0147] 在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0148] 在一个实施例中，处理器执行计算机程序时还实现上述其他实施例中的图像识别方法的步骤。

[0149] 在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

[0150] 获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0151] 根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0152] 在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0153] 在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0154] 在一个实施例中，计算机程序被处理器执行时还实现上述其他实施例中的图像识别方法的步骤。

[0155] 在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

[0156] 获取待识别图像；所述待识别图像为包含以环形方式展示的字符的环形图像；

[0157] 根据目标切分方向对所述待识别图像进行切分处理，得到具有指定形状的切分后待识别图像，并确定所述切分后待识别图像对应的目标识别方式；

[0158] 在所述目标识别方式为第一识别方式情况下，对所述切分后待识别图像中的字符区域进行识别，得到所述待识别图像的第一字符识别结果；

[0159] 在所述目标识别方式为第二识别方式情况下，基于所述切分后待识别图像中的字符区域得到调整后字符区域，对所述调整后字符区域进行识别，得到所述待识别图像的第二字符识别结果。

[0160] 在一个实施例中，计算机程序被处理器执行时还实现上述其他实施例中的图像识别方法的步骤。

[0161] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read‑Only Memory，ROM）、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器（ReRAM）、磁变存储器（Magnetoresistive Random Access Memory，MRAM）、铁电存储器（Ferroelectric Random Access Memory，FRAM）、相变存储器（Phase Change Memory，PCM）、石墨烯存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random Access Memory，SRAM）或动态随机存取存储器（Dynamic Random Access Memory，DRAM）等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

[0162] 以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

[0163] 以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

图像识别方法、装置、计算机设备和存储介质转让专利

申请号 : CN202211602503.7

文献号 : CN115620299B

文献日 : 2023-03-21

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 周相如 , 李睿宇 , 吕江波 , 沈小勇

申请人 : 深圳思谋信息科技有限公司

摘要 :

权利要求 :

说明书 :