一种自动生成数据采集模块的方法和系统转让专利

申请号 : CN202010145569.2

文献号 : CN111369290B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨国唯吴连旺李韶辉

申请人 : 广州快决测信息科技有限公司

摘要 :

本申请实施例公开了一种自动生成数据采集模块的方法和系统。所述自动生成数据采集模块的方法包括:输入终端输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息;所述转换终端根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所述识别结果将所述至少一个待转换数据转换成目标数据;数据生成端至少基于所述目标数据生成数据采集模块。本申请通过可以识别出多个待识别数据中的标识信息,确定多个每一个题目的题目类型、题目内容及题目选项所包含的内容,将多个待转换数据转换成问卷调查格式的题目内容,可以提高录入问卷题目的效率及用户体验。

权利要求 :

1.一种自动生成数据采集模块的方法,其特征在于,包括:输入终端输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换终端;

其中,所述至少一个待转换数据中的每一个包含至少一个标识信息,所述至少一个标识信息包括切换标识和/或类型标识;

所述转换终端根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;

根据所述识别结果将所述至少一个待转换数据转换成目标数据;

数据生成端至少基于所述目标数据生成数据采集模块;

所述转换终端根据接收到的所述待转换数据识别所述至少一个标识信息,得到识别结果包括:

当所述标识信息为所述类型标识,先通过识别得到所述待转换数据中的所述类型标识,再通过语言识别模型识别所述类型标识中的文字得到所述识别结果,所述识别结果为所述待转换数据所属题目类型;

当所述标识信息为所述切换标识,通过识别出所述切换标识的位置及个数得到识别结果;

所述通过识别出所述切换标识的位置及个数得到识别结果包括:基于第一个所述切换标识对题目与选项之间进行切换,后续的所述切换标识对选项与选项之间进行切换;

所述根据所述识别结果将所述至少一个待转换数据转换成目标数据包括:根据所述识别结果确定所述至少一个待转换数据的转换类型,其中,所述待转换数据的转换类型包括单选题、填空题、多选题、排序题、评分题或矩阵题,在识别结果未识别出一个待转换数据的题目类型时,则确定所述待转换数据的转换类型为预设的类型;基于所述转换类型提取对应的转换策略;基于对应的所述转换策略和所述识别结果将所述至少一个待转换数据转换成目标数据;

所述基于所述转换类型提取对应的转换策略包括:根据所述识别结果中的题目类型,提取所述题目类型对应的转换规则作为所述对应的转换策略;其中,当所述题目类型为矩阵题时,所述对应的转换规则为第一行为矩阵题目,每个矩阵题目使用至少一个空格字符进行拆分识别,第二行及以后行数开始为矩阵选项。

2.根据权利要求1所述的方法,其特征在于,所述根据所述识别结果将所述至少一个待转换数据转换成目标数据包括:根据所述识别结果确定切换方式;

基于所述切换方式对所述至少一个待转换数据进行切换。

3.根据权利要求1所述的方法,在所述输入终端的界面上同时显示输入的所述待转换数据和转换后的所述目标数据。

4.根据权利要求3所述的方法,还包括:所述输入终端根据所述界面上显示的所述目标数据生成修订指令;

所述转换终端根据所述修订指令定位到不满足预设要求的第一目标数据对应的第一待转换数据;

所述输入终端根据所述修订指令对所述第一待转换数据进行修订。

5.一种自动生成数据采集模块的系统,其特征在于,包括:输入终端,用于输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息,所述至少一个标识信息包括切换标识和/或类型标识;

所述转换终端,用于根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所述识别结果将所述至少一个待转换数据转换成目标数据;

所述转换终端还用于:

当所述标识信息为所述类型标识,先通过识别得到所述待转换数据中的所述类型标识,再通过语言识别模型识别所述类型标识中的文字得到所述识别结果,所述识别结果为所述待转换数据所属题目类型;

当所述标识信息为所述切换标识,通过识别出所述切换标识的位置及个数得到识别结果;

所述转换终端还用于:

基于第一个所述切换标识对题目与选项之间进行切换,后续的所述切换标识对选项与选项之间进行切换;

其中,所述转换终端还用于:

根据所述识别结果确定所述至少一个待转换数据的转换类型,其中,所述待转换数据的转换类型包括单选题、填空题、多选题、排序题、评分题或矩阵题,在识别结果未识别出一个待转换数据的题目类型时,则确定所述待转换数据的转换类型为预设的类型;基于所述转换类型提取对应的转换策略;基于对应的所述转换策略和所述识别结果将所述至少一个待转换数据转换成目标数据;

所述转换终端还用于:

根据所述识别结果中的题目类型,提取所述题目类型对应的转换规则作为所述对应的转换策略;其中,当所述题目类型为矩阵题时,所述对应的转换规则为第一行为矩阵题目,每个矩阵题目使用至少一个空格字符进行拆分识别,第二行及以后行数开始为矩阵选项;

数据生成端,用于至少基于所述目标数据生成数据采集模块。

6.根据权利要求5所述的系统,其特征在于,所述转换终端用于:根据所述识别结果确定切换方式;

基于所述切换方式对所述至少一个待转换数据进行切换。

7.根据权利要求5所述的系统,所述输入终端用于:在所述输入终端的界面上同时显示输入的所述待转换数据和转换后的所述目标数据。

8.根据权利要求7所述的系统,还包括:所述输入终端用于获取修订指令;

所述转换终端用于根据所述修订指令定位到不满足预设要求的第一目标数据对应的第一待转换数据;

所述输入终端用于对所述第一待转换数据进行修订。

9.一种自动生成数据采集模块的装置,包括处理器,其特征在于,所述处理器用于执行如权利要求1~4任一项所述的方法。

10.一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如权利要求1~4任一项所述的方法。

说明书 :

一种自动生成数据采集模块的方法和系统

技术领域

[0001] 本申请涉及数据转换技术领域,特别涉及一种自动生成数据采集模块的方法和系统。

背景技术

[0002] 近年来,调查问卷已大量普及人民的日常生活中,重点体现在互联网上的众多调查问卷网站,调查问卷作为针对某种信息进行调查、统计的重要手段。
[0003] 目前主流的调查问卷生成方法主要通过在问卷系统中进行每一道问卷题目信息的输入,如题目内容、题目选项、题目类型等,通过此方法录入众多调查问卷题目时,通常需
要花费大量的时间成本及人力成本,录入调查问卷题目的效率低下,用户体验不佳。

发明内容

[0004] 本说明书实施例的一个方面提供一种自动生成数据采集模块的方法。所述方法包括:所述输入终端输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换终
端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息;所述转换终端根据
接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所述识别结果将所
述至少一个待转换数据转换成目标数据;数据生成端至少基于所述目标数据生成数据采集
模块。
[0005] 本说明书实施例的另一个方面提供一种自动生成数据采集模块的系统。所述系统包括:输入终端,用于输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换
终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息;所述转换终端,
用于根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所述识别
结果将所述至少一个待转换数据转换成目标数据;数据生成端,用于至少基于所述目标数
据生成数据采集模块。
[0006] 本说明书实施例的另一个方面提供一种自动生成数据采集模块的装置,包括处理器,所述处理器用于执行自动生成数据采集模块的方法。
[0007] 本说明书实施例的另一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行自动生成数据采集模
块的方法。

附图说明

[0008] 本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
[0009] 图1是根据本申请一些实施例所示的自动生成采集模块的系统的应用场景示意图;
[0010] 图2是根据本申请一些实施例所示的自动生成采集模块的系统的模块图;
[0011] 图3是根据本申请一些实施例所示的自动生成采集模块的方法的示例性流程图;
[0012] 图4是根据本申请一些实施例所示的步骤304的子步骤的示例性流程图。

具体实施方式

[0013] 为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,
对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将
本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表
相同结构或操作。
[0014] 应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,
则可通过其他表达来替换所述词语。
[0015] 如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包
括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备
也可能包含其它的步骤或元素。
[0016] 本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理
各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操
作。
[0017] 图1是根据本申请一些实施例所示的自动生成数据采集模块的系统的应用场景示意图。
[0018] 自动生成数据采集模块系统100可以实现将多道题目同时转换成相应问卷调查格式的题目。例如,自动生成数据采集模块系统100可以用于调查问卷领域,具体的,可以对输
入的多个待转换数据进行识别,识别出其中的标识信息,确定识别结果,即每道题目的题目
类型、题目内容和题目选项所对应的内容,根据识别结果将多个待转换数据转换成调查问
卷格式所对应的题目类型、题目内容和题目选项,可以将转换后的数据直接录入调查问卷
中的题目内容,提高录入问卷题目的效率。
[0019] 自动生成数据采集模块系统100可以是用于互联网服务的线上服务平台。例如,该通过自动生成数据采集模块系统100可以用于线上的问卷调查平台。自动生成数据采集模
块系统100可以包含服务器110、网络120、输入终端130和数据库140。服务器110可包含处理
设备112。
[0020] 在一些实施例中,服务器110可以用于处理自动生成数据采集模块相关的信息和/或数据。例如,服务器110可以对输入终端输入的需要转换的数据(如,用户通过输入终端输
入的题目数据)进行转换。服务器110可以是独立的服务器或者服务器组。该服务器组可以
是集中式的或者分布式的(如:服务器110可以是分布系统)。在一些实施例中该服务器110
可以是区域的或者远程的。例如,服务器110可通过网络访问存储于输入终端130、数据库
140中的信息和/或资料。在一些实施例中,服务器110可直接与输入终端130、数据库140直
接连接以访问存储于其中的信息和/或资料。在一些实施例中,服务器110可在云平台上执
行。例如,该云平台可包括私有云、公共云、混合云、社区云、分散式云、内部云等中的一种或
其任意组合。
[0021] 在一些实施例中,服务器110可包含处理设备112。该处理设备112可处理与生成数据采集模块相关的数据和/或信息以执行一个或多个本申请中描述的功能。例如处理设备
112可以识别输入终端130输入的待转换数据的类型(如,确定输入的题目数据的题目属于
单选题或多选题等)。在一些实施例中,处理设备112可包含一个或多个子处理设备(例如,
单芯处理设备或多核多芯处理设备)。仅仅作为范例,处理设备112可包含中央处理器
(CPU)、专用集成电路(ASIC)、专用指令处理器(ASIP)、图形处理器(GPU)、物理处理器
(PPU)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编辑逻辑电路(PLD)、控制器、
微控制器单元、精简指令集电脑(RISC)、微处理器等或以上任意组合。
[0022] 网络120可促进数据和/或信息的交换,数据和/或信息可以包括输入终端130发送给服务器110需要进行识别的多个待转换数据,例如,多道题目数据。在一些实施例中,自动
生成数据采集模块系统100中的一个或多个组件(服务器110、输入终端130、数据库140)可
通过网络120发送数据和/或信息给自动生成数据采集模块系统100中的其他组件。在一些
实施例中,网络120可是任意类型的有线或无线网络。例如,网络120可包括缆线网络、有线
网络、光纤网络、电信网络、内部网络、网际网络、区域网络(LAN)、广域网络(WAN)、无线区域
网络(WLAN)、都会区域网络(MAN)、公共电话交换网络(PSTN)、蓝牙网络、ZigBee网络、近场
通讯(NFC)网络等或以上任意组合。在一些实施例中,网络120可包括一个或多个网络进出
点。例如,网络120可包含有线或无线网络进出点,如基站和/或网际网络交换点120‑1、120‑
2、…,通过这些进出点,自动生成数据采集模块系统100的一个或多个组件可连接到网络
120上以交换数据和/或信息。
[0023] 输入终端130可以是一种具有输入数据功能的设备的终端,可包括手机130‑1、平板电脑130‑2、笔记本电脑130‑3等中的一种或任意组合。在一些实施例中,输入终端130可
包括具有发送数据功能的装置,在获取到输入的多个待转换数据时,将数据发送给服务器
110。在一些实施例中,输入终端130可以通过网络120将数据发送送给服务器110。例如,输
入终端130可以通过网络120将多道待转换的题目数据发送给送给服务器110。
[0024] 数据库140是用于为系统100提供信息的来源。数据库140可以用于系统100提供与服务相关的信息,例如,多种不同领域的题目,不同题目类型的题目,不同题目内容的题目
等。又例如,数据库140还可以包括针对于一个特定领域的所有题目等。该特定领域可以是
医疗、传媒、科技领域。数据库140可以在单个中央服务器、通过通信链路连接的多个服务器
或多个个人设备中实现。数据库140可以由多个个人设备和云服务器生成。在一些实施例
中,数据库140可存储转换后的目标数据。例如,转换成的一系列调查问卷题目格式的题目。
在一些实施例中,数据库140可以存储基于目标数据生成的数据采集模块。例如,生成的问
卷。在一些实施例中,数据库140可存储供服务器110执行或使用的信息和/或指令,以执行
本申请中描述的示例性方法。在一些实施例中,数据库140可包括大容量存储器、可移动存
储器、挥发性读写存储器(例如,随机存取存储器RAM)、只读存储器(ROM)等或以上任意组
合。在一些实施例中,数据库140可在云平台上实现。例如,该云平台可包括私有云、公共云、
混合云、社区云、分散式云、内部云等或以上任意组合。
[0025] 在一些实施例中,数据库140可与网络120连接以与系统100的一个或多个组件(例如,服务器110、输入终端130等)通讯。自动生成数据采集模块系统100的一个或多个组件可
通过网络120访问存储于数据库140中的资料或指令,例如,针对于某款洗发水的一系列题
目信息;或针对于某款综艺观众满意度的一系列题目信息等。在一些实施例中,数据库140
可直接与自动生成数据采集系统100中的一个或多个组件(例如,服务器110、输入终端130
等)连接或通讯。在一些实施例中,数据库140可以是服务器110的一部分。
[0026] 图2是根据本申请一些实施例所示的自动生成数据采集模块的系统的模块图。
[0027] 如图2所示,该自动生成数据采集模块的系统可以包括输入终端210、转换终端220、数据生成端230。
[0028] 输入终端210可以用于输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息。
[0029] 转换终端220可以用于根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所述识别结果将所述至少一个待转换数据转换成目标数据。
[0030] 数据生成端230可以用于至少基于所述目标数据生成数据采集模块。
[0031] 在一些实施例中,转换终端还用于根据所述识别结果确定所述至少一个待转换数据的转换类型;基于所述转换类型提取对应的转换策略;基于对应的所述转换策略和所述
识别结果将所述至少一个待转换数据转换成目标数据。
[0032] 在一些实施例中,转换终端220还用于根据所述识别结果确定切换方式;基于所述切换方式对所述至少一个待转换数据的切换。
[0033] 在一些实施例中,在所述输入终端210的界面上同时显示输入的所述待转换数据和转换后的所述目标数据。
[0034] 在一些实施例中,所述输入终端210根据所述界面上显示的所述目标数据生成修订指令;所述转换终端220根据所述修订指令定位到不满足预设要求的第一目标数据对应
的第一待转换数据;所述输入终端210根据所述修订指令对所述第一待转换数据进行修订。
[0035] 在一些实施例中,所述至少一个标识信息包括切换标识和/或类型标识。
[0036] 应当理解,图2所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可
以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微
处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计
算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD‑ROM的
载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据
载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门
阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等
的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实
现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
[0037] 需要注意的是,以上对于候选项显示、确定系统及其模块的描述,仅为描述方便,并不能把本申请限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了
解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成
子系统与其他模块连接。例如,在一些实施例中,例如,图2中披露的输入终端210、转换终端
220和数据生成端230可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或
两个以上模块的功能。例如,输入终端210、转换终端220可以是两个模块,也可以是一个模
块同时具有输入和转换功能。
[0038] 图3是根据本申请一些实施例所示的一种自动生成数据采集模块的方法的示例性图。
[0039] 步骤302,输入终端输入至少一个待转换数据,并将所述至少一个待转换数据发送给转换终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息。具体的,
该步骤302可以由输入终端210执行。
[0040] 输入终端可以是任意一种具有数据输入功能的终端,例如手机、电脑等。
[0041] 待转换数据可以是输入的需要进行转换的文字信息以及字符信息,例如输入文字、数字、字母、符号或标点等。在一些实施例中,待转换数据可以是用户通过输入终端输入
的问卷题目内容,该内容可以包括题目内容及题目选项。例如,用户输入的内容可以是一道
选择题,或者是多道题目,多道题目可以包括选择题、填空题、排序题及各个题目中包括的
题目内容、题目选项。
[0042] 转换终端可以是任意一种具有数据转换功能的终端,例如手机、电脑等,这些终端中的一些可以具有数据转换功能的程序。
[0043] 标识信息可以代表待转换数据某种信息。在一些实施例中,标识信息可以由一种或者多种字符组成,其中,字符包括但不限于数字、字母、标点、文字、其他字符等任意字符。
例如,标识信息可以由一个或者多个换行字符代表。
[0044] 在一些实施例中,标识信息可以包括但不限于切换标识、类型标识。切换标识可以是用于实现不同内容之间的切换的标识。在一些实施例中,切换标识可以包括但不限于题
目与题目之间的切换、题目与选项之间的切换、选项与选项之间的切换或文字与图片之间
的切换等。在一些实施例中,可以通过字符代表切换标识。例如,键盘上的‘enter’字符,第
一个‘enter’字符代表题目与选项之间的切换,第二个或以上的‘enter’字符相当于选项与
选项之间的切换,两个或两个以上的连续‘enter’字符相当于题目与题目之间的切换。
[0045] 类型标识可以是用于实现识别出内容所属类型的标识。在一些实施例中,可以识别出的题目类型包括但不限于单选题、多选题、填空题、排序题、PK题、评分题和矩阵题。在
一些实施例中,可以通过字符代表类型标识。例如,键盘上的‘【】’或‘[]’字符,在‘【】’或
‘[]’中包括的文字即为每道题目的题目类型,比如,“【单选题】”、“【多选题】”或“[排序
题]”,则说明该题目为单选题或者多选题又或者排序题。
[0046] 在一些实施例中,输入终端输入至少一个待转换数据,并将至少一个待转换数据发送给转换终端;其中,所述至少一个待转换数据中的每一个待转换数据包含至少一个标
识信息。在一些实施例中,输入终端可以通过键盘、手写屏幕等输入装置输入待转换数据。
又或者通过复制粘贴其他文档中的待转换数据,通过输入终端粘贴至相应的位置。在一些
实施例中,可以通过将某个文档中的众多问卷调查题目一起复制到输入终端中,通过在输
入终端中的众多问卷调查题目进行适应性修改(可以是添加切换标识和、类型标识),由此
使转换终端可以从众多问卷调查题目中识别出每一道题目的题目类型、题目内容及题目选
项,可以同时将批量导入的众多问卷调查题目进行转换。
[0047] 例如,从电脑端输入“请问你的年龄是?(换行)18‑24岁(换行)24‑38岁【单选题】”,其中,在输入的内容中存在题目与选项的切换标识(对应键盘中的第一个‘enter’,即第一
个换行字符)、选项与选项的切换标识(第二个及以后‘enter’,即第二个及以后的换行字
符)以及题目的类别标识(‘【】’)。又例如,从电脑端输入“请问你的年龄是?(换行)18‑24岁
(换行)24‑38岁【单选题】(两个连续换行)请问你的职业是______?【填空题】”。其中,标识包
括题目与选项的切换标识(第一个换行符号‘enter’)、选项与选项的切换标识(第二个或以
后的换行符号_‘enter’)、两个或两个以上的连续切换标识(即‘enter enter’)和类型标识
(“【单选题】”和“【填空题】”)。
[0048] 步骤304,所述转换终端根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所述识别结果将所述至少一个待转换数据转换成目标数据。具体的,该步
骤304可以由转换终端220执行。
[0049] 识别结果可以是转换终端识别出输入的待识别数据中的至少一个标识信息的结果。例如,转换终端识别出输入数据中的切换标识、类别标识,得到输入数据中的题目类型、
题目内容及题目选项中相应的部分,作为识别结果。
[0050] 目标数据可以是将待转换数据换成的最终数据。在一些实施例中,目标数据可以是根据用户从输入终端输入的题目内容转化成符合要求的题目,例如,调查问卷中的题目,
转化后的题目需要满足调查问卷的格式要求。先对输入终端输入的需要转换成调查问卷格
式的内容进行识别,根据识别得到的题目类型、题目内容及题目选项所对应的部分,将输入
的数据转换成与调查问卷格式要求相同的题目类型、题目内容及题目选项,作为最终数据。
[0051] 在一些实施例中,转换终端根据接收到的待转换数据识别至少一个标识信息,得到识别结果。在一些实施例中,可以先通过识别得到待转换数据中的‘【】’或‘{}’(类别标
识),再识别到里面的文字(待转换数据所属题目类型)。在一些实施例中,可以通过语言识
别模型识别类型的文字,确定何种题型。在一些实施例中,可以通过识别出‘enter’(切换标
识)的位置(第几个‘enter’)及个数得到识别结果。在一些实施例中,根据识别结果中的识
别到的切换标识确定切换方式,基于切换方式对至少一个待转换数据的切换。例如,当识别
到两个或两个以上的换行符号(换行符号可以是‘enter’)时,则对待转换数据进行切换。可
以是每个待转换数据之间会设有两个换行符号,由此可以将多个待转换数据(每道题)进行
切换、区分。
[0052] 在一些实施例中,转换终端可以根据所述识别结果将所述至少一个待转换数据转换成目标数据。例如,输入的数据为“请问你的年龄是(换行)18‑24岁(换行)25‑38岁【单选
题】”,数据转换软件可以通过识别到该数据中包含的切换标识(第一个enter换行字符为题
目与选项之间的切换、后续的enter、换行字符则为选项与选项之间的切换)和类型标识
(【单选题】),得到题目类型为单选题,题目内容为“请问你的年龄是”,题目选项为“18‑24
岁”以及“25‑38岁”,作为识别结果。根据该识别结果将输入的这段数据转换成题目类型为
单选题,题目内容为“请问你的年龄是”以及题目选项为“A、18‑24岁B、25‑38岁”作为目标数
据。转换成的这个题目可以作为问卷调查或问卷统计之类的问卷题目,客户可以通过在该
问卷中根据此问卷题目进行作答,已达到关于该问卷的调查及统计等效果。
[0053] 在一些实施例中,在输入终端的界面上同时显示输入的待转换数据和转换后的所述目标数据。例如,将输入的多个题目与转换后的多个题目内容在电脑终端显示界面上进
行显示,使用户可以观察到输入的题目与转换后的题目的内容是否一致,或者转换后的题
目是否符合要求等,并根据观察结果确定是否需要对输入的待转换数据进行修改。
[0054] 修订指令可以是代表需要目标数据重新转换的指令,也代表需要对待转换数据进行修改的指令。第一待转换数据可以是指需要修改的转换数据,或转换成不满足预设要求
的目标数据对应的待转换数据。
[0055] 在一些实施例中,输入终端可以根据界面上显示的目标数据生成修订指令。具体的,若转换后的目标数据不满足预设要求(即,第一待转换数据),用户可以通过输入终端生
成修订指令。其中,预设要求可以是根据标识信息的设置所预设的题目类型、题目内容及题
目选项各自所包含的部分。
[0056] 在一些实施例中,可以通过双击输入终端的界面上不符合要求的目标数据生成修订指令。在一些实施例中,可以通过在输入终端中输入题目编号生成修订指令。还可以通过
其他方式生成修订指令,本实施例不做限制。
[0057] 在一些实施例中,转换终端可以根据修订指令定位到不满足预设要求的第一目标数据对应的第一待转换数据。例如,转换终端接收到输入终端发送的修订指令后,转换终端
可以将鼠标的位置定位到对应的第一待转换数据,从而可以方便输入终端修改。
[0058] 在一些实施例中,输入终端根据修订指令对第一待转换数据进行修订。例如,电脑终端显示界面显示的待转换数据为“请问你的年龄是18‑24岁(换行)25‑38岁【单选题】”,显
示的目标数据中的题目内容为“请问你的年龄是18‑24岁”,题目选项为“25‑38岁”。用户可
以从显示的内容中发现本来是题目选项A的“18‑24岁”转换后出现在题目内容里,导致转换
后的题目内容及题目选项错误。
[0059] 用户可以通过输入终端生成修订指令,例如,在“请问你的年龄是”与“18‑24岁”之间加上一个切换标识(可以是‘enter’),生成修订指令,转换终端根据修订指令对待转换数
据进行修订,生成正确的目标数据,为题目内容为“请问你的年龄是”,题目选项为“18‑24
岁”和“25‑38岁”。
[0060] 步骤306,数据生成端至少基于所述目标数据生成数据采集模块。具体的,该步骤306可以由数据生成端230执行。
[0061] 数据生成端可以是用于生成某一种数据类型的终端,例如,生成问卷形式的软件或其他的电脑应用。
[0062] 数据采集模块可以是一种承载某一种数据内容的模块,例如,承载问卷形式及问卷内容的模块。
[0063] 在一些实施例中,数据生成端至少基于所述目标数据生成数据采集模块。例如,基于目标数据所包括的内容信息,生成问卷形式的内容。生成的问卷形式内容中的数据格式
可以与互联网中问卷网站的数据格式一致,生成的承载问卷形式内容的数据采集模块可以
应用于互联网中的任意格式相同的问卷网站。
[0064] 图4是根据本申请一些实施例所示的步骤304的子步骤的示例性流程图。
[0065] 步骤402,根据所述识别结果确定所述至少一个待转换数据的转换类型。具体的,该步骤402可以由转换终端220执行。
[0066] 转换类型可以是每一个待转换数据需要转换成的目标类型。例如多个待转换数据为多道题目及其中的内容,目标类型可以是单选题、多选题、评分题、填空题等。
[0067] 在一些实施例中,根据所述识别结果确定所述至少一个待转换数据的转换类型。其中可以确定出的转换类型为单选题、多选题、填空题、排序题、PK题、评分题或矩阵题。例
如,识别结果中该题目的题目类型为单选题,或为多选题,或为填空题,或为排序题,或为PK
题,或为评分题,或为矩阵题,确定出一个或多个题目中的每道题目类型为上述多种类型中
的一种。
[0068] 在一些实施例中,在识别结果未识别出一个待转换数据(一道题目)的题目类型时,则确定该待转换数据的转换类型预设的类型,如单选题或填空题。例如,输入的待转换
数据为“请问你对该商品的满意程度为______,在______方面还需要提升。”其中输入的数
据中没有题目类型标识“【】”或“{}”,转换终端也就无法从待转换数据中识别到类型标识,
则自动将待转换数据识别成单选题或者填空题的题目类型。单选题与填空题第一行均为题
目内容,而在有第二行的情况下(例如,单选题),则第二行内容为题目选项;而在没有第二
行的情况下(例如,填空题等),则只识别出该题目的题目内容。
[0069] 步骤404,基于所述转换类型提取对应的转换策略。具体的,该步骤404可以由转换终端220执行。
[0070] 转换策略可以是每种类型的题目会有相应的转换规则,例如,单选题、多选题、填空题类型具有相应的转换规则,评分题类型具有评分题类型的转换规则,矩阵题类型具有
矩阵题类型的转换规则。
[0071] 在一些实施例中,基于转换类型提取对应的转换策略。例如当识别结果中的题目类型为单选题时,则提取单选题对应的转换规则;若题目类型为评分题时,则提取评分题对
应的转换规则。
[0072] 在一些实施例中,单选题、多选题等的转换规则可以是第一行(第一个‘enter’前)为题目内容,第二行及后面的行数(第一个‘enter’后的每一个‘enter’前)为每个题目选项
内容。又如,评分题的转换规则可以是第一行为评分选项,在待转换数据的第一行中需匹配
‘1‑10’、‘1‑10分’、‘1~10’和‘1~10分’中的其中一种。又如矩阵题的转换规则可以是第一
行为矩阵题目,每个题目可以使用一个或多个空格字符进行拆分识别,第二行及以后行数
开始为矩阵选项。
[0073] 步骤406,基于对应的所述转换策略和所述识别结果将所述至少一个待转换数据转换成目标数据。具体的,该步骤406可以由转换终端220执行。
[0074] 在一些实施例中,基于每个待转换数据对应的转换策略和识别结果,将至少一个待转换数据转换成目标数据。例如,输入的待转换数据为“请问你的年龄是(换行)18‑24岁
(换行)25‑38岁【单选题】”,识别出的该待转换数据为单选题类型,则提取单选题的转换策
略为第一行(第一个‘enter’前)为题目内容,第二行及后面的行数(第一个‘enter’后的每
一个‘enter’前)为题目选项内容。基于转换策略及识别结果将输入的转换数据转换成题目
类型为“单选题”,题目内容为“请问你的年龄是”,题目选项为“18‑24岁”和“25‑38岁”作为
目标数据。
[0075] 在一些实施例中,本申请提供一种自动生成数据采集模块的装置,该装置包括处理器,其中处理器用于执行上述的自动生成数据采集模块的方法。
[0076] 本说明书实施例还提供一种装置,其至少包括处理器以及存储器。所述存储器用于存储指令。当所述指令被所述处理器执行时,导致所述装置实现自动生成数据采集模块
的方法。所述方法可以包括:输入终端输入至少一个待转换数据,并将所述至少一个待转换
数据发送给转换终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息;
所述转换终端根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据
所述识别结果将所述至少一个待转换数据转换成目标数据;数据生成端至少基于所述目标
数据生成数据采集模块。
[0077] 本说明书实施例还提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,所述计算机执行自动生成数据采集模块的
方法。所述方法可以包括:输入终端输入至少一个待转换数据,并将所述至少一个待转换数
据发送给转换终端;其中,所述至少一个待转换数据中的每一个包含至少一个标识信息;所
述转换终端根据接收到的待转换数据识别所述至少一个标识信息,得到识别结果;根据所
述识别结果将所述至少一个待转换数据转换成目标数据;数据生成端至少基于所述目标数
据生成数据采集模块。
[0078] 本申请实施例可能带来的有益效果包括但不限于:(1)通过可以识别出多个待识别数据中的标识信息,获取到多个待识别数据中的每一个题目的题目类型、题目内容及题
目选项所包含的内容,将多个待识别数据转换成问卷调查格式的题目信息,提高录入问卷
题目的效率及用户体验;(2)转换终端可以识别到的标识信息包括切换标识和类型标识,以
及通过类型标识可以识别出单选题、多选题、填空题、排序题、PK题、评分题、矩阵题等题型,
增多可录入问卷题目的题目类型,提高录入问卷题目的兼容性。(3)转换终端根据识别结果
确定的转换策略对多个待转换数据进行转换,在多个待转换数据中存在错误的字符和/或
字符格式时,则转换终端可以直接根据转换策略将错误的字符和/或字符格式转换成策略
中规定的字符和/或字符格式,提高录入问卷题目的容错率。需要说明的是,不同实施例可
能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或
几种的组合,也可以是其他任何可能获得的有益效果。
[0079] 上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会
对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类
修改、改进、修正仍属于本申请示范实施例的精神和范围。
[0080] 同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因
此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施
例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中
的某些特征、结构或特点可以进行适当的组合。
[0081] 此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对
他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全
由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软
件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面
可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序
编码。
[0082] 计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或
合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介
质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用
的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线
电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
[0083] 本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、
Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、
PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完
全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机
上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程
计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连
接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务
(SaaS)。
[0084] 此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各
种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的
目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请
实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设
备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安
装所描述的系统。
[0085] 同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或
对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提
及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
[0086] 一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说
明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例
中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点
可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的
方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实
施例中,此类数值的设定在可行范围内尽可能精确。
[0087] 针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致
或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后
附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术
语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使
用为准。
[0088] 最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视
为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施
例。