一种纸质表单转换为网页表单的方法及系统转让专利

申请号 : CN201610496283.2

文献号 : CN106126491B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 何中于晓丽严伟戴建峰王丽华蔡亚军

申请人 : 江苏中威科技软件系统有限公司

摘要 :

本发明提供了一种纸质表单转换为网页表单的方法及系统,纸质表单转换为网页表单的方法包括,步骤一:通过图像扫描设备将纸质表单扫描生成位图文件;步骤二:通过文字处理器将位图文件转换为文字处理器表单文件;步骤三:根据文字处理器表单文件的内容选择网页表单模板,将文字处理器表单文件中的表单元素插入网页表单模板中,生成初步的网页表单。纸质表单转换为网页表单的系统,包括扫描设备、连接模块、文字处理器、网页编辑模块和显示模块。本发明解决了纸质表单转化成网页表单过程复杂,效率低下的问题。

权利要求 :

1.一种纸质表单转换为网页表单的方法,其特征在于,包括如下步骤:步骤一:通过图像扫描设备将纸质表单扫描生成位图文件;

步骤二:通过文字处理器将位图文件转换为文字处理器表单文件;

步骤三:根据文字处理器表单文件的内容选择网页表单模板,将文字处理器表单文件中的表单元素插入网页表单模板中,生成初步的网页表单;

所述步骤三还包括如下步骤:

预先设置网页表单模板:通过网页编辑器绘制多套模板上传至系统中;

选择网页表单模板:根据文字处理器表单文件中的表单内容选择表单属性接近的网页表单模板;

插入表单内容:根据文字处理器表单文件中的表单内容插入标题和表格创建控件,所述标题根据文字处理器表单文件中的表单标题确定,所述表格创建控件用于生成表格;

读取文字处理器表单文件中的内容:按照奇数列与偶数列区分的方式读取文字处理器表单文件中的内容,将读取到的内容填充到网页表单模板中,奇数列的内容作为变量,偶数列的内容作为文本编辑框,变量与文本编辑框一一对应;

生成初步的网页表单:根据网页表单模板的填充内容,通过表格创建控件生成初步的网页表单。

2.根据权利要求1所述的一种纸质表单转换为网页表单的方法,其特征在于,包括如下步骤:步骤一:将纸质表单通过扫描仪转换成tif文件;

步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本表单文件;

步骤三:根据文字文本表单文件的内容选择网页表单模板,将文字文本表单文件中的表单元素插入网页表单模板中,生成初步的网页表单。

3.根据权利要求1所述的一种纸质表单转换为网页表单的方法,其特征在于,所述步骤三还包括如下步骤:优化网页表单元素:根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充;

填充网页表单属性:根据文字处理器表单文件中的文字的字体,将字体数据信息转换为像素单位填充到网页表单中;将文字处理器表单文件中的文字转换为命名文本元素的字段。

4.根据权利要求3所述的一种纸质表单转换为网页表单的方法,其特征在于,所述命名文本元素的字段为拼音字段或者英文字段。

5.一种采用如权利要求1所述的纸质表单转换为网页表单的方法的系统,其特征在于,包括:扫描设备,用于扫描纸质表单,并生成位图文件;

连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块;

文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器表单文件,并且读取文字处理器表单文件内每一列的内容;

网页编辑模块,用于在网页编辑过程中生成网页表单,并且根据文字处理器读取到的内容选择相应的网页表单模板进行填充属性和创建文本编辑框;

显示模块,用于显示文字处理器界面和网页表单界面。

6.根据权利要求5所述的一种纸质表单转换为网页表单的系统,其特征在于,所述文字处理器包括:文字处理器表单转换单元,用于将扫描设备扫描到的纸质表单的位图文件转换为文字处理器可处理的文字处理器表单文件;

读取单元,用于读取文字处理器表单文件内的每一列的内容;

文字处理界面生成模块,用于生成文字处理器表单转换单元和读取单元运行过程中的用户可操作界面。

7.根据权利要求5所述的一种纸质表单转换为网页表单的系统,其特征在于,所述网页编辑模块包括:文本编辑框创建单元,用于根据文字处理器读取到的文字处理器表单文件中的偶数列的内容进行创建文本编辑框;

网页表单模板预生成选择单元,用于在生成网页表单之前生成网页表单模板,并且根据文字处理器读取到的文字处理器表单文件中的内容进行选择合适的网页表单模板;

网页表单界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页表单。

8.根据权利要求7所述的一种纸质表单转换为网页表单的系统,其特征在于,所述网页编辑模块还包括:属性填充单元,用于根据文字处理器表单文件中的文字的字体,将字体数据信息转换为像素单位填充到网页表单中;将文字处理器表单文件中的文字转换为命名文本元素的字段;

网页表单优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充。

说明书 :

一种纸质表单转换为网页表单的方法及系统

技术领域

[0001] 本发明涉及计算机通信技术领域,尤其涉及一种纸质表单转换为网页表单的方法及系统。

背景技术

[0002] 目前各个无纸化的办公系统,审批系统逐步普及,原来纸质化的word排版的表单。例如请假单,出车申请单等等,需要转成系统中的流程化的form表单,在系统搭建的前期需要花费大量的人力来实施。现有技术中大多采用dreamware等类似的网页编辑软件,手动的将原来的word表单按部就班的绘制出来,费时,无技术含量。或者通过扫描仪转换成word,再利用word自带的工具转成网络文本,内容复杂,不符合form表单的要求,生成的只是静态的网页。
[0003] 现有技术中通常采用采用网页编辑器绘制表格,需要投入大量的人力。绘制出来的form表单还需要与现有的系统对接表单元素设置id,name,过程复杂,效率低下。绘制的表单元素长度都需要调整,不可以直接获取到原来纸质化的表单,而word等文字处理软件自带的转html的功能转出的表单内容繁琐,没有form表单元素。

发明内容

[0004] 为克服现有技术中存在的纸质表单转变为网页表单过程复杂,效率低下的问题,本发明提供了一种纸质表单转换为网页表单的方法及系统。
[0005] 一种纸质表单转换为网页表单的方法,包括如下步骤:
[0006] 步骤一:通过图像扫描设备将纸质表单扫描生成位图文件;
[0007] 步骤二:通过文字处理器将位图文件转换为文字处理器表单文件;
[0008] 步骤三:根据文字处理器表单文件的内容选择网页表单模板,将文字处理器表单文件中的表单元素插入网页表单模板中,生成初步的网页表单。
[0009] 优选的,一种纸质表单转换为网页表单的方法,包括如下步骤:
[0010] 步骤一:将纸质表单通过扫描仪转换成tif文件;
[0011] 步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本表单文件;
[0012] 步骤三:根据文字文本表单文件的内容选择网页表单模板,将文字文本表单文件中的表单元素插入网页表单模板中,生成初步的网页表单。
[0013] 优选的,所述步骤三还包括如下步骤:
[0014] 预先设置网页表单模板:通过网页编辑器绘制多套模板上传至系统中;
[0015] 选择网页表单模板:根据文字处理器表单文件中的表单内容选择表单属性接近的网页表单模板;
[0016] 插入表单内容:根据文字处理器表单文件中的表单内容插入标题和表格创建控件,所述标题根据文字处理器表单文件中的表单标题确定,所述表格创建控件用于生成表格;
[0017] 读取文字处理器表单文件中的内容:按照奇数列与偶数列区分的方式读取文字处理器表单文件中的内容,将读取到的内容填充到网页表单模板中,奇数列的内容作为变量,偶数列的内容作为文本编辑框,变量与文本编辑框一一对应;
[0018] 生成初步的网页表单:根据网页表单模板的填充内容,通过表格创建控件生成初步的网页表单。
[0019] 进一步的,所述步骤三还包括如下步骤:
[0020] 优化网页表单元素:根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充;
[0021] 填充网页表单属性:根据文字处理器表单文件中的文字的字体,将字体数据信息转换为像素单位填充到网页表单中;将文字处理器表单文件中的文字转换为命名文本元素的字段。
[0022] 进一步的,所述命名文本元素的字段为拼音字段或者英文字段,选择表单模板的同时选择命名规则。
[0023] 本发明的另一个目的是提供一种采用如前所述的纸质表单转换为网页表单的方法的系统,包括:
[0024] 扫描设备,用于扫描纸质表单,并生成位图文件;
[0025] 连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块;
[0026] 文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器表单文件,并且读取文字处理器表单文件内每一列的内容;
[0027] 网页编辑模块,用于在网页编辑过程中生成网页表单,并且根据文字处理器读取到的内容选择相应的网页表单模板进行填充属性和创建文本编辑框;
[0028] 显示模块,用于显示文字处理器界面和网页表单界面。
[0029] 进一步的,所述文字处理器包括:
[0030] 文字处理器表单转换单元,用于将扫描设备扫描到的纸质表单的位图文件转换为文字处理器可处理的文字处理器表单文件;
[0031] 读取单元,用于读取文字处理器表单文件内的每一列的内容;
[0032] 文字处理界面生成模块,用于生成文字处理器表单转换单元和读取单元运行过程中的用户可操作界面。
[0033] 进一步的,所述网页编辑模块包括:
[0034] 文本编辑框创建单元,用于根据文字处理器读取到的文字处理器表单文件中的偶数列的内容进行创建文本编辑框;
[0035] 网页表单模板预生成选择单元,用于在生成网页表单之前生成网页表单模板,并且根据文字处理器读取到的文字处理器表单文件中的内容进行选择合适的网页表单模板;
[0036] 网页表单界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页表单。
[0037] 进一步的,所述网页编辑模块还包括:
[0038] 属性填充单元,用于根据文字处理器表单文件中的文字的字体,将字体数据信息转换为像素单位填充到网页表单中;将文字处理器表单文件中的文字转换为命名文本元素的字段;
[0039] 网页表单优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充。
[0040] 与现有技术相比,本发明的有益效果是:
[0041] (1)本发明通过图像扫描设备将纸质表单转换为位图文件,再通过文字处理软件将位图文件转换为网页form表单,无需人工绘制表单,并且生成的网页form表单能够进行设置id和name属性等,方便快捷,节省人力,转换效率高。
[0042] (2)本发明通过对网页form表单进行属性配置,能够使得生成的网页form表单更具有美观性,并且能够保持纸质表单的原貌。
[0043] (3)本发明通过预先设置网页表单模板进行生成表单,方便快捷,无需人工操作,表单生成速度快。

具体实施方式

[0044] 以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0045] 实施例1
[0046] 本具体实施方式披露了一种纸质表单转换为网页表单的方法,包括如下步骤:
[0047] 步骤一:通过图像扫描设备将纸质表单扫描生成位图文件。在本发明的一个可行的具体实施方式中,可以通过手持式扫描仪或者立式扫描仪进行扫描纸质表单,并且通过扫描仪连接计算机处理设备将扫描到的图像以tif位图文件的形式进行保存。扫描过程中避免可见光照射影响扫描的质量。采用手持式扫描仪进行扫描时,应当在光线较暗的空间内将纸质表单平铺在平面上进行扫描。采用立式扫描仪进行扫描时则需要将纸质表单置于扫面盖板下方并盖紧盖板,不漏亮光。在本发明的其他具体实施例中,位图文件还可以是其他格式,例如BMP文件。
[0048] 优选的,图像扫描设备还可以是数码相机或者手机等图像采集类设备,采用数码相机或者手机进行获取图像能够有效的避免图像扫描设备在扫描过程中的曝光问题。
[0049] 步骤二:通过文字处理器将位图文件转换为文字处理器表单文件。在本发明的一个可行的具体实施例中,可以采用Office Document Imaging软件作为文字处理器,并通过其自带的OCR文本识别功能将tif文件转成文字文本表单文件。OCR文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。在本发明的其他具体实施例中,还可以通过其他带有图像文字功能的文字处理器进行,例如汉王软件,WPS等。
[0050] 步骤三:根据文字处理器表单文件的内容选择网页表单模板,将文字处理器表单文件中的表单元素插入网页表单模板中,生成初步的网页表单。
[0051] 优选的,在选择网页表单模板之前预先设置多个网页表单模板,通过网页编辑器在插入网页表单时,自动生成网页表单模板供选择。可行的,在本发明的一个具体实施方式中,可以通过一网页表单模板服务器进行提供网页表单模板。
[0052] 优选的,选择网页表单模板时根据文字处理器表单文件中的表单内容选择表单属性接近的网页表单模板。具体的,是根据文字文本表单文件中表格的尺寸和样式选择最接近的网页表单模板。
[0053] 确定好网页表单模板之后,根据文字处理器表单文件中的表单内容插入标题和表格创建控件,所述标题根据文字处理器表单文件中的表单标题确定,所述表格创建控件用于生成表格。
[0054] 优选的,初步生成的网页表单的填充内容是按照奇数列与偶数列区分的方式读取到的文字处理器表单文件中的内容,其中,奇数列的内容作为变量,偶数列的内容作为文本编辑框,并且变量与文本编辑框一一对应。变量是表格需要填写的内容,其通过空间控制在网页上可供用户进行填写。
[0055] 最终上传到网页上的网页表单通过表格创建控件生成。
[0056] 在本发明的另一个具体实施方式中,初步生成的网页表单还可以根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充来进行优化。
[0057] 此外,为使得网页表单更具有美观性,可以根据文字处理器表单文件中的文字的字体对网页表单填充内容进行调整。可行的,可以将字体数据信息转换为像素单位填充到网页表单中,再根据像素单位进行调整网页表单字段的大小属性。而网页表单内填充的文字信息则是文字处理器表单文件中的文字转换为命名文本元素的字段,优选的,所述命名文本元素的字段为拼音字段或英文字段,其根据文字处理器表单文件中的文字的拼音或者英文同义得到。
[0058] 采用上述方法获得的表单能够直接放到网页上作为form的流程表单,使用方便,能够有效的提高纸质表单上传到网页的效率。
[0059] 实施例2
[0060] 本具体实施方式披露了一种纸质表单转换为网页表单的系统,包括:
[0061] 扫描设备,用于扫描纸质表单,并生成位图文件。优选的,扫描设备可以采用立式扫描仪、手持式扫描仪、数码相机或者手机等图像采集设备。扫描得到的图像存储为tif格式、BMP格式等位图文件格式,采用位图文件进行存储图像,图像失真度小,能够有效的位置纸质表单的原状。
[0062] 连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块。优选的,可以通过一数据交换机将扫描设备、文字处理器、网页编辑模块和显示设备相连接,扫描设备将文件传送给文字处理器,文字处理器与网页编辑模块之间相互传送数据,而显示模块则接收文字处理器和网页编辑模块传送的显示信息数据。
[0063] 文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器表单文件,并且读取文字处理器表单文件内每一列的内容。可行的,文字处理器可以是自带的OCR文本识别功能软件,例如Office Document Imaging软件、汉王和WPS等。
[0064] 优选的,文字处理器包括文字处理器表单转换单元,用于将扫描设备扫描到的纸质表单的位图文件转换为文字处理器可处理的文字处理器表单文件。
[0065] 读取单元,用于读取文字处理器表单文件内的每一列的内容。
[0066] 文字处理界面生成模块,用于生成文字处理器表单转换单元和读取单元运行过程中的用户可操作界面,具体的是将读取文字处理器表单文件内容、选择内容等通过控件菜单选择的形式呈现给用户供用户选择。
[0067] 此外,网页编辑模块用于在网页编辑过程中生成网页表单,并且根据文字处理器读取到的内容选择相应的网页表单模板进行填充属性和创建文本编辑框。
[0068] 优选的,所述网页编辑模块包括,文本编辑框创建单元,其用于根据文字处理器读取到的文字处理器表单文件中的偶数列的内容进行创建文本编辑框。
[0069] 还包括一网页表单模板预生成选择单元,用于在生成网页表单之前生成网页表单模板,并且根据文字处理器读取到的文字处理器表单文件中的内容进行选择合适的网页表单模板。在选择合适的网页表单模板之后,通过一表格生成控件进行生成表格,用户通过点击控件形成需要的表格。优选的,用户在点击控件之后,还会在操作界面弹出一属性选择对话框,用户可以在对话框内选择表格的属性,包括底纹、颜色、尺寸调节和字体大小等,具体的各个属性的名称根据文字处理器内的表单的字段来确认。
[0070] 还包括一网页表单界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页表单。用户通过在用户可操作界面内进行选择控制网页编辑模块运行过程。
[0071] 优选的,网页编辑模块还包括一属性填充单元,用于根据文字处理器表单文件中的文字的字体,将字体数据信息转换为像素单位填充到网页表单中;将文字处理器表单文件中的文字转换为命名文本元素的字段。可行的,在本发明的一个具体实施方式中,可以采用字段的拼音或者英文作为命名文本。
[0072] 优选的,网页编辑模块还包括一网页表单优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充。
[0073] 显示模块,用于显示文字处理器界面和网页表单界面。可行的,在本发明的一个具体实施方式中,可以采用一液晶显示器进行显示,其同时作为文字处理器和网页编辑模块的显示设备。用户能够在该液晶显示器上看到操作的步骤和过程中的网页表单。并且用户还以通过该液晶显示其看到网页编辑的内容。
[0074] 上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。