用于识别PDF表格的方法、设备和介质转让专利
申请号 : CN202210007815.7
文献号 : CN114022888B
文献日 : 2022-04-08
发明人 : 朱峰 , 尹扬 , 郭鹏华
申请人 : 上海朝阳永续信息技术股份有限公司
摘要 :
权利要求 :
1.一种用于识别PDF表格的方法,包括:针对PDF文件检索目标关键字,以便确定PDF文件中的目标表格区域;
获取处于目标表格区域内的多个文本块;
基于所述多个文本块的坐标,确定关于目标表格的扫描区域的左上起点和右下终点,以便提取扫描区域内的所有文本块;
基于所提取的扫描区域内的所有文本块的坐标,确定对角坐标集合,所述对角坐标集合包括所有文本块中的每一个文本块的对角坐标;
扫描对角坐标集合,以便生成扫描结果数组;
遍历扫描结果数组,以便确定目标表格中的单元格文本信息;
构建关于与PDF文件相关联的多个机构的机构关键特征数组;
基于机构关键特征数组,针对基于PDF文件所提取出的文本信息进行检索,以便确定与机构相关联的关键特征出现的次数;以及基于所计算的与机构相关联的关键特征出现的次数,生成机构权重序列,以用于确定PDF文件的目标关联机构。
2.根据权利要求1所述的方法,其中扫描对角坐标集合以便生成扫描结果数组包括:将预定义垂直扫描线从对角坐标集合的水平坐标起始处、以预定扫描间隔扫描对角坐标集合,以便将扫描结果保持到列结果数组,所述列结果数组包括与各扫描位置序号对应的扫描采样位置和单次扫描的总命中数;以及将预定义水平扫描线从对角坐标集合的竖直坐标起始处、以预定扫描间隔扫描对角坐标集合,以便将扫描结果保持到行结果数组,所述行结果数组包括与各扫描位置序号对应的扫描采样位置和单次扫描的总命中数。
3.根据权利要求2所述的方法,其中遍历扫描结果数组以便确定目标表格中的单元格文本信息包括:
遍历列结果数组,以便确定与不为0的单次扫描的总命中数所对应的第一扫描采样位置,以及与为0的单次扫描的总命中数所对应的第二扫描采样位置;
基于第一扫描采样位置和第二扫描采样位置,确定列宽数组;以及基于列宽数组和列结果数组,确定目标表格中的每列的起点和终点。
4.根据权利要求3所述的方法,其中遍历扫描结果数组以便确定目标表格中的单元格文本信息还包括:
遍历行结果数组,以便确定与不为0的单次扫描的总命中数所对应的第三扫描采样位置,以及与为0的单次扫描的总命中数所对应的第四扫描采样位置;
基于第三扫描采样位置和第四扫描采样位置,确定行宽数组;
基于行宽数组和行结果数组,确定目标表格中的每行的起点和终点;以及基于每行的起点和终点和每列的起点和终点,确定目标表格中的单元格坐标信息,以便基于单元格坐标信息获取单元格文本信息。
5.根据权利要求1‑4中任一项所述的方法,还包括:获取同行不同列的单元格文本信息;
基于正则表达式判断,确定符合年份字符串格式的单元格文本信息为年份数据;
获取年份数据的列位置信息和行位置信息;
在当前年份数据的行位置信息与下一年份数据的行位置信息之间的单元格文本信息中查询,以便确定第一个具有相同列位置信息、且单元格文本信息均为非数字文本的列为指标标识数据列;
获取指标标识数据列的行位置信息;以及基于指标标识数据列的行位置信息,将位于指标标识数据列右侧的、与指标标识数据具有相同行位置信息、并且与当前年份数据具有相同列位置信息的文本信息确定为与当前年份数据和当前指标标识数据相关联的数值。
6.根据权利要求1所述的方法,机构关键特征数组包括:与机构相关联的关键特征的数量、关键特征和关键特征所对应的权重。
7.根据权利要求1或6所述的方法,其中确定PDF文件的目标关联机构还包括:确定与机构权重序列中的最大值所对应的机构;
确定与最大值所对应的机构的数量是否为1;
响应于确定与最大值所对应的机构的数量为1,确定与最大值所对应的机构为PDF文件的目标关联机构;以及
响应于确定与最大值所对应的机构的数量大于1,确定未识别目标关联机构。
8.根据权利要求1‑4中任一项所述的方法,还包括:确定与所述目标表格相关联的表格特征;
确定在扫描所述文本块的对角坐标期间所述表格特征是否重复出现;
响应于确定所述表格特征重复出现,根据所述表格特征以及所述表格特征重复出现次数将所述文本块分割为不同表格;以及响应于确定所述表格特征未重复出现,确定所述文本块属于同一表格。
9.一种计算设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑8中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中所述计算机指令用于使所述计算机执行权利要求1‑8中任一项所述的方法。
说明书 :
用于识别PDF表格的方法、设备和介质
技术领域
背景技术
立,从而可以精确描述文档布局并展现文档版面。然而PDF不记录文档的逻辑结构,换言之,
PDF文本不包括其中的表格组织的公式关系。因此,需要识别PDF表格的方案。
绘画成形,其可能表示为公式分式线、矢量图、转曲字符等元素,而表格内容则包括各类不
同的字符表,其常与版面其他内容混杂一起,不易识别。对于第二种方案,则需要图像识别
出表格线段,从而确定表格框并提取框内区域,最后对框内区域图像进行OCR识别。
确识别表格。同时,对于包括字符混杂、叠加、偏移等情形的表格内容,对其直接读取准确率
不高。
发明内容
本块;基于多个文本块的坐标,确定关于目标表格的扫描区域的左上起点和右下终点,以便
提取扫描区域内的所有文本块;基于所提取的扫描区域内的所有文本块的坐标,确定对角
坐标集合,对角坐标集合包括所有文本块中的每一个文本块的对角坐标;扫描对角坐标集
合,以便生成扫描结果数组;以及遍历扫描结果数组,以便确定目标表格中的单元格文本信
息。
至少一个处理器执行,以使至少一个处理器能够执行本公开的第一方面的方法。
扫描位置序号对应的扫描采样位置和单次扫描的总命中数;将预定义水平扫描线从对角坐
标集合的竖直坐标起始处、以预定扫描间隔扫描对角坐标集合,以便将扫描结果保持到行
结果数组,行结果数组包括与各扫描位置序号对应的扫描采样位置和单次扫描的总命中
数。
于第一扫描采样位置和第二扫描采样位置,确定列宽数组;基于列宽数组和列结果数组,确
定目标表格中的每列的起点和终点。
于第三扫描采样位置和第四扫描采样位置,确定行宽数组;基于行宽数组和行结果数组,确
定目标表格中的每行的起点和终点;以及基于每行的起点和终点和每列的起点和终点,确
定目标表格中的单元格坐标信息,以便基于单元格坐标信息获取单元格文本信息。
信息;在当前年份数据的行位置信息与下一年份数据的行位置信息之间的单元格文本信息
中查询,以便确定第一个具有相同列位置信息、且单元格文本信息均为非数字文本的列为
指标标识数据列;获取指标标识数据列的行位置信息;基于指标标识数据列的行位置信息,
将位于指标标识数据列右侧的、与指标标识数据具有相同行位置信息、并且与当前年份数
据具有相同列位置信息的文本信息确定为与当前年份数据和当前指标标识数据相关联的
数值。
重;基于机构关键特征数组,针对基于PDF文件所提取出的文本信息进行检索,以便确定与
机构相关联的关键特征出现的次数;基于所计算的与机构相关联的关键特征出现的次数,
生成机构权重序列,以用于确定PDF文件的目标关联机构。
值所对应的机构为PDF文件的目标关联机构;以及响应于确定与最大值所对应的机构的数
量大于1,确定未识别目标关联机构。
特征重复出现次数将文本块分割为不同表格;以及响应于确定表格特征未重复出现,确定
文本块属于同一表格。
附图说明
具体实施方式
到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同
样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的
实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明
确的和隐含的定义。
下,传统的表格识别方案无法准确识别表格内容。由于PDF表格并无统一格式,表格内容可
能会出现混杂、叠加、偏移字符,直接对表格内容进行读取会造成单元格间数据交叉错乱。
同时,数个单元格的数据读取错乱可能会连锁传递至相邻的单元格识别过程中,最后导致
整体表格内容的识别错误或者无效。这在其中存在大量数字且单元格分隔不明显的金融领
域的表格(例如,利润表、资产负债表、现金流量表)中体现尤为突出。
的单元格分隔线进行分隔。这种情况下,尽管现有技术中本领域的部分PDF解析工具可以将
PDF文本解析为可读取的数据,然而其并不能将表格中的各类数据与表格逻辑进行对应,这
样造成读取出的数据会出现错乱。这在以数据为主的金融表格(利润表、资产负债表、现金
流量表等)中更加显著。以图1中流动资产栏为例,直接对其解析可能会得出一个整体数据
“流动资产234844052677049108810147648”,从而丢失其中具有实际意义的空格信息。即使
存在部分可以解析空格的PDF解析工具,其可以将表格解析为“流动资产”、“23484”、
“40526”等单元格,但是其仍然无法将单元格“23484”、“40526”对应于其上方的年份单元格
“2019A”、“2020A”以及对应的指标标识。由于上下单元格的不对应,数据丧失了对应附加信
息,成为了无意义的垃圾数据。在包括更复杂字符串的表格中,这种情况可能会更加严重。
例如,在包括换行的长数据的单元格中,可能仅有部分数据被读取,而另一部分数据直接丢
失。
扫描区域的左上起点和右下终点来提取扫描区域内的所有文本块,然后基于该所有文本块
的坐标而生成指示每一个文本块的对角坐标的对角坐标集合,以及扫描对角坐标集合来生
成扫描结果数组,进而经由遍历扫描结果数组而最终确定单元格文本信息,本公开可以在
不依赖明显表格结构或逻辑框架的情况下由对角坐标集合、扫描结果数组来定位每一个数
据单元格的整体大小,从而能够精确将PDF表格挖掘处理为具有规整结构的数据,例如,将
PDF表格挖掘为Excel数据表单、XML文件、YAML文件等形式。
备110、PDF文件管理设备230可以通过网络240(例如,因特网)进行数据交互。
备230例如而不限于:可执行PDF文件读取和修改的台式计算机、膝上型计算机、上网本计算
机、平板电脑、网络浏览器、电子书阅读器、个人数字助理(PDA)和可穿戴计算机(诸如智能
手表和活动追踪器设备)等。PDF文件管理设备230可以配置成存储PDF文件,将PDF文件经由
网络240发送到计算设备210,并且接收来自计算设备210处理的PDF文件。
定PDF文件的目标关联机构、确定与年份数据和指标标识数据相关联的数值以及将文本块
分割为不同表格。计算设备210可以具有一个或多个处理单元,包括诸如GPU、FPGA和ASIC等
的专用处理单元以及诸如CPU的通用处理单元。另外,在每个计算设备210上也可以运行着
一个或多个虚拟机。在一些实施例中,计算设备210与PDF文件管理设备230可以集成在一
起,也可以是彼此分立设置。在一些实施例中,计算设备210例如包括目标表格区域确定单
元212、文本块获取单元214、扫描区域确定单元216、坐标确定单元218、扫描单元220、遍历
单元222以及处理单元224。
面坐标对文本块进行扫描,从而在行和列两个维度上确定表格实际单元格的行宽以及列
宽。在分别确定单元格行宽以及列宽后,通过组合可以获取每个单元格的位置,从而准确挖
掘识别PDF文本中的PDF表格。
掘表格所属的机构以及分割同页中出现的多个表格等。在对PDF文件完成以上处理后,可以
将所处理的PDF表格经由网络240传送到PDF文件管理设备230。
表现形式。
不是实施以下的示例所必需的,可以以不同的顺序和路径执行本公开技术方案所涉及的各
种方法。
的是,方法300还可以包括未示出的附加框和/或可以省略所示出的框,本公开的范围在此
方面不受限制。
这些关键字下通常包括用户所期望的PDF表格。
格文本块的左上角起始点可为目标关键字,右下角结束点可能为连续数字字符串的最后一
个数字字符串。表格模型可由用户根据PDF表格实际处理经验调整和设置。
个整体矩形方块。可以认为的是,在此整体矩形方块内的所有文本块均属于目标文本块,即
需要识别的PDF表格内容。
“资产负债表”)的左上数个像素(例如,3个像素),将右下起点设置在右下目标(例如,
“3665”)的右下数个像素(例如,3个像素),从而确保目标PDF表格不被遗漏。容错冗余的具
体值可由用户根据PDF表格实际处理经验调整和设置。
这种情况,本公开提供了相应处理方法1200对多个同页连续的不同表格进行分割,方法
1200将在下文中具体描述。
标表格区域,通过PDF处理领域常用的处理工具,例如PDFminer、Camelot等,可以将目标表
格区域的所有文本块全部提取,以供随后处理为相应的PDF表格以及表格内容。
PDF表格的表格逻辑,例如,无法识别表格中的多个文本块的文本内容之间的关联。
多个文本块内的文本内容,即,字符串,然而其无法识别表格逻辑。
限于PDFminer、Camelot等。
为步骤304中所获取的多个文本块建立坐标。坐标的坐标系可以是基于文本块原先的PDF文
本,也可以是基于在步骤302中提取出来的PDF文本的目标表格区域。
影响后续的扫描及处理过程。
有文本块的坐标后,可以确定关于目标表格的扫描区域的左上起点和右下终点,以便提取
扫描区域内的所有文本块。
的步骤对区域内的文本块进行扫描。
302‑306中,已经对扫描区域内的所有文本块建立有坐标系,因此可以确定所有文本块的坐
标集合,其中对角坐标集合包括所有文本块中的每一个文本块的对角坐标。
坐标。
可以是分别以行和列的方式进行,即分别以垂直线段步进扫描在步骤304中确定的扫描区
域,从而确定扫描区域的单元行的相关信息,信息可以被存储到行扫描结果数组以供进一
步分析,并且以水平线段步进扫描在步骤304中确定的扫描区域,从而确定扫描区域的单元
列的相关信息,信息可以被存储到列扫描结果数组以供进一步分析。
扫描间隔步进扫描过整个扫描区域。
可以确定目标表格的行和列的相应信息。
组。以列扫描结果数组为例,数组可包括每个扫描位置、每个扫描位置对应的扫描命中数等
信息。根据扫描位置对应的扫描命中数可以计算出对应当前单元格的列宽信息。
可以得出当前PDF表格的各列的列宽数组。数组记录有PDF表格每列的列宽。
格位置提取表格的单元格文本信息,从而准确识别PDF表格。
图5和图6说明列扫描的方法。
最大垂直坐标 ,同时扫描区间设置为 。由于 并且
,因此扫描线可以在垂直高度 上扫描过全部的目标扫描区域 ,
而不会产生遗漏。
和调整。扫描间隔 越小,扫描越精细,对扫描噪声越敏感,扫描误差越小,但扫描时间长。
扫描间隔 越大,扫描越粗糙,扫描噪声不敏感,扫描误差越大,但扫描时间短。例如,可以
将表格间隔 默认设置为3个坐标值,在扫描时间过长的情况下可以将 加大到5个坐标
值或者在扫描误差过大的情况下可以将 减小到1个坐标值。以此方式,扫描线段将按照预
定扫描间隔 步进扫描过整个扫描区域。
时,命中函数的函数值为1,否则命中函数的函数值为0。
收票据及应收账款”文本块、“应收票据及应收账款”文本块和“归属母公司股东权益”文本
块相交命中。扫描的命中总数可以在随后用于计算文本块的列宽度。
扫描获取了每个扫描间隔 对应的扫描采样位置 和扫描命中总数 ,因此可以将两
个数据组合存入到列结果数组 。以下结合公式(9)说明列结果数组 。
到行结果数组 ,所述行结果数组包括与各扫描位置序号对应的扫描采样位置和单
次扫描的总命中数。具体实施方式与列扫描相似,在此不再赘述。
组 、行结果数组 以及扫描结果数组 。通过分别对列结果数组、行结果
数组进行遍历计算,可以分别对获取文本块的列宽和行宽,即每列的起点和终点以及每行
的起点和终点。通过将所获取的每列的起点和终点以及每行的起点和终点相组合,可以确
定目标表格中的单元格坐标信息,并基于单元格坐标信息获取单元格文本信息。
位置。
历一直到其中第一个不为0的扫描的总命中数 处,即,第一扫描采样位置,此扫描位
置可以被确定为列的起点。例如在图6所示的扫描中,第一个扫描总命中数可能为29,即从
“资产负债表(百万元)”到“负债和股东权益”。
为所扫描的文本块的列至第二扫描采样位置为止。
中位置, 为列宽数组。因此, 通过 减去 记录
每列的列宽。当每次完成一次列宽计算后,k累加,最终的k值表示表格有多少列。注意的是,
以上仅示出的是遍历运算的伪代码,以该伪代码为基础可以以任意程序语言实现以上遍历
运算。
宽,可以确定扫描的文本块的列的终点。通过遍历数组中的所有命中位置,可以确定目标表
格中的每列的起点和终点。
遍历行扫描结果数组的步骤,具体包括:在步骤802,计算设备210遍历行结果数组,以便确
定与不为0的单次扫描的总命中数所对应的第三扫描采样位置,以及与为0的单次扫描的总
命中数所对应的第四扫描采样位置;在步骤902,计算设备210基于第三扫描采样位置和第
四扫描采样位置,确定行宽数组;在步骤903,计算设备210基于行宽数组和行结果数组,确
定目标表格中的每行的起点和终点;以及在步骤904,计算设备210基于每行的起点和终点
和每列的起点和终点,确定目标表格中的单元格坐标信息,以便基于单元格坐标信息获取
单元格文本信息。
伪代码也可以相应用于步骤802、步骤804、步骤806。
格结构的数据,例如,存储为Excel数据表单、XML文件、YAML文件等形式。
息往往与其所在行与列的年份和指标标识有很强的相关性。通过用于表格信息挖掘的方法
900可以挖掘出表格的年份信息和指标标识信息。
负债表(百万元)”、“[会计年度]、[2019A]、[2020A] 、[2021E] 、[2022E] 、[2023E]”等。
20)\d{2}$”,其可以表示从1900‑2099年的所有年份。通过所设计的正则表达式,判断行内
的单元格中是否存在符合正则表达式的表格信息。如果与则确定该行包含年份信息。
信息均为非数字文本的列为指标标识数据列。由于一行中可能具有多个年份数据,因此需
要找出该行中多个年份数据中的第一个年份数据,以第一个年份数据作为起点,即该年份
所属列为第一个指标数据列。同时,根据表格特点,可以确定第一个年份数据前一列为指标
标识数据列。指标标识数据列表示了其对应的数据的实际现实含义。
信息,即获取该列下每一行的单元格位置信息。
信息的文本信息确定为与当前年份数据和当前指标标识数据相关联的数值。在通过以上步
骤可以确定指标标识数据列和年份数据行。位于指标标识数据列右侧的、与指标标识数据
具有相同行位置信息、并且与当前年份数据具有相同列位置信息的文本信息可以被认为是
具有指标标识含义的年份数据。
应的数据“23484”可以被认为是在2019企业的流动资产。通过以上方式,PDF表格中的每个
数字都能匹配到年份数据和指标标识,从而表格识别中保留了其实际含义。
而更进一步保留了表格数据的实际含义。
PDF文件相关联的机构(例如,撰写PDF文件的金融机构)。
应的权重。
称、公司机构注册办公地址、公司的标识(logo),并对相应特征赋予相应权重,例如公司名
称权重为1,公司机构注册办公地址权重为3、公司的标识(logo)权重为5,权重越高认为特
征与机构越相关。
后,可以检索PDF文件中所提取出的文本信息,提取信息的方式可以如上文所描述。通过文
本检索,可以确定与机构相关联的关键特征出现的次数。关键特征出现的次数可以与如步
骤1002中所定义的权重配合计算相关联机构的可能性。
征出现次数后,可以生成机构权重序列。通过对机构权重序列进行排序,从而挖掘出该份
PDF文件相关联的机构。例如,机构权重序列排序中第一的为某证券公司,则可以认为该PDF
文件与某证券公司相关联,例如文件为某证券公司所撰写。
构。
个或更多个不同机构。
应的机构为PDF文件的目标关联机构。
文本的目标关联机构。需要进一步的方法(例如人工识别)来确定PDF文本的目标关联机构。
格模型确定目标扫描范围。在同一页中出现多个表格的PDF文件中,表格模型经常会将多张
表格识别为同一表格。
300中的表格模型进行识别,即以目标关键字为左上角起点,连续数字列中的最后一个数字
为右下角终点,则三张表将会被识别为同一个表格。因此,在这种情况下还需要基于方法
1200对多张表格进行分割。
或者指标标识列设置为一类表格特征。注意的是,表格特征不限于以上的年份行或者指标
标识列,而可以根据表格种类由用户根据表格处理经验设计。
格特征是否重复出现。例如,可以检索年份行和/或指标标识列是否有重复出现。
现,则根据重复出现的次数将所识别的文本块分隔为多份表格。
列。因此可以根据所识别的指标标识列(识别方法在上文有叙述)将文本块分成左侧的资产
负债表以及右侧的利润表连带主要财务比率。同时在行的维度上,目标关键字也属于表与
表之间的分隔行。因此可以根据所检索的目标关键字利润表、主要财务比率,将右侧的两边
分割为两个表格。
为所识别的文本块属于同一个表格。
包括中央处理单元(CPU)1401,其可以根据存储在只读存储器(ROM)1402中的计算机程序指
令或者从存储单元1408加载到随机存取存储器(RAM)1403中的计算机程序指令,来执行各
种适当的动作和处理。在随机存取存储器1403中,还可存储电子设备1400操作所需的各种
程序和数据。中央处理单元1401、只读存储器1402以及随机存取存储器1403通过总线1404
彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
例如磁盘、光盘等;以及通信单元1409,例如网卡、调制解调器、无线通信收发机等。通信单
元1409允许设备1400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信
息/数据。
1000、1100和1200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储
单元1408。在一些实施例中,计算机程序的部分或者全部可以经由只读存储器1402和/或通
信单元1409而被载入和/或安装到设备1400上。当计算机程序被加载到随机存取存储器
1403并由中央处理单元1401执行时,可以执行上文描述的方法300、500、700、800、900、
1000、1100和1200的一个或多个动作。
设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的
更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存
储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式
压缩盘只读存储器(CD‑ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上
存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算
机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通
过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输
的电信号。
部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关
计算机和/或边缘计算设备。每个计算/处理设备中的网络适配卡或者网络接口从网络接收
计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的
计算机可读存储介质中。
任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如
Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机
可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独
立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机
或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包
括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利
用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令
的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可
编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方
面。
或框图中各方框的组合,都可以由计算机可读程序指令实现。
据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定
的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这
些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指
令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方
框中规定的功能/动作的各个方面的指令。
生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的
指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用
于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也
可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执
行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或
流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动
作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
的而非限制性的,在不脱离如所附各权利要求所定义的本发明精神及范围的情况下,本发
明可能涵盖各种的修改与替换。