会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 4. 发明授权
    • System and method for identification and extraction of data
    • 用于识别和提取数据的系统和方法
    • US09589183B2
    • 2017-03-07
    • US14552099
    • 2014-11-24
    • Parchment
    • Jason Brown
    • G06K9/00G06K9/18G06F17/30
    • G06K9/00483G06F17/21G06F17/2705G06F17/277G06F17/30G06K9/00442G06K9/6255G06K9/78G06K2209/01G06K2209/50H04N1/04
    • A system and method of for describing target data as a sequence of pattern elements and pattern element groups that comprise an overall target pattern is described. Pattern elements may utilize regular expression syntax along with other metadata that describe the behavior of the element. A pattern element group may be a collection of fully defined pattern elements where at least one pattern element from the group must have a match for the overall pattern to match. Patterns contain both pattern elements and pattern element groups. The general process involves first performing optical character recognition (OCR) on the document, which in turn produces a sequence of text tokens representing the lines of text on each page of the document. The search algorithm may then apply each defined pattern to the entire document capturing and/or extracting data that match each pattern's required elements and element groups.
    • 描述用于将目标数据描述为包括总体目标图案的图案元素和图案元素组的序列的系统和方法。 模式元素可以使用正则表达式语法以及描述元素行为的其他元数据。 图案元素组可以是完全限定的图案元素的集合,其中来自该组的至少一个图案元素必须具有匹配整体图案的匹配。 图案包含图案元素和图案元素组。 一般过程包括首先在文档上执行光学字符识别(OCR),这又产生代表文档每一页上的文本行的一系列文本标记。 然后,搜索算法可以将每个定义的模式应用于与每个模式的所需元素和元素组匹配的整个文档捕获和/或提取数据。