会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 3. 发明专利
    • FINANCIAL EVENT AND RELATIONSHIP EXTRACTION
    • CA3094442C
    • 2022-05-17
    • CA3094442
    • 2009-01-30
    • THOMSON REUTERS ENTPR CENTRE GMBH
    • SCHILDER FRANKDOZIER CHRISTOPHERKONDADADI RAVI KUMAR
    • G06F40/20G06F16/90G06Q40/02
    • Abstract of the Disclosure Devised is a computer-implemented method of identifying and extracting by a computer, financial information from tables in documents, comprising: automatically, without further intervention from a user, identifying by a computer a document from a set of documents retrieved by the computer from a document source database; screening the identified document by a support vector machine classifier to distinguish between tables and non-tables and identify one or more tables that contain a desired relation without performing a detailed extraction process; identifying within the identified document a table from a set of tables that contains at least one predetermined desired relation, wherein the at least one predetermined desired relation comprises a plurality of desired attributes and desired values; partitioning by the computer the identified table into a plurality of labels and one or more values, with one or more of the labels identified as a column label and one or more identified as a row label; determining by the computer a set of attribute-value pairs by associating each value of the one or more values partitioned from the identified table with a plurality of the labels, with an abstract table including the set of attribute-value pairs; and generating by the computer a set of data for inclusion into a database of financial information, the set of data generated for inclusion in the database of financial information based on the determined set of attribute-value pairs. Date Recue/Date Received 2020-09-24
    • 4. 发明专利
    • Extracción de evento financiero y relación
    • ES2886459T3
    • 2021-12-20
    • ES09706670
    • 2009-01-30
    • THOMSON REUTERS ENTPR CENTRE GMBH
    • SCHILDER FRANKDOZIER CHRISTOPHERKONDADADI RAVI KUMAR
    • G06F16/35G06F16/36
    • Un sistema informático para la extracción de datos e información relacionada de tablas en documentos electrónicos que tiene al menos un procesador y al menos una memoria, comprendiendo el sistema: medios para identificar y etiquetar automáticamente un segmento de texto en un documento (110) electrónico; medios para etiquetar automáticamente nombres de entidades, expresiones monetarias, y expresiones temporales dentro del segmento (120) de texto; medios para identificar un evento financiero descrito dentro del segmento de texto etiquetado automáticamente; un clasificador (310) de máquina de vectores de soporte adaptado para filtrar el documento e identificar una tabla que comprende información de interés distinguiendo tablas de las que no son tablas y en donde las tablas utilizadas por razones de formato se identifican como no tablas, la información de interés comprende una pluralidad de atributos deseados y valores deseados, las tablas genuinas identificadas son procesadas por: a. clasificación de tablas utilizando clasificadores específicos de relación con base en el aprendizaje automático supervisado, b. clasificación de filas y columnas de etiquetas distinguiendo entre columnas de etiquetas y filas de etiquetas de los valores dentro de las tablas, c. reconocimiento de la estructura de la tabla asociando cada valor con sus etiquetas en la misma columna y la misma fila para generar una lista de pares atributo-valor, d. comprensión de la tabla comparando cada uno de los pares atributo-valor; medios para definir en la memoria un registro de datos asociado con el evento financiero, que incluye el registro de datos, datos derivados del segmento (319) de texto etiquetado; y medios para extraer datos (320) de relación del segmento de texto y para determinar un papel de al menos una entidad, estando etiquetada la entidad dentro del segmento de texto y relacionada con el registro de datos.