会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 93. 发明专利
    • Semantische-Beziehungen-Lerneinrichtung, Semantische-Beziehungen-Lernverfahren und Semantische-Beziehungen-Lernprogramm
    • DE112019006005T5
    • 2021-09-02
    • DE112019006005
    • 2019-01-08
    • MITSUBISHI ELECTRIC CORP
    • UCHIDE HAYATO
    • G06F40/30G06F16/31G06F16/332
    • Eine Semantische-Beziehungen-Lerneinrichtung (1) umfasst eine Negativbeispieldaten-Erzeugungseinheit (12), die eine Vielzahl von Negativbeispieldatenpaaren durch Kombinieren von Sprachdaten, die in einer Vielzahl von Positivbeispieldatenpaaren enthalten sind, erzeugt, eine Merkmalswert-Extraktionseinheit (13), die Merkmalswerte von den Sprachdaten, die jedes der Negativbeispieldatenpaare bilden, extrahiert, eine Ähnlichkeitslevel-Berechnungseinheit (14), die ein Ähnlichkeitslevel zwischen den Merkmalswerten in jedem der Negativbeispieldatenpaare berechnet, eine Lernzweck-Negativbeispieldaten-Erzeugungseinheit (15), die die Vielzahl von Negativbeispieldatenpaaren in eine Vielzahl vorbestimmter Ähnlichkeitslevelbereiche auf Grundlage des Ähnlichkeitslevels klassifiziert, wodurch eine Vielzahl von Lernzweck-Negativbeispieldatensätzen, die der Vielzahl von Ähnlichkeitslevelbereichen entsprechen, erzeugt werden, eine Lerndatensatz-Auswahleinheit (17), die einen Lernzweck-Negativbeispieldatensatz aus der Vielzahl von Lernzweck-Negativbeispieldatensätzen in einer Reihenfolge gemäß einem Auswahlplan, der auf Grundlage der Vielzahl von Ähnlichkeitslevelbereichen vorbestimmt ist, auswählt, und eine Lernverarbeitungseinheit (18), die einen Maschinelles-Lernen-Prozesses durch Verwenden des ausgewählten Lernzweck-Negativbeispieldatensatzes und der Vielzahl von Positivbeispieldatenpaaren durchführt.
    • 98. 发明专利
    • Verfahren und Vorrichtung zur Ermittlung ähnlicher Dokumente
    • DE102019212421A1
    • 2021-02-25
    • DE102019212421
    • 2019-08-20
    • FRAUNHOFER GES FORSCHUNG
    • HOPPE THOMAS
    • G06F16/31G06F16/335G06F16/35G06F16/36G06F40/20
    • Die Erfindung betrifft ein Verfahren zur Ermittlung ähnlicher Dokumente aus einer Menge an Dokumenten (101), wobei die Dokumente (101) tokenisierte Zeichenketten aufweisen, dadurch gekennzeichnet, dassa) mit einem Indexierungsverfahren (102) ein inverser Index für mindestens eine Teilmenge der Dokumente (101) berechnet wird,b) für die mindestens eine Teilmenge der Dokumente (101) werden Word Embeddings (105) berechnet,c) für die mindestens eine Teilmenge der Dokumente (101) wird für jedes dieser Dokumente (101) jeweils ein Document Embedding (107) berechnet, indem für jedes Dokument (101) die Word Embeddings (105) aller Zeichenketten, insbesondere Worte des Dokuments (101) addiert und mit der Anzahl der Zeichenketten, insbesondere Worten, normiert werden (106), wobei vorher, nachfolgend oder paralleld) mit den berechneten Word Embeddings (105) mithilfe eines Clusteringverfahrens SimSet-Gruppen (109) von ähnlichen Zeichenketten berechnet werden, und dann anschließende) in einer Anfragephase (200) zunächst ein Query Embedding (205) bestimmt wird und dannf) ein Vergleich des Query Embeddings (205) mit den Document Embeddings (107) unter Verwendung der im Schritt d) mit dem Clusteringverfahren gebildeten SimSet-Gruppen (109) zur mengenmäßigen Einschränkung der Anzahl der zu vergleichenden Document Embeddings (107) durchgeführt wird, um automatisch ein Ranking der Ähnlichkeit der Dokumente (101) zu ermitteln und diese anzuzeigen und / oder abzuspeichern. Die Erfindung betrifft auch eine Vorrichtung.
    • 99. 发明专利
    • Identifying entities in electronic medical records
    • AU2019207309C1
    • 2021-02-11
    • AU2019207309
    • 2019-04-25
    • ADVANCED NEW TECHNOLOGIES CO LTD
    • CAO SHAOSHENGZHOU JUN
    • G06F16/31G06F40/295G16H10/60
    • (12) INTERNATIONAL APPLICATION PUBLISHED UNDER THE PATENT COOPERATION TREATY (PCT) CORRECTED VERSION (19) World Intellectual Property (1) Organization11111111111111111111111I1111111111111ii111liiili International Bureau (10) International Publication Number (43) International Publication Date W O 2019/137562 A9 18 July 2019 (18.07.2019) W IPO I PCT (51) InternationalPatent Classification: (72) Inventors: CAO, Shaosheng; Alibaba Group Legal De Not classified partment 5/F, Building 3, No.969 West Wen Yi Road, Yu (21) International Application Number: Hang District, Hangzhou, Zhejiang 311121 (CN). ZHOU, PCT/CN2019/084197 Jun; Alibaba Group Legal Department 5/F, Building 3, No.969 West Wen Yi Road, Yu Hang District, Hangzhou, (22) International Filing Date: Zhejiang 311121 (CN). 25 April 2019 (25.04.2019) (74) Agent: BEIJING BESTIPR INTELLECTUAL PROP (25) Filing Language: English ERTY LAW CORPORATION; Room 409, Tower B, Ka (26)PublicationLanguage: English Wal Building, No. 9 Shangdi 3rd Street, Haidian District, Beijing 100085 (CN). (71) Applicant: ALIBABA GROUP HOLDING LIMITED (81) Designated States (unless otherwise indicated, for every [-/CN]; Fourth Floor, One Capital Place, P.O. BOX 847, kind national protection available): AE, AG, AL, AM, GeorgeTown,GrandCayman(KY). AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, (54) Title: IDENTIFYING ENTITIES IN ELECTRONIC MEDICAL RECORDS Training text extraction Text segmentation - 104 Word vector training (based on, for example, cw2vec and n-stroke vector training) 106 Word vector n-stroke vector BiLSTM-CRF model training BiLSTM-CRF model parameter - classify terms from a written diagnosis containing Chinese characters (57) Abstract: Disclosed herein are methods, systems, and apparatus, including computer programs encoded on computer storage e media, for entity prediction. One of the methods includes performing word segmentation on text to be predicted to obtain a plurality of words. For each word of the plurality of words, a determination is made whether the word has a pre-trained word vector. In response to determining that the word has a pre-trained word vector, the pre-trained word vector for the word is obtained. In response to determining that the word does not have a pre-trained word vector, a word vector for the word is determined based on a pre-trained stroke vector. The word vector and the pre-trained stroke vector are trained based on a text sample and a word vector model. An entity associated with the text is predicted by inputting word vectors of the plurality of words into an entity prediction model. W O 20 19/13 7562 A 9 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| DZ, EC, EE, EG, ES, Fl, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW. (84) Designated States (unless otherwise indicated, for every kind of regional protection available): ARIPO (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW), Eurasian (AM, AZ, BY, KG, KZ, RU, TJ, TM), European (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, Fl, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR), OAPI (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG). Published: - upon request of the applicant, before the expiration of the time limit referred to in Article 2](2)(a) - without international search report and to be republished upon receipt of that report (Rule 48.2(g)) - with information concerning authorization of rectification of an obvious mistake under Rule 91.3 (b) (Rule 48.2(i)) (48) Date of publication of this corrected version: 13 February 2020 (13.02.2020) (15) Information about Correction: see Notice of 13 February 2020 (13.02.2020)