会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
热词
    • 44. 发明专利
    • 情報処理装置及びプログラム
    • JP2020154395A
    • 2020-09-24
    • JP2019049750
    • 2019-03-18
    • 富士ゼロックス株式会社
    • 小林 真之
    • G06F16/951G06F16/31
    • 【課題】索引データを作成する際に参照されるコンテンツの範囲を制限する。 【解決手段】情報処理装置10は、インデックスの作成対象となるコンテンツを取得するコンテンツ取得部11と、取得されたコンテンツの中から用語を抽出する用語抽出部12と、抽出された用語の中からインデックスに含める用語として不要な不要用語を選出して、不要用語記憶部18に保存する不要用語選出処理部13と、取得されたコンテンツを所定のブロックに分割するコンテンツ分割部14と、不要用語記憶部18に保存されている不要用語を参照して、各ブロックにおいてコンテンツのインデックスの作成の際に参照させない範囲を決定する削除範囲決定部15と、削除範囲決定部15により決定された削除範囲を、取得されたコンテンツから削除することによってインデックス作成用のコンテンツを生成するインデックス作成用コンテンツ生成部16と、を有する。 【選択図】図1
    • 47. 发明专利
    • ZWISCHENGESPEICHERTER AKTUALISIERBARER TOP-K-INDEX
    • DE112021000623T5
    • 2022-11-10
    • DE112021000623
    • 2021-03-25
    • IBM
    • YOSHIDA ISSEI
    • G06F16/31G06F12/08G06F16/338G06F16/901
    • Es wird ein Verfahren bereitgestellt, das in einem zweiten Speicher eine Indexstruktur speichert, die für jedes gegebene Wort aus in Dokumenten enthaltenen Wörtern eine Gruppe von Dokument-IDs von Dokumenten enthält, die das gegebene Wort enthalten. Bei dem Verfahren wird ein Teilsatz der Indexstruktur in einem Hauptspeicher gespeichert, der schneller ist als der Sekundärspeicher. Bei dem Verfahren werden ein Schlüsselwort erfasst und alle Dokumente identifiziert, die das Schlüsselwort enthalten. Mit dem Verfahren werden unter den in den identifizierten Dokumenten enthaltenen Wörtern Top-K-häufigste Wörter aufgefunden durch: für jede gegebene Gruppe in absteigender Reihenfolge der Anzahl darin enthaltener Dokument-IDs erfolgendes Identifizieren der Anzahl von Dokument-IDs der identifizierten Dokumente in der gegebenen Gruppe aus dem Teilsatz, wenn die Anzahl der Dokument-IDs in der gegebenen Gruppe innerhalb des Bereichs liegt, und andernfalls aus der Indexstruktur; und Präsentieren von Wörtern aus Top-K-Gruppen mit einer größten Menge identifizierter Dokument-IDs.