文件数据处理方法及文件数据处理系统

    公开(公告)号:CN114503094A

    公开(公告)日:2022-05-13

    申请号:CN202080069854.9

    申请日:2020-09-22

    Abstract: 能够作为查询文本输入自然语言、能够对多个文件进行检索并将与所输入的文本相关度高的部分提示给读者。一种文件数据处理系统,包括:读取多个对象文件的文件读取部;将多个对象文件的每一个分割成多个块的文件分割部;按每个块取得单词的分布式表示的第一分布式表示取得部;将第一分布式表示取得部所取得的分布式表示按对象文件且按块进行储存的第一分布式表示保持部;读取查询文本的查询文本读取部;提取查询文本中包含的单词来取得单词的分布式表示的第二分布式表示取得部;储存第二分布式表示取得部所取得的分布式表示的第二分布式表示保持部;以及通过比较查询文本中包含的单词的分布式表示与各个块中包含的单词的分布式表示来算出每个块的相似度的相似度算出部。

    文档检索系统及文档检索方法
    3.
    发明公开

    公开(公告)号:CN113711205A

    公开(公告)日:2021-11-26

    申请号:CN202080029122.7

    申请日:2020-04-16

    Inventor: 东和树 桃纯平

    Abstract: 通过简单的输入方法,实现精度高的文档检索,尤其实现精度高的有关知识产权的文档检索。处理部具有以输入到输入部的文本数据生成文本分析数据的功能、从文本分析数据所包含的词中抽取检索词的功能以及以检索词根据权重词典数据及相似词典数据生成第一检索数据的功能。存储部储存第一检索数据被使用者修改而生成的第二检索数据。处理部根据第二检索数据更新相似词典数据。

    文档检索系统、文档检索方法
    4.
    发明公开

    公开(公告)号:CN114902206A

    公开(公告)日:2022-08-12

    申请号:CN202080091469.4

    申请日:2020-12-28

    Abstract: 提供一种考虑到文档的概念检索文档的文档检索系统。该文档检索系统包括处理部,在处理部中从检索文本形成检索图。检索图包括第一至第m(m为1以上的整数)检索局部图,检索局部图由两个节点及一个边构成。在处理部中对参考文档进行第一至第m句子的检索。第i(i为1以上且m以下的整数)句子具有:第i检索局部图的两个节点中的一方或者两个节点中的一方的相关词或下位词;第i检索局部图的两个节点中的另一方或者两个节点中的另一方的相关词或下位词;以及第i检索局部图的边或者边的相关词或下位词。然后,根据在第一至第m句子中参考文档所包括的句子数对参考文档的得分赋予分数。

    阅读支援系统及阅读支援方法
    5.
    发明公开

    公开(公告)号:CN114080610A

    公开(公告)日:2022-02-22

    申请号:CN202080049396.2

    申请日:2020-06-22

    Abstract: 提供一种阅读支援系统或阅读支援方法,该阅读支援系统或阅读支援方法能够作为查询文本输入自然语言且将与所输入的文本的相关度高的部分提示到读者。该阅读支援系统包括:读取对象文件的文件读取部;将对象文件分割成多个块的文件分割部;按多个块的每一个取得单词的分布式表示的第一分布式表示取得部;读取查询文本的查询文本读取部;抽出包括在查询文本中的单词而取得单词的分布式表示的第二分布式表示取得部;以及对查询文本和多个块的每一个中的单词的分布式表示进行比较而求出相似度的相似度取得部。相似度取得部从包括在块中的单词检索与包括在查询文本中的单词一致的单词而求出所一致的单词的块中的单词的分布式表示与查询文本中的单词的分布式表示的相似度。

    文件检索装置
    6.
    发明公开
    文件检索装置 审中-实审

    公开(公告)号:CN119293202A

    公开(公告)日:2025-01-10

    申请号:CN202411346543.9

    申请日:2019-03-13

    Inventor: 东和树 桃纯平

    Abstract: 本申请涉及文件检索装置。通过简单的输入方法实现精度高的文件检索,尤其实现精度高的有关知识产权的文件检索。一种用于检索与输入文件相关或相似的文件的文件检索装置,包括处理部,该处理部被配置为:从所述输入文件得到第一分布表示向量和所述第一分布表示向量的第一权重;基于与所述第一分布表示向量的相似度来提取第二分布表示向量;得到所述第二分布表示向量的第二权重,所述第二权重包括所述第一权重与所述相似度之乘积;输出所述第一权重和所述第二权重;接收所述第一权重和所述第二权重中的一个或多个的变动值;以及通过使用编辑后的所述第一权重和所述第二权重来执行所述文件的检索。

    文件检索系统及文件检索方法
    7.
    发明公开

    公开(公告)号:CN113841137A

    公开(公告)日:2021-12-24

    申请号:CN202080036660.9

    申请日:2020-05-11

    Abstract: 实现无论检索者的能力如何都能够高效地检索文件的文件检索系统。使用储存有数据库文件数据的文件检索系统检索文件。在向文件检索系统输入第一文件数据和第二文件数据之后,该文件检索系统从第一文件数据抽出多个用语。例如,通过形态分析抽出用语。接着,基于第二文件数据对所抽出的用语进行加权。例如,将第二文件数据所表示的文件所包含的文本区分为第一文本和第二文本。使从第一文件数据抽出的用语中的第一文本所包含的用语的权重大于其他用语的权重。可以基于规则或通过机器学习来区分文本。然后,基于进行了加权的用语算出数据库文件数据的相对于第一文件数据的相似度。

    文件检索系统、文件检索方法、程序以及非暂时性计算机可读存储介质

    公开(公告)号:CN112136126A

    公开(公告)日:2020-12-25

    申请号:CN201980033402.2

    申请日:2019-03-13

    Inventor: 东和树 桃纯平

    Abstract: 通过简单的输入方法实现精度高的文件检索,尤其实现精度高的有关知识产权的文件检索。本发明是一种包括处理部的文件检索系统。处理部具有:提取包括在文本数据中的关键词的功能;从包括在多个第一参考文本分析数据的词中提取关键词的相关词的功能;对关键词及相关词的每一个赋予权重的功能;基于权重给多个第二参考文本分析数据的每一个打分数的功能;基于分数给多个第二参考文本分析数据排序来生成排序数据的功能;以及输出排序数据的功能。

Patent Agency Ranking