-
公开(公告)号:CN113168415A
公开(公告)日:2021-07-23
申请号:CN201980076644.X
申请日:2019-11-19
Applicant: 株式会社半导体能源研究所
IPC: G06F16/33 , G06F16/338
Abstract: 按文件块进行相似文件的检索。以高精度进行文件检索。从将多个检索对象文件切分来创建的多个文本块中检索特定文本块。准备为检索文件的一部分的第一检索文本块,将多个文本块中的至少一部分作为第一对象,使用第一检索文本块作为检索条件进行全文检索,由此计算出每一包括在第一对象中的文本块与第一检索文本块之间的第一相关度,基于第一相关度从第一对象中决定第二对象,按包括在第一检索文本块中的句子进行与每一包括在第二对象中的句子之间的第一相似度计算,利用第一相似度检索出至少一个与第一检索文本块相似的文本块。
-
公开(公告)号:CN116601640A
公开(公告)日:2023-08-15
申请号:CN202180079905.0
申请日:2021-12-02
Applicant: 株式会社半导体能源研究所
IPC: G06N3/02
Abstract: 提供一种用户容易判断是否笔误等的校对系统。提供一种校对系统,其中使用将包括在比较文档群中的文本分割为多个第一词并将第一词转换为图像来取得的比较图像群进行校对。具体而言,首先,将包括在指定文档中的文本分割为多个第二词,取得比较文档群中的多个第二词的出现频率。接着,将多个第二词中的出现频率为阈值以下的第二词转换为图像来取得验证图像。然后,取得验证图像与包括在比较图像群中的比较图像的相似度,至少提供比较图像中的相似度最高的比较图像所表示的第一词。提供例如通过显示验证图像所表示的第二词有可能是与验证图像的相似度较高的比较图像所表示的第一词的笔误来进行。
-