一种基于模型的新词发现方法

    公开(公告)号:CN113536783A

    公开(公告)日:2021-10-22

    申请号:CN202110797255.5

    申请日:2021-07-14

    Abstract: 本发明公开了一种基于模型的新词发现方法,属于审计技术领域,包括以下步骤:S1、获取审计业务相关文档,S2、对审计业务相关文档进行格式转换,将转换后的审计业务相关文档数据作为后续标注工具的输入数据。本发明中,基于审计数据,利用新词发现技术,实现审计领域词的持续发现,结合梳理的现有行业词库,初步构建审计领域专业词库,后续将通过专业人员对词库进行审核,最终形成审计领域专业词库,为后续审计数据分析提供有效支撑,对文本进行初步的“新词”发现,再由人工发现的“新词”进行审核,提取出真正的审计领域专业词汇,能够在很大程度上减轻纯人工从文档内提取审计领域专业词汇的工作量,提高审计专业词库构建效率。

    基于语义泛化的知识要素抽取方法

    公开(公告)号:CN116822529A

    公开(公告)日:2023-09-29

    申请号:CN202311092677.8

    申请日:2023-08-29

    Abstract: 本发明公开了基于语义泛化的知识要素抽取方法,涉及数据处理技术领域;所述方法包括以下步骤:通过采集语音数据的多项数据信息,将设备运行信息以及通信转换信息进行处理生成泛化评估系数,根据生成的泛化评估系数与设置的泛化评估阈值进行对比,对接收语音的质量进行评估,从而确定了需要进行泛化处理的语音数据,再根据数据精度信息与处理时长信息进行分析,生成抽取影响因子,对知识要素的抽取情况进行分析,根据抽取影响因子与抽取评估阈值的对比结果评估两次知识要素的抽取情况,根据抽取情况的不同进行相应操作,从而增加了智能家居调控的准确性,保障了智能家居运行的高效性。

Patent Agency Ranking