一种融合规则和学习模型的短文本信息提取方法及系统

    公开(公告)号:CN116956930A

    公开(公告)日:2023-10-27

    申请号:CN202311213748.5

    申请日:2023-09-20

    Abstract: 本发明公开了一种融合规则和学习模型的短文本信息提取方法,包括:获取短文本数据;对短文本数据进行预处理,得到预处理短文本数据;对预处理短文本数据进行标注,得到标注短文本数据;通过HyperScan模块对标注短文本数据进行处理,处理后的数据构成HyperScan数据库;将目标短文本输入至HyperScan模块,基于HyperScan数据库进行匹配,得到第一识别序列;基于标注短文本数据对学习模型进行训练,得到优化学习模型;将目标短文本输入至优化学习模型,得到第二识别序列;基于第一识别序列和第二识别序列确定目标短文本的提取信息。能够提高数据质量,减少人工成本,高效精准的提取短文本信息。

Patent Agency Ranking