一种基于大数据的智能政务问答系统

    公开(公告)号:CN118410132B

    公开(公告)日:2024-12-06

    申请号:CN202310362407.8

    申请日:2023-04-07

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于大数据的智能政务问答系统,包括:文本解析模块、特征提取模块、信息交互模块、答案预测模块;文本解析模块计算用户的问题Q与文档之间的相关性,选取相关性最高的前K个文档作为召回文档P;特征提取模块提取召回文档P与用户问题Q之间的依存关系特征;所述信息交互模块将召回文档P、用户问题Q以及依存关系特征进行多重注意力信息交互,得到最终的文本向量表示;所述答案预测模块将最终的文本向量表示通过全连接层来预测最终答案的起止位置。本发明通过融入依存关系特征,深入挖掘问题与文档中答案的联系,从而提高了问答系统中标准答案的定位,提升了用户体验。

    一种基于大数据的智能政务问答系统

    公开(公告)号:CN118410132A

    公开(公告)日:2024-07-30

    申请号:CN202310362407.8

    申请日:2023-04-07

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于大数据的智能政务问答系统,包括:文本解析模块、特征提取模块、信息交互模块、答案预测模块;文本解析模块计算用户的问题Q与文档之间的相关性,选取相关性最高的前K个文档作为召回文档P;特征提取模块提取召回文档P与用户问题Q之间的依存关系特征;所述信息交互模块将召回文档P、用户问题Q以及依存关系特征进行多重注意力信息交互,得到最终的文本向量表示;所述答案预测模块将最终的文本向量表示通过全连接层来预测最终答案的起止位置。本发明通过融入依存关系特征,深入挖掘问题与文档中答案的联系,从而提高了问答系统中标准答案的定位,提升了用户体验。

    一种基于大数据的细粒度商品命名实体识别方法

    公开(公告)号:CN115422939A

    公开(公告)日:2022-12-02

    申请号:CN202211260276.4

    申请日:2022-10-14

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于大数据的细粒度商品命名实体识别方法,包括:采用无标注的商品数据S对预训练NEZHA模型进行增量训练,得到继续预训练模型M;构建GPNER模型包括文本处理层、编码层、特征融合层、卷积层、实体边界层、实体分类层;GPNER模型使用特征融合层融入词组信息,增强实体识别的准确率;采用实体边界层和实体分类层多任务的方式对模型参数进行调优。本发明不仅使用了无标注数据对预训练模型NEZHA模型进行了继续预训练,能模型更加适应垂直领域,同时GPNER模型利用了文本长度、词汇信息等知识融入到数据,使模型更加精准的识别到实体边界和辨别实体的种类。

    一种基于人工智能的文本匹配方法

    公开(公告)号:CN115422362A

    公开(公告)日:2022-12-02

    申请号:CN202211226353.4

    申请日:2022-10-09

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于人工智能的文本匹配方法,包括:获取问题匹配的文本,其中包含用户的输入问题和标准问题,对数据集S进行预处理;构建BERT_MF模型包括BERT模型层、知识增强层、精确匹配层、相似度匹配层;BERT_MF模型利用拼音、词性以及句法知识,使用精确匹配层提取局部细粒度表征和全局细粒度表征;采用横向拼接的方式对多粒度特征进行融合,经过Softmax函数进行文本匹配。本发明不仅使用了预训练模型ERNIE‑Gram进行了微调,能够得到文本匹配程度,同时充分使用预训练模型的语义表征和词语表征,可以对文本的局部信息和全局信息进行辨识,进而细粒度的区分文本语义上的匹配。

    基于关键信息抽取的金融舆情细分方面检测方法和设备

    公开(公告)号:CN114398480A

    公开(公告)日:2022-04-26

    申请号:CN202111425815.0

    申请日:2021-11-26

    Abstract: 本发明涉及大数据人工智能技术领域,公开了一种基于关键信息抽取的金融舆情细分方面检测方法和设备,步骤包括对金融文本数据和金融舆情标签描述集合进行预处理;对金融文本片段句和金融舆情标签句进行编码,得到片段句表征;对金融文本片段句和金融舆情标签描述集合进行相似度表征,再进行分类训练,得到关键信息句抽取分类辅助模型;利用关键信息句抽取分类辅助模型计算金融文本片段句对金融舆情标签描述集合的重要程度,并选取标签关键句;构建标签关键句组合输入金融文本,进行细分舆情分类。本发明通过标签描述和片段句建立关键信息句抽取辅助模型,然后抽取关键信息句,构建预训练模型输入,从而有效提升金融舆情细分方面检测的准确率。

Patent Agency Ranking