基于主题共现网络和外部知识的主题识别方法、系统及设备

    公开(公告)号:CN112800214B

    公开(公告)日:2023-04-18

    申请号:CN202110128830.2

    申请日:2021-01-29

    Abstract: 本发明公开了一种基于主题共现网络和外部知识的主题识别方法,方法具体为:基于标注数据的主题共现网络构建:使用已有带主题标注的领域知识文本,检测文本中的主题子词并以此构建主题共现网络;融合外部知识和主题共现网络的开关模块构建:使用共现网络对带主题标注的领域知识文本进行信息丰富度排序,并以此排序结合外部知识构成开关模块;引入开关模块的改进领域知识文本主题识别模型自训练:使用自训练方法训练领域知识文本主题识别模型,尽可能使用无主题标注的领域知识文本的信息,防止自训练不加选择地学习无主题标注领域知识文本导致泛化性能下降;更充分更高效地利用有限语料信息,提升领域知识文本主题识别模型的性能。

    基于集成学习模型的就业推荐方法、系统、设备及介质

    公开(公告)号:CN115409661A

    公开(公告)日:2022-11-29

    申请号:CN202211048512.6

    申请日:2022-08-30

    Abstract: 本发明公开了一种基于集成学习模型的就业推荐方法、系统、设备及介质,包括:获取用户u及各推荐项目c,将用户u的特征及各推荐项目c的特征进行向量化编码;将用户u的特征向量、用户u已有的交互记录向量和用户u与各推荐项目c的特征向量输入到训练后的集成学习模型中,得到各推荐项目的得分,完成基于集成学习模型的就业推荐,其中,所述集成学习模型由相似性信息组件、全局交互信息组件和特征匹配信息组件构成,该方法、系统、设备及介质能够提高模型的泛化能力及可扩展性,继而提高就业推荐的准确性。

    基于主题共现网络和外部知识的主题识别方法、系统及设备

    公开(公告)号:CN112800214A

    公开(公告)日:2021-05-14

    申请号:CN202110128830.2

    申请日:2021-01-29

    Abstract: 本发明公开了一种基于主题共现网络和外部知识的主题识别方法,方法具体为:基于标注数据的主题共现网络构建:使用已有带主题标注的领域知识文本,检测文本中的主题子词并以此构建主题共现网络;融合外部知识和主题共现网络的开关模块构建:使用共现网络对带主题标注的领域知识文本进行信息丰富度排序,并以此排序结合外部知识构成开关模块;引入开关模块的改进领域知识文本主题识别模型自训练:使用自训练方法训练领域知识文本主题识别模型,尽可能使用无主题标注的领域知识文本的信息,防止自训练不加选择地学习无主题标注领域知识文本导致泛化性能下降;更充分更高效地利用有限语料信息,提升领域知识文本主题识别模型的性能。

Patent Agency Ranking