基于LDA主题模型的文档推荐方法
    12.
    发明公开

    公开(公告)号:CN115017293A

    公开(公告)日:2022-09-06

    申请号:CN202210566870.X

    申请日:2022-05-23

    Abstract: 本发明涉及一种基于LDA主题模型的文档推荐方法,属于信息技术领域。本发明使用了LDA主题模型将每个文档进行向量化,并输出该文档的主题概率,将推荐系统中的所有文档主题概率结合起来便能得到一个文档对主题的矩阵。另一方面,通过给新用户初始化来赋予每个用户一个主题概率,并使用户主题概率的维度与文档主题概率的维度保持一致,然后将所有用户主题概率结合起来得到一个用户对主题的矩阵。最后,通过用户和文档的两个主题概率矩阵,计算出用户对文档的兴趣值并将相应文档推荐给用户。这种推荐方法可以广泛运用在文档推荐系统中,并适用于各类文档。

    基于多任务学习的层次类别命名实体识别模型设计方法

    公开(公告)号:CN114881032A

    公开(公告)日:2022-08-09

    申请号:CN202210462583.4

    申请日:2022-04-28

    Abstract: 本发明涉及一种基于多任务学习的层次类别命名实体识别模型设计方法,属于自然语言处理技术领域。本发明通过在命名实体识别模型中加入对于类别关系的建模,使得模型能够同时识别出命名实体的多个类别,同时,本发明提出了基于多任务学习的模型来解决具有层次类别的命名实体识别问题。模型使用多任务学习机制同时学习多个层次的命名实体识别任务,这些任务共享同一个编码层,这样可以使得编码层学习到的编码向量可以同时适应多个层次的命名实体识别而不是过拟合于某一个单独的层次。最后,还分别设计了两种信息传递机制传递不同层次间的识别信息,以提高模型的识别效果。

    一种基于元学习扩散模型的限定域受限文本生成方法

    公开(公告)号:CN117521666A

    公开(公告)日:2024-02-06

    申请号:CN202311451928.7

    申请日:2023-11-03

    Abstract: 本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。

    一种面向开源情报的多模态数据情感分析方法

    公开(公告)号:CN116561639A

    公开(公告)日:2023-08-08

    申请号:CN202310596095.7

    申请日:2023-05-24

    Abstract: 本发明涉及一种面向开源情报的多模态数据情感分析方法,属于人工智能、大数据、情感分析领域。本发明通过在Spark Streaming框架内封装多模态情感分析模型,实现了资源分类矩阵算子、图文数据对增强算子、多模态算法算子和多标签内容算子;该方法处理过程如下:首先,对从HDFS接收的输入数据进行预处理操作,其次,调用资源分类矩阵算子对文本、视频、图像进行分类处理,再次,调用图文数据对增强算子进行图文数据增强,调用多模态算法算子和多标签内容算子实现情感预测,最后,将预测的结果写入到Kafka,完成情感预测的整个流程。本发明实现大数据+深度学习的技术融合,满足可扩展性和低资源应用,支持海量数据的智能挖掘分析。

Patent Agency Ranking