-
公开(公告)号:CN118446202A
公开(公告)日:2024-08-06
申请号:CN202410558437.0
申请日:2024-05-08
Applicant: 北京理工大学
IPC: G06F40/194 , G06F40/16 , G06F18/22 , G06F18/214 , G06F18/21 , G06F18/25
Abstract: 本发明涉及一种基于写作风格的生成文本来源检测方法,属于人工智能与文本检测技术领域,该方法包括:S1,生成文本内容的识别与编码;S2,特征提取;S3,特征输入与融合;S4,损失函数计算与优化;S5,训练模型;S6,根据训练好的模型,验证集评估模型的准确率和召回率,根据结果优化模型参数。在步骤S3中,对于每个文本样本,使用Llama2计算其困惑度分数。本发明使用多维特征融合框架,通过计算文本困惑度分数和嵌入向量并将其融合来代表各个文本生成源的写作风格,有效捕获了群体写作风格的核心特征,增强了文本源的区分能力,显著地提升了基于写作风格的识别性能,对保护文本的真实性有重要的意义。
-
公开(公告)号:CN117150113A
公开(公告)日:2023-12-01
申请号:CN202310625164.2
申请日:2023-05-30
Applicant: 北京理工大学
IPC: G06F16/9535 , G06F40/126 , G06N3/0442 , G06N3/045 , G06N3/048
Abstract: 本发明涉及一种基于长短期偏好的科技情报推荐方法,属于推荐系统领域,可用于为用户提供个性化的科技情报推荐。该方法包括:利用多头自注意力机制分别提取情报标题和摘要的表示,然后结合情报来源表示以获取更准确的情报表示;采用长短期记忆网络和用户ID嵌入的方法学习长短期偏好表示;以及将长短期偏好表示与情报表示相结合,计算推荐得分,从而实现个性化的科技情报推荐。本发明解决了现有推荐系统在情报表示方面的不足以及在捕捉用户长短期兴趣方面不精确的问题,可以在推荐过程中捕捉到新颖性和突发性的科技情报,适用于国防、科研、教育等领域的情报推荐场景,有助于提高情报工作人员的工作效率,促进知识传播和技术创新。
-
公开(公告)号:CN115358234A
公开(公告)日:2022-11-18
申请号:CN202210828795.X
申请日:2022-07-14
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于图卷积网络与关系证据互指导的篇章关系抽取方法,属于计算机自然语言处理技术领域。本发明针对文档级别的文本,构造包含实体提及和实体关系两种节点的文档图,利用图卷积神经网络学习关系表征。同时,利用关系表征指导证据集抽取网络抽取对应的证据集,最后将证据集表征融入关系表征进行关系判别。本发明通过关系抽取和证据集抽取两通道任务的联合训练。关系抽取为证据集抽取提供特定关系信息,证据集抽取为关系抽取提供依据信息,从而提高篇章关系抽取的效果。同时,在文档图中创新性的增加关系节点促进了实体之间的消息传递,有利于模型充分学习语义表征。
-
公开(公告)号:CN114707516A
公开(公告)日:2022-07-05
申请号:CN202210322393.2
申请日:2022-03-29
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于对比学习的长文本语义相似度计算方法,属于人工智能、自然语言处理技术领域。本发明主要解决的技术问题为小样本场景下长文本语义匹配问题。首先通过爬虫、人工采集手段构建通用、领域数据库。其次使用领域数据库和通用数据库中包含的主题、标题、关键短语等篇章结构信息构建模型,通过有监督的文本表示学习方法对比学习进行训练。最后使用该模型对待评价文本进行预测来获得相似度打分,经过人工修正模块对该语义打分进行修正,并决定是否将该文本加入领域数据库进一步扩大训练资源。定期使用领域资源库更新模型,实现小样本下高精度语义相似度计算。
-
公开(公告)号:CN110991167B
公开(公告)日:2021-10-08
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
公开(公告)号:CN110991167A
公开(公告)日:2020-04-10
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
-
-
-
-