-
公开(公告)号:CN107967257A
公开(公告)日:2018-04-27
申请号:CN201711160875.8
申请日:2017-11-20
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及一种级联式作文生成方法,是为了解决现有技术仅针对作文评分进行研究,未出现关于作文生成方法的研究,以及已有的主题分析技术很难对作文的题目进行分析的缺点而提出的。本发明用一个或多个话题词表示待生成作文的中心思想;得到话题词后,将作文生成分解为话题词扩充、句子抽取和篇章组织;话题词扩展后,利用句子抽取模块寻找与话题词相关的句子,并最终使用篇章组织模块对抽取获得的句子排序,使之成为连贯的整体。本发明还可以从已抽取的句子集合中挖掘词语对已有的话题词进行补充。本发明适用于自动作文生成。
-
公开(公告)号:CN102033922A
公开(公告)日:2011-04-27
申请号:CN201010587346.8
申请日:2010-12-14
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 一种基于词汇链的关键短语抽取方法,涉及一种关键短语抽取方法。本发明为了解决现有的关键词抽取方法无法确切反映文章叙述的主题信息,现有的基于词汇链的关键短语抽取方法中关键短语抽取的准确性及对文档主题信息的覆盖性较低的问题。具体步骤:一、获取词义;二、使用词典《知网》对词语进行消歧;三、对消歧后的词语构建词汇链,并获得多个强链;四、从多个强链中选择中心词,构成中心词集合;五、计算中心词集合中不同中心词间的同现率,选择同现率大于用户设定的抽取阈值的中心词作为关键短语。本发明能够有效的反应文档的主题信息,提高关键短语抽取的准确性,仅需要少量的关键短语就可以有效覆盖文档的主题信息。应用于关键词抽取领域。
-
公开(公告)号:CN119691152A
公开(公告)日:2025-03-25
申请号:CN202411828667.0
申请日:2024-12-12
Applicant: 哈尔滨工业大学
IPC: G06F16/334 , G06F16/35 , G06F16/31 , G06F18/214
Abstract: 一种两阶段少样本自动事实核查方法、电子设备及存储介质,属于信息处理技术领域。为提高信息核查的准确性和效率,本发明包括选择公开事实验证数据集构建测试集;构建证据检索模型,采用证据检索模型对测试集的文档进行检索得到候选文档;构建句子选择模型,将候选文档中的每个句子与声明输入到提示模板中组合为句子选择模型的输入,输出句子的相关性分数作为声明验证的证据句子;构建预训练语言模型并对预训练语言模型进行微调;将声明验证的证据句子与待验证声明输入到提示模板中组合为预训练语言模型的输入,并输入到微调后的预训练语言模型中得到自然语言输出,然后映射到分类标签,依据输出序列的生成概率计算预测分数,得到最终的预测结果。
-
公开(公告)号:CN117422527B
公开(公告)日:2024-05-03
申请号:CN202311526419.6
申请日:2023-11-15
Applicant: 哈尔滨工业大学
IPC: G06Q30/0601 , G06F16/9536 , G06F16/9535
Abstract: 本发明公开了一种基于用户偏好感知的全新商品冷启动方法,包括:获取用户协同特征、商品协同特征和商品内容特征;基于用户协同特征和商品协同特征,建立用户与商品的关系模型;基于商品协同特征和商品内容特征,将同一商品的内容特征与协同特征进行对齐,获取商品层级特征对齐模型;将同一用户购买记录中除目标商品外的所有商品的协同特征进行聚合,获取用户偏好;将用户偏好与商品内容特征进行对齐,获取群组层级特征对齐模型;将用户与商品的关系模型、商品层级特征对齐模型、群组层级特征对齐模型进行联合损失优化,获取联合损失模型,并将原有商品和全新商品分别通过协同特征和内容特征进行推荐。本发明能够更好的解决全新商品冷启动问题。
-
公开(公告)号:CN114201621B
公开(公告)日:2024-04-02
申请号:CN202111406136.9
申请日:2021-11-24
IPC: G06F16/43 , G06F16/583 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/044
Abstract: 本发明公开了一种基于图文协同注意力的跨模态检索模型构建及检索方法,所述方法包括:获取训练图像和训练文本,分别提取图像样本和文本样本的局部特征;将图像样本所有的局部图像特征和文本样本所有的局部文本特征分别映射为特征向量,并将图像样本和文本样本的特征向量分别表示成矩阵,再得到各自的Key矩阵、Query矩阵和Value矩阵;基于该多个矩阵,计算出图像样本和文本样本的跨模态注意力特征、模态内注意力特征;将跨模态注意力特征和模态内注意力特征进行融合,得到图像样本的全局特征表示和文本样本的全局特征表示;基于所述全局特征表示,训练得到跨模态检索模型。本发明可直接对不同模态的数据进行相似度匹配,具有较高的匹配准确性。
-
公开(公告)号:CN117422526A
公开(公告)日:2024-01-19
申请号:CN202311518835.1
申请日:2023-11-15
Applicant: 哈尔滨工业大学
IPC: G06Q30/0601 , G06F16/9535 , G06N3/0895
Abstract: 本发明公开了一种基于提示的用户跨域冷启动方法,包括:获取用户特有表征、用户通用表征和商品表征;通过用户特有表征和商品表征,获取场景提示向量;根据场景提示向量和用户通用表征,获取目标场景的特有表征,完成基于提示的用户跨域冷启动。本发明通过提出的场景提示生成方法,通过最大化目标场景的提示与目标场景中所有用户与商品之间的互信息的方式,对每个场景的特征进行全面捕捉;本发明中的基于场景提示的目标场景用户表征生成方法,通过考虑不同场景之间的关系以及每个场景的特征,在仅仅知道用户通用表征的情况下,依然可以实现在不同场景中对同一用户进行精准个性化推荐的效果,进而解决用户跨域冷启动问题。
-
公开(公告)号:CN116738984A
公开(公告)日:2023-09-12
申请号:CN202310748270.X
申请日:2023-06-25
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/117 , G06F40/186 , G06N20/00
Abstract: 本发明公开了一种基于提示学习的自动化数据标注方法,包括:获取有标注数据集和无标注数据集;对所述有标注数据集的实体信息进行提取,获取实体词;基于所述实体词对所述无标注数据集进行筛选,获取筛选后的无标注数据集;构建提示模板组,基于预训练语言模型利用所述提示模板组对所述筛选后的无标注数据集进行测试,获取正向/负向数据;基于所述提示模板组将所述有标注数据集的中性情感数据输入所述预训练语言模型,获取填充完整的提示模板;基于所述填充完整的提示模板和所述正向/负向情感数据,构建完整的扩充数据集,实现基于提示学习的自动化数据标注。
-
公开(公告)号:CN116484123A
公开(公告)日:2023-07-25
申请号:CN202310486453.9
申请日:2023-04-28
Applicant: 哈尔滨工业大学
IPC: G06F16/9538 , G06F16/35 , G06F18/22 , G06F18/24 , G06N3/0442
Abstract: 本发明提供一种长文本的标签推荐模型构建方法及标签推荐方法,涉及自然语言处理技术领域,该模型构建方法包括:获取历史长文本,对历史长文本进行标注,得到文本标签、标准相似度、历史子句和子句的历史权重;根据历史权重得到历史关键句,对文本标签进行标签扩充,得到历史伪标签,并根据历史伪相得到历史标签序列;以上述数据训练初始预测模型,得到预测模型;以上述数据训练初始排序模型,得到重排序模型;根据预测模型和重排序模型得到标签推荐模型。本发明的有益效果:根据子句权重得到表示长文本含义的关键句,对文本标签进行扩充以得到便于模型理解的伪标签,实现长文本的标签推荐,且有效提升了模型的准确度。
-
公开(公告)号:CN113535957B
公开(公告)日:2022-08-02
申请号:CN202110850763.5
申请日:2021-07-27
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/36 , G06N5/02 , G06N3/08 , G06F40/284 , G06F40/242
Abstract: 本申请公开了一种基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理技术领域。解决了现有Emotion Recognition in Conversation(ERC)模型忽视了话语和知识的直接交互;使用与主任务弱相关的辅助任务,只能为ERC任务提供有限的情感信息的问题。本申请利用一个大规模知识图谱中的常识知识来增强词级别表示。使用一个自匹配模块整合知识表示和话语表示,允许二者进行复杂交互。将短语级别的情感极性强度预测任务作为辅助任务。该辅助任务的标签来自情感词典的情感极性强度值,明显与ERC任务高度相关,为目标话语的情绪感知提供了直接指导信息。
-
公开(公告)号:CN113535957A
公开(公告)日:2021-10-22
申请号:CN202110850763.5
申请日:2021-07-27
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/36 , G06N5/02 , G06N3/08 , G06F40/284 , G06F40/242
Abstract: 本申请公开了一种基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理技术领域。解决了现有Emotion Recognition in Conversation(ERC)模型忽视了话语和知识的直接交互;使用与主任务弱相关的辅助任务,只能为ERC任务提供有限的情感信息的问题。本申请利用一个大规模知识图谱中的常识知识来增强词级别表示。使用一个自匹配模块整合知识表示和话语表示,允许二者进行复杂交互。将短语级别的情感极性强度预测任务作为辅助任务。该辅助任务的标签来自情感词典的情感极性强度值,明显与ERC任务高度相关,为目标话语的情绪感知提供了直接指导信息。
-
-
-
-
-
-
-
-
-