-
公开(公告)号:CN111400489A
公开(公告)日:2020-07-10
申请号:CN202010269479.4
申请日:2020-04-08
Applicant: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC: G06F16/34
Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
公开(公告)号:CN108121823A
公开(公告)日:2018-06-05
申请号:CN201810026854.5
申请日:2018-01-11
Applicant: 哈尔滨工业大学
Abstract: Babbling情感对话生成系统及方法,涉及一种对话生成系统。本发明为了解决目前的人工智能对话系统带有情感的回复并不十分准确的问题。本发明提出了一套基于Seq2Seq模型生成情感回复的系统,在传统Seq2Seq模型基础上,Babbling使用微博原句的情感embedding丰富原句的表示。Babbling还融合了Learning to Start机制,从而生成更自然的句首词。为了以提高生成词语主题的相关性,Babbling还采用attention机制,我们将传统的single hop attention过程扩展到multi-hop attention,通过多次attention获得更为抽象并且与微博原文相关的表示,从而进一步提高生成质量。本发明适用于带有情感回复的对话系统。
-
公开(公告)号:CN105630970A
公开(公告)日:2016-06-01
申请号:CN201510990027.4
申请日:2015-12-24
Applicant: 哈尔滨工业大学
CPC classification number: G06F17/3089 , G06Q50/01
Abstract: 社会媒体数据处理系统及方法,属于互联网领域。本发明旨在深入分析微博大数据焦点事件及情感分布,进行社会舆情进行检测。本发明系统包括:用于采集实时微博数据采集的数据模块;用于文本噪声和文本分析的预处理模块;用于事件发现和情感分析的浅层分析模块;用于情感归因分析和基于用户画像的情感分析的深层透视模块;用于社会媒体数据可视化显示模块;本发明方法包括:步骤一、采集实时的微博数据;步骤二、根据采集的实时的微博数据进行文本噪声预处理和文本分析预处理;步骤三、对处理后的文本进行浅层分析;步骤四、根据浅层分析进行深层透视;步骤五、根据浅层分析和深层透视进行社会媒体数据可视化显示。本发明用于社会舆情监测。
-
公开(公告)号:CN103034693B
公开(公告)日:2016-03-02
申请号:CN201210509993.6
申请日:2012-12-03
Applicant: 哈尔滨工业大学
Abstract: 开放式实体及其类型识别方法,涉及一种实体及其类型识别方法,为了解决目前采用弱指导方法的实体识别方法存在一些缺陷的问题。它包括:一:通过依存句法关系信息和汉语依存关系树库,自动构建训练语料;二:利用训练语料的有效特征训练条件随机域模型形成统计模型,所述统计模型自动识别出实体的边界;三:查询实例集中是否存在步骤二中所述实体,若存在,输出所述实体及对应的类型,结束;若不存在,则转入步骤四;四:基于模式匹配的方法进行实体的语义类抽取,扩充实例集,转入步骤三。它用于教学实验中。它用于识别开放式实体及其类型。
-
公开(公告)号:CN105354216A
公开(公告)日:2016-02-24
申请号:CN201510627783.0
申请日:2015-09-28
Applicant: 哈尔滨工业大学
IPC: G06F17/30
CPC classification number: G06F17/30616 , G06F17/30705
Abstract: 一种中文微博话题信息处理方法,本发明涉及微博事件情感分布的原因分析算法。本发明是为了解决目前微博话题信息处理方法中采用的层次聚类算法和纠正算法的准确率低,不能将事件相关的微博划分到正确的主题下。本发明使用无监督学习的层次聚类排序方法和半监督学习的微博话题纠正算法两种方法,进行事件话题及其相关微博的挖掘,最终达到对相关微博进行情感分布统计及分析的目的。本发明能够更加准确地进行微博话题信息处理。本发明应用于微博话题信息处理领域。
-
公开(公告)号:CN119939343A
公开(公告)日:2025-05-06
申请号:CN202510021200.3
申请日:2025-01-07
Applicant: 哈尔滨工业大学
IPC: G06F18/241 , G06F18/213 , G06F40/30 , G06N3/045 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于联合损失框架与后编辑优化的脑电信号文本解码方法,所属领域为脑机接口和自然语言处理领域,包括:获取脑电信号,基于脑电特征提取网络构建分类模型,将所述脑电信号输入至所述分类模型中,获得预定的语义类别;基于混合解码框架构建解码模型,将所述脑电信号输入至所述解码模型中,获得输出特征文本;基于预训练语言模型构建后编辑模型,基于所述后编辑模型对所述预定的语义类别和所述输出特征文本进行后编辑,获得文本解码结果。本发明通过引入CTC/Attention混合框架,使得解码过程可以在没有外部对齐信息的情况下自动完成,降低了对眼动等外部信号的依赖,增强了方法的通用性。
-
公开(公告)号:CN119577113A
公开(公告)日:2025-03-07
申请号:CN202411653554.1
申请日:2024-11-19
Applicant: 哈尔滨工业大学
IPC: G06F16/334 , G06F16/335 , G06F16/338 , G06N20/00
Abstract: 一种基于医学文献信息的医学知识显式归因系统,本发明属于计算机领域人工智能中自然语言处理领域,涉及基于医学文献信息的医学知识显式归因系统。本发明的目的是为了解决现有医学信息和知识的多样性和复杂性使得医学归因和诊断中常存在信息不确定性,导致医学知识在实际应用中缺乏可靠性验证的问题。系统包括:查询文本模块、查询向量模块、文档向量模块、语义相似度模块、文献集合筛选模块、基本原理获取模块、待验证医学知识判断模块和结果输出模块;所述基本原理获取模块用于获取基本原理;所述待验证医学知识判断模块用于判断待验证医学知识的真假;所述结果输出模块用于输出待验证医学知识判断模块的结果和基本原理获取模块的结果。
-
公开(公告)号:CN119493848A
公开(公告)日:2025-02-21
申请号:CN202411647399.2
申请日:2024-11-18
Applicant: 哈尔滨工业大学
IPC: G06F16/3329 , G06F16/334 , G16H70/00 , G06N3/084 , G06N3/09 , G06N5/022 , G06N5/04
Abstract: 一种基于大语言模型的医学问答系统,本发明属于计算机领域人工智能中大语言模型领域,具体涉及基于大语言模型的医学问答系统。本发明的目的是为了解决通用大语言模型在医学领域上回答准确性低,解决医学问题能力差的问题。系统包括:大语言基座模块用于选取一个通用领域的开源大语言模型作为基座模型;知识实例采样模块用于从知识图谱中采样知识实例;问答数据生成模块用于使用大语言基座模型根据知识实例生成问答数据;大语言基座模型微调模块用于使用生成的问答数据对大语言基座模型进行微调,获得微调好的大语言基座模型;回复生成模块用于基于微调好的大语言基座模型对待处理医学知识问题进行回答。
-
公开(公告)号:CN112560472B
公开(公告)日:2023-07-11
申请号:CN201910918780.0
申请日:2019-09-26
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F40/30 , G06F40/289 , G06F40/242 , G06F16/35 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本申请是关于一种识别敏感信息的方法及装置,属于信息处理领域。所述方法包括:获取待识别的文本信息中包括的m个词语的词向量,第一词语的词向量是所述第一词语的语义表示,所述第一词语是所述m个词语中的一个,m为大于1的整数;基于所述第一词语的词向量和第二词语的词向量生成所述第一词语的隐层向量,所述第二词语是与所述第一词语前后相邻的词语,所述第一词语的隐层向量是所述第一词语的语义表示和上下文信息的语义表示;根据所述m个词语的隐层向量识别所述文本信息是否为敏感信息。本申请能够提高识别敏感信息的精度。
-
公开(公告)号:CN111339752B
公开(公告)日:2023-04-25
申请号:CN202010099489.8
申请日:2020-02-18
Applicant: 哈尔滨工业大学
IPC: G06F40/216 , G06F40/289 , G06F16/35
Abstract: 一种多任务联合学习的面向评价对象的情感分析方法,本发明涉及多任务联合学习的面向评价对象的情感分析方法。本发明的目的是为了解决现有文本对评价对象、评价对象情感、评价词抽取未考虑关联性,导致对文本有用信息抽取准确率低的问题。过程为:一、将文本进行词向量表示;二、将文本的词向量表示进行初步抽象,得到共享表示;三、基于二进行评价对象和评价词抽取,得到评价对象和评价词抽取的标签概率分布;四、基于二和三进行评价对象情感判断,得到评价对象情感判断的标签概率分布;五、得到更新后的概率分布;六、得到情感分析模型,采用情感分析模型完成对评价对象的情感分析。本发明用于评价对象、评价对象情感与评价词联合抽取领域。
-
-
-
-
-
-
-
-
-