-
公开(公告)号:CN104021385A
公开(公告)日:2014-09-03
申请号:CN201310066629.1
申请日:2013-03-02
Applicant: 北京信息科技大学
IPC: G06K9/20
Abstract: 基于模板匹配及曲线拟合的视频字幕细化方法,涉及多媒体信息处理领域。本发明结合汉字的结构特征,对汉字笔划进行提取与重绘,从而达到汉字细化的效果,解决了其他细化算法在对该类对象进行细化时产生的笔划扭曲、丢失及识别率低的问题。本发明技术要点包括:获取视频字幕中汉字图像;确定汉字图像的连通区域;提出模板匹配法提取同一连通区域内汉字笔划;提出用水平、竖直线段重绘 “横”、“竖”笔划,二次Bezier曲线重绘“撇”、“捺”笔划,斜线段重绘“点”笔划的方法,从而实现汉字图像的细化效果。本发明保持了汉字的形状及笔划结构,避免了扭曲现象;保证了笔划的横平竖直及撇捺的弯曲度,更好地重绘出汉字的形态;提高了视频字幕的识别效果。
-
公开(公告)号:CN116028846A
公开(公告)日:2023-04-28
申请号:CN202211628659.2
申请日:2022-12-20
Applicant: 北京信息科技大学
IPC: G06F18/24 , G06F18/25 , G10L15/16 , G06V10/82 , G06V20/40 , G06N3/0455 , G06N3/0442
Abstract: 本发明公开了一种融合多特征和注意力机制的多模态情感分析模型,该模型具体包括以下步骤:通过多模态特征提取模块获得各模态丰富的低层特征;通过自注意力机制实现对三种模态内部信息的提取,获得对应的高层特征;通过跨模态注意力机制分别实现音频‑文本和视频‑文本的交互,在空间上实现模态间信息的交互,将学习到的模态内部信息和模态间交互信息进行拼接,得到更加丰富的音频和视频融合特征;最后拼接三种模态的最终表示并传入一个软注意力模块,为三种模态分配不同的权重,通过全连接层实现多模态情感分类结果。在公开数据集CH‑SIMS上进行测试,本发明可以有效提升多模态情感分析的准确性。
-
公开(公告)号:CN115601588A
公开(公告)日:2023-01-13
申请号:CN202211196793.X
申请日:2022-09-30
Applicant: 北京信息科技大学(CN)
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明涉及计算机视觉领域的模型解释方法,特别涉及针对图像分类深度学习模型得到模型可解释性语句,提升模型解释效果,包括以下步骤:计算分类模型神经元置信度分数;利用反向传播推导出对应神经元权重并与置信度相乘作为最终评分找出重要神经元;使用类激活图将重要神经元在图像上的关注区域可视化,提取视觉特征,并用同样方法构建对应类的神经元视觉特征数据集;将视觉特征数据集标注对应语义信息并使用分类网络对其进行训练;使用训练好的分类网络提取重要神经元视觉特征对应的语义信息;结合神经元重要程度分数、视觉特征、语义信息组成描述此模型分类过程的解释性语句。
-
公开(公告)号:CN114091442A
公开(公告)日:2022-02-25
申请号:CN202111213156.4
申请日:2021-10-19
Applicant: 北京信息科技大学
IPC: G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种文本关键词提取方法。本申请实施例提供的文本关键词提取方法,基于多特征融合进行关键词提取,利用BERT向量和五笔向量捕捉输入序列的语义特征和字形特征,并将字频特征作为权重值进一步获取输入序列的上下文特征,从而使编码层BiLSTM捕捉到长序列更多的语义信息,并利用CRF添加约束信息促使输出标签序列结果更合理有效。本申请实施例提出的文本关键词提取方法,基于多特征融合进行关键词提取,可以有效地提升关键词提取的效果,取得了较高的准确率、召回率和F1值,完全能够满足实际应用的需要。
-
公开(公告)号:CN114065780A
公开(公告)日:2022-02-18
申请号:CN202111212884.3
申请日:2021-10-19
Applicant: 北京信息科技大学
IPC: G06F40/58 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种机器翻译方法,通过Transformer模型实现,所述Transformer模型由多个同构的编码器和解码器组成,所述编码器用于编码中文的新能源专利文本,所述解码器用于产出对应英文专利的翻译结果;所述编码器与所述解码器都使用多头自注意力机制来捕获句子内部结构,所述编码器与所述解码器之间通过注意力机制连接来进行对齐翻译。本申请的机器翻译方法,能有效将术语信息整合到新能源中英专利机器翻译中,提高了翻译质量,并且大部分术语词都能得到正确的翻译。
-
公开(公告)号:CN112561313A
公开(公告)日:2021-03-26
申请号:CN202011470328.1
申请日:2020-12-15
Applicant: 北京信息科技大学
Abstract: 本申请公开了一种专利质量等级的确定方法,包括:利用将指标量化模型与多任务学习序列模型相结合得到的模型,对专利的质量等级进行确定。所述指标量化模型包括依次连接的第一全连接层、第二全连接层、Softmax层和输出层。所述将指标量化模型与多任务学习序列模型相结合得到的模型包括依次连接的嵌入层、BiLSTM层、CRF层、注意力分配、全连接层、Softmax层和输出层。所述所述将指标量化模型与多任务学习序列模型相结合得到的模型包括嵌入层、BiLSTM、BiLSTM+Attention、BiGRU+Attention与多任务学习方法。本申请的方法将指标量化模型与多任务学习序列模型相结合,对专利的等级进行确定,确定结果准确,准确度高。
-
公开(公告)号:CN112418182A
公开(公告)日:2021-02-26
申请号:CN202011470737.1
申请日:2020-12-15
Applicant: 北京信息科技大学
Abstract: 本申请公开了一种红外影厅图像人数统计方法,包括:对红外影厅图像进行预处理;针对预处理后的图像,提取前景图像;根据随机采样的数据进行拟合,根据拟合结果进行校正,计算前景面积;建立所述前景面积与人数的线性回归关系,计算人数。本申请的方法,将多个影厅的原图与其前景图像进行端到端训练,实现不同影厅图像的前景提取,再结合改进透视效应校正方法,提取前景面积并建立其与人数的回归关系,得到最终人数统计结果,本申请实施例提供的方法提取效果好,分类准确率、召回率及前景准确率较高,假正率和假负率较低,无论是在人群稀疏还是密集场景,均能够得到较好的前景提取效果,增强了算法对不同场景、不同光线的鲁棒性。
-
公开(公告)号:CN112101970A
公开(公告)日:2020-12-18
申请号:CN202011213761.7
申请日:2020-11-04
Applicant: 北京信息科技大学 , 阳光易购(湖南)科技有限公司
Abstract: 本发明公开了一种基于区块链食品溯源系统的后台数据管理方法及系统,所述方法包括获取通过所述客户端上报的疫情信息,其中,所述疫情信息包括门店名和疫情食材名;筛选出与所述门店名一致的所述餐饮主体名,并标记为疫情餐饮主体名;获取包括了所述疫情餐饮主体名的所述餐饮商信息,并标记为源头疫情单位信息;获取所述源头疫情单位信息对应的所有的所述台账信息;本发明提出的一种基于区块链食品溯源系统的后台数据管理方法将防疫功能和食品溯源技术进行了有效的结合,大大提升了食品溯源技术的应用范围,不仅能够对食品安全市场进行监督,还增加了卫生健康监督的能力。
-
公开(公告)号:CN110134787A
公开(公告)日:2019-08-16
申请号:CN201910400320.9
申请日:2019-05-15
Applicant: 北京信息科技大学
IPC: G06F16/35
Abstract: 本发明涉及一种新闻话题检测方法包括:步骤1)对新闻语料集进行预处理,对文本信息进行关键词抽取;步骤2)采用抽取出的关键词集,通过聚类的方法,计算新闻报道与话题类簇之间的相似度,得到关键词类簇,选出具有代表性的关键词作为报道事件的关键词。本发明提供的新闻话题检测方法,提出了改进的相似度计算方法,采用抽取出的关键词集,通过聚类的方法,动态地调整新闻报道与话题的相似度,得到关键词类簇,选出具有代表性的关键词作为报道事件的关键词,用来完成新闻话题的检测,能够对新闻报道中的信息进行准确抽取,能够准确地自动检测新闻报道话题,使得话题能够自动更新并动态演化,检测效果好,可以很好地满足实际应用的需要。
-
公开(公告)号:CN110059192A
公开(公告)日:2019-07-26
申请号:CN201910404059.X
申请日:2019-05-15
Applicant: 北京信息科技大学
IPC: G06F16/35
Abstract: 本发明涉及一种基于五笔码的字符级文本分类方法,采用五笔字型码对中文进行转换的字符级表示模型,采用五笔码将中文字符转化成唯一的英文字符串,再将英文字符串输入字符级模型中进行分类。本发明提供的基于五笔码的字符级文本分类方法,采用字符级表示模型,无需分词且能进行很好的字符转化,在中文文本分类中有着特殊的优势,分类效果明显优于传统模型和其他深度学习模型,可以有效地应用于中文文本分类,可以很好地满足实际应用的需要。
-
-
-
-
-
-
-
-
-