-
公开(公告)号:CN103678565B
公开(公告)日:2017-02-15
申请号:CN201310659722.3
申请日:2013-12-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 一种基于自引导方式的领域自适应句子对齐系统,包括:网页处理模块,中文文本处理模块,英文文本处理模块和双语文处理模块。首先,针对不同的网页,对于料进行提取和相应做预处理;使用一种基于自引导的方式并融合多种特征的句子对齐算法对中英文进行句子级的对齐;同时,对可能能够反映相关领域信息和主题信息的互译词对进行提取。本发明提高了句子对齐质量,具有领域适应性强的优点。
-
公开(公告)号:CN103678564B
公开(公告)日:2017-02-15
申请号:CN201310659651.7
申请日:2013-12-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F17/30
Abstract: 一种基于数据挖掘的互联网产品调研系统,由6个模块组成:信息采集模块、信息预处理模块、产品概貌分析模块、情感分析模块、用户行为分析模块和数据展示模块。系统通过自动采集互联网上各类关于产品的信息,经过预处理之后,采用数据挖掘和自然语言处理技术进行综合分析,从而快速形成关于产品的概貌分析、产品各不同功能的市场口碑分析、不同产品对比分析、用户群体分析等不同侧面的分析结果,为产品分析、市场决策提供快速、坚实的支撑。本发明充分利用互联网信息资源优势,能够根据用户需求对产品进行调研,不但可以节约调研所需的人力物力,还能够及时反映跟踪市场动态。
-
公开(公告)号:CN103678564A
公开(公告)日:2014-03-26
申请号:CN201310659651.7
申请日:2013-12-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 一种基于数据挖掘的互联网产品调研系统,由6个模块组成:信息采集模块、信息预处理模块、产品概貌分析模块、情感分析模块、用户行为分析模块和数据展示模块。系统通过自动采集互联网上各类关于产品的信息,经过预处理之后,采用数据挖掘和自然语言处理技术进行综合分析,从而快速形成关于产品的概貌分析、产品各不同功能的市场口碑分析、不同产品对比分析、用户群体分析等不同侧面的分析结果,为产品分析、市场决策提供快速、坚实的支撑。本发明充分利用互联网信息资源优势,能够根据用户需求对产品进行调研,不但可以节约调研所需的人力物力,还能够及时反映跟踪市场动态。
-
公开(公告)号:CN103678565A
公开(公告)日:2014-03-26
申请号:CN201310659722.3
申请日:2013-12-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
CPC classification number: G06F17/30666 , G06F17/30737
Abstract: 一种基于自引导方式的领域自适应句子对齐系统,包括:网页处理模块,中文文本处理模块,英文文本处理模块和双语文处理模块。首先,针对不同的网页,对于料进行提取和相应做预处理;使用一种基于自引导的方式并融合多种特征的句子对齐算法对中英文进行句子级的对齐;同时,对可能能够反映相关领域信息和主题信息的互译词对进行提取。本发明提高了句子对齐质量,具有领域适应性强的优点。
-
公开(公告)号:CN119760641A
公开(公告)日:2025-04-04
申请号:CN202411827930.4
申请日:2024-12-12
Applicant: 北京航空航天大学 , 中国人民解放军军事科学院军事科学信息研究中心
IPC: G06F18/25 , G06F18/213 , G06N3/0455 , G06N5/04 , G06N3/042 , G06N3/0464 , G06V40/16
Abstract: 本发明涉及人物关系的挖掘技术领域,具体涉及一种基于多模态信息融合的多维度人物关系发现方法,包括:从视频中提取文本、视觉和音频模态特征;模态特征的欧氏距离,进行最优对齐路径优化和非线性时间调整,得到时间步对齐的模态特征;模态特征进行自注意力和交叉注意力机制处理,获取文本、视觉和音频的多模态表示;文本、视觉和音频的多模态表示,建立社交关系、立场关系和共现关系的图结构网络;由所述社交关系、立场关系和共现关系的图结构确定视频中各人物的社交关系紧密程度、立场一致性程度和共现强度;本发明能够提高多维度人物关系的理解准确性。
-
公开(公告)号:CN106951438A
公开(公告)日:2017-07-14
申请号:CN201710075116.5
申请日:2017-02-13
Applicant: 北京航空航天大学
Abstract: 本发明涉及一种面向开放域的事件抽取系统及方法,包括:预处理模块、触发词识别模块、事件参数识别模块、事件图谱分析模块和事件抽取展示模块;预处理模块对原始数据信息进行预处理;触发词识别模块基于卷积神经网络进行触发词识别,事件参数识别模块基于图模型进行事件参数的识别,事件参数的抽取工作转化到具体的图分割问题,通过分割得到事件参数;事件图谱分析模块对触发词识别和事件参数识别结果进行分析,得到同类事件;事件抽取展示模块将分析结果可视化展现,方便用户获取信息。本发明解决了大数据环境下快速获取新闻资讯信息的难题,通过自动化的处理,用户根据自己输入的关键词即可得到关键词相关的新闻事件,为信息获取提供了极大的便利。
-
公开(公告)号:CN103885924A
公开(公告)日:2014-06-25
申请号:CN201310596791.4
申请日:2013-11-21
Applicant: 北京航空航天大学
Abstract: 一种领域自适应的公开课字幕自动生成系统及方法,包括:预处理模块、模型修改模块、音频识别模块、识别结果反馈模块和字幕生成模块;预处理模块包括对视频的预处理,文本的预处理以及关键词的预处理;模型修改模块包含的内容为利用预处理过程中得到的文本资料对识别过程中的语言模型进行修改;音频识别模块对上传视频的识别;识别结果反馈模块对识别的结果进行关键词提取,提取到的关键词又可以调用预处理过程中对于用户输入的关键词的处理办法进行处理;字幕生成模块:字幕生成过程中对最终的识别结果进行规范化,加上时间轴等信息,得到真正的字幕。本发明解决了公开课字幕生产的难题,通过自动化的处理,减轻了人工生产字幕的人力负担,为大家学习英文公开课提供了极大的便利。
-
-
-
-
-
-