-
公开(公告)号:CN117634615A
公开(公告)日:2024-03-01
申请号:CN202311687907.5
申请日:2023-12-11
Applicant: 北京航空航天大学
IPC: G06N5/04 , G06F16/332 , G06F16/335 , G06F16/35 , G06F40/30 , G06F16/903 , G06N3/0455 , G06N3/09 , G06N3/0895
Abstract: 本发明公开了一种基于模态无关对比学习的多任务代码检索方法。该方法包括:基于编程问答社区构建大规模编程问答数据集,进行数据过滤、去重操作;基于此数据集对孪生编码器网络进行模态无关的对比学习预训练,得到代码语言表示模型;以此代码语言表示模型作为初始化,在不同代码检索任务上进行有监督数据的微调得到相应的代码检索模型;利用训练后的代码检索模型对代码库进行编码构建代码表示向量索引库,将代码向量表示索引库和代码检索模型部署在计算设备上,通过对查询的流式编码和向量搜索的方式实现多任务代码检索。所述方法有效对齐了代码语言模型对代码和文本这两个模态的语义表示空间,从而在不同代码检索问答任务上表现出更好的性能。
-
公开(公告)号:CN117540100A
公开(公告)日:2024-02-09
申请号:CN202311634542.X
申请日:2023-12-01
Applicant: 北京航空航天大学
IPC: G06F16/9535 , G06N3/0455 , G06N3/082 , G06N3/084
Abstract: 本发明公开了一种基于行列式点过程的多样化新闻推荐方法,包括:通过新闻标题文本和用户历史阅读,训练新闻编码器和用户编码器,经由用户编码器用户u的表示向量为Pu,经由新闻编码器候选新闻的表示向量列表为[f1,f2,…,fm]。计算候选新闻列表中新闻的两两的相似性,获得相似性矩阵S。获得用户对候选新闻列表中各新闻的评分向量ru,引入权衡因子α,形成核矩阵L'。针对核矩阵L'迭代贪心算法n次,每次迭代返回候选新闻列表中总收益最大的一条新闻yi,迭代n次直至构成大小为n的目标新闻子集作为方法的输出结果。本发明和其他比较方法相比,准确性在同一数量级上,多样性得到了明显提升。
-
公开(公告)号:CN114511084A
公开(公告)日:2022-05-17
申请号:CN202210110173.3
申请日:2022-01-29
Applicant: 北京航空航天大学
IPC: G06N5/02 , G06F40/205 , G06N20/00
Abstract: 本发明涉及一种增强问答交互信息的自动问答系统答案抽取方法及系统,其方法包括:步骤S1:构建问答交互信息提取网络和抽取式问答网络的输入文本序列;步骤S2:构建问答交互信息提取网络及其损失函数并进行训练;步骤S3:构建抽取式问答网络及其损失函数并进行训练;并通过知识蒸馏方式将问答交互提取网络提取到的问答交互特征蒸馏至抽取式问答网络中。本发明提供的方法基于问答掩码多头自注意力机制准确提取问答交互信息,将学习捕捉到的问答交互信息蒸馏至抽取式问答网络从而达到增强的目的。
-
公开(公告)号:CN112818698A
公开(公告)日:2021-05-18
申请号:CN202110146418.3
申请日:2021-02-03
Applicant: 北京航空航天大学
IPC: G06F40/30 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于双通道模型的细粒度的用户评论情感分析方法,包括如下步骤:步骤(1)、对文本进行预清理和分词;步骤(2)、对文本进行进一步预处理获取文本中每个单词的词性和依存关系;步骤(3)、将方面信息引入到计算模型BERT中,根据不同的方面获得与之对应的不同方面嵌入向量;步骤(4)进行方面检测和词方面极性分类;步骤(5)构建双通道模型,在双通道之间设置通路,对将方面检测子任务中能够得到的信息,用于协助极性判断子任务的完成;步骤(6)根据步骤(2)得到的文本,搭建一个双层GCN模型,引入依存信息;步骤(7)构建用于训练所述双通道模型的目标损失函数;步骤(8)整体训练,根据步骤(7)中的目标损失函数对上述的双通道模型进行训练。
-
公开(公告)号:CN104281877B
公开(公告)日:2017-11-14
申请号:CN201410478559.5
申请日:2014-09-18
Applicant: 北京航空航天大学
IPC: G06N3/12
Abstract: 一种基于改进遗传聚类的人类活动区域分类方法,包括有下列步骤:一:种群初始化;二:更新种群;三:判断隶属关系;四:计算适应度;五:个体选择;六:交叉繁殖;七:变异;八:结果判断。该方法针对大规模的人类移动数据,为原始遗传聚类重新定义同时包含类内距离和类间距离的新适应度,将传统判断准则中未同时包含的类内距离、类间距离进行优化,进而得到综合平衡最优;模拟生物在自然环境中的遗传进化过程进行自适应全局结构优化,以“适者生存”的模式得到适应度最大个体,作为最优聚类中心,解决随机选择类中心带来的局部最优。
-
公开(公告)号:CN106851765A
公开(公告)日:2017-06-13
申请号:CN201710041027.9
申请日:2017-01-18
Applicant: 北京航空航天大学 , 深圳北航新兴产业技术研究院
Abstract: 本发明公开了一种车载网络紧急安全消息的传输中继节点的优选方法,该方法包括的步骤有:通过周期性广播HELLO报文来构建属于任意一车载节点的邻居集;通过判断是否有新的HELLO报文的加入来增加邻居节点;通过处理邻居节点的期望传输距离、期望传输时间、期望传输速度并结合车载节点收到的紧急安全消息的概率权重,最终获得中继权重;最后,选取排序前三的中继权重对应的邻居节点来转发紧急安全消息。本发明方法解决了城市环境下的车载网络广播的“广播风暴”问题,并能尽可能快的广播紧急安全消息。
-
公开(公告)号:CN103473262B
公开(公告)日:2016-12-28
申请号:CN201310301065.5
申请日:2013-07-17
Applicant: 北京航空航天大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于关联规则的Web评论观点自动分类系统及分类方法,可分为四个模块:频繁特征词提取模块,频繁特征词优化模块,关联规则提取与挖掘模块以及观点分类模块。本发明克服了现有系统(如一些基于机器学习和情感分类的系统)精度低或者是需要大量人工参与或者过分依赖自然语言处理和专业知识的缺点。并且在关联规则集提取的过程中进行了优化,去除了冗余,区分度不高的关联规则,这样一来就提高了整个系统运行和获取结果的效率。本系统为多种情况,如电商商品评价,电子政务回馈,网民民意调查等提供了一种精确便捷的解决方案。
-
公开(公告)号:CN103607576B
公开(公告)日:2016-11-30
申请号:CN201310628079.8
申请日:2013-11-28
Applicant: 北京航空航天大学深圳研究院
IPC: H04N7/18
Abstract: 一种面向跨摄像机跟踪接力的交通视频监控系统,构成了一种数据采集层、前段处理层、网络传输层、中央控制层的一种四层体系结构;在前端处理层中,由分布式计算终端模块和跟踪算法模块协同,实现摄像机内目标跟踪算法的本地运行,通过通信协议模块,与中央控制模块进行信号交互及自动控制,实现在中央控制层完成全城域范围内的目标车辆跨摄像机连续跟踪。本发明面向全城域范围内的车辆跟踪监控领域,运用计算处理云端化技术,将中央控制层中的计算分布到前端处理层中,有效降低了中央服务器的计算压力,实现自动控制多区域内目标车辆的跨摄像机跟踪接力;同时使得各摄像机自行协同联动实现多任务并行执行。
-
公开(公告)号:CN103617265B
公开(公告)日:2016-08-31
申请号:CN201310641921.1
申请日:2013-12-03
Applicant: 北京航空航天大学深圳研究院
Abstract: 一种基于本体语义信息的本体查询引擎优化系统,包含查询语句预处理模块:将查询语句转化成析取范式表示形式;对查询语句的查询变量及查询原子进行分类,并分化出针对术语集的查询语句;调用查询引擎将原本的查询语句转化成对应的一系列断言块查询语句;查询语句推导模块:对断言块查询语句,将其查询原子和知识库中的术语集结合形成一个暂时的知识库,通过推理机将新形成的知识库所包含的隐藏信息推导出来;查询语句优化模块:根据推导出的隐藏信息通过相关规则,对原查询语句进行优化,在断言块上查找结果并与术语集上的结果结合得到最终结果。本发明达到缩短查询时间的效果,可广泛应用于目前的语义网开发工具,起到优化其查询引擎的作用。
-
公开(公告)号:CN103281255B
公开(公告)日:2016-08-10
申请号:CN201310231476.1
申请日:2013-06-12
Applicant: 北京航空航天大学
IPC: H04L12/811 , H04W28/22
Abstract: 一种基于吞吐量变化率和ECN机制的TCP友好速率控制方法:首先在交换机上进行ECN标记,接收方根据收到的数据包中ECN标记位的状态决定它所发送的ACK是否应该设置ECN-echo位;发送方维护一个虚拟发送窗口win,计算吞吐量的变换率,并根据收到的ACK中ECN-echo位的状态和吞吐量的变换率动态调整虚拟发送窗口win;最后根据win计算新的发送速率。本发明综合考虑了数据中心网络和无线网络的特点,能够缓解有线数据中心网络的TCP Incast现象,同时避免由于无线丢包而导致的网络性能下降,因此,可用于有线数据中心网络和无线网络中。
-
-
-
-
-
-
-
-
-