Patent search ap:("北京信息科技大学" OR "北京市工程咨询有限公司") AND inv:"张乐" Page 1

1.

发明公开
一种联合语义和关联匹配的工程咨询报告检索方法有权

公开(公告)号：CN115858813A

公开(公告)日：2023-03-28

申请号：CN202211628660.5

申请日：2022-12-20

Applicant: 北京信息科技大学 , 北京市工程咨询有限公司

Inventor： 吕学强 , 王革平 , 张乐 , 张龙 , 游新冬 , 滕尚志 , 李业龙 , 夏雷

IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F16/35 , G06F16/332 , G06F40/30

Abstract: 本发明涉及面向工程咨询报告的文本检索方法，以改善工程咨询报告撰写过程中人力成本大、编撰周期过长等问题，包括以下步骤：构建面向工程咨询报告的文本检索语料集，使用语料集微调simCSE对比学习模型，将得到的模型参数初始化Vanilla BERT模型，将语料的文本信息送入Vanilla BERT模型得到语义匹配分数。将文本信息和关键词信息通过SAT模型得到词级粒度的义原词向量表示并送入DRMM深度文本交互模型，得到关联匹配分数。将得到的语义匹配分数和关联匹配分数归一化后加权融合，得到最终的匹配分数，完成标题与段落之间的文本检索。本发明联合上下文向量表示和文本交互匹配方法，有效增强了文本检索的效果。

2.

发明公开
一种基于图卷积拓扑特征和关键词特征的文本检索方法审中-实审

公开(公告)号：CN115329046A

公开(公告)日：2022-11-11

申请号：CN202211001959.8

申请日：2022-08-21

Applicant: 北京信息科技大学 , 北京市工程咨询有限公司

Inventor： 张乐 , 涂焕霄 , 吕学强 , 夏雷 , 游新冬 , 董志安 , 韩晶

IPC: G06F16/33 , G06F40/30 , G06N3/04 , G06N3/08

Abstract: 本发明涉及自然语言处理领域的文本检索技术，提升了现有方法在语义匹配上的不足，包括以下步骤：围绕在工程咨询报告范围获取实验所需数据，每个标题标注60段文本数据；将数据以[CLS]标题[SEP]段落[SEP]的形式传入BERT模型，得到标题和段落的向量表示；基于向量分别构建图拓扑结构，并利用图卷积神经网络GCN获取全局结构特征；针对具有上下文信息和全局特征的向量表示，利用排序模型得到第一个得分；将段落对应关键词利用Word2Vec得到向量表示，基于余弦相似度得到第二个得分，对两个得分加权平均得到最终匹配结果；训练模型并更新参数，在测试集上提取文本特征并进行检索。本发明能够提升文本检索的准确性。

3.

发明授权
一种联合语义和关联匹配的工程咨询报告检索方法有权

公开(公告)号：CN115858813B

公开(公告)日：2025-05-16

申请号：CN202211628660.5

申请日：2022-12-20

Applicant: 北京信息科技大学 , 北京市工程咨询股份有限公司

Inventor： 吕学强 , 王革平 , 张乐 , 张龙 , 游新冬 , 滕尚志 , 李业龙 , 夏雷

IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F16/35 , G06F16/3329 , G06F40/30

Abstract: 本发明涉及面向工程咨询报告的文本检索方法，以改善工程咨询报告撰写过程中人力成本大、编撰周期过长等问题，包括以下步骤：构建面向工程咨询报告的文本检索语料集，使用语料集微调simCSE对比学习模型，将得到的模型参数初始化Vanilla BERT模型，将语料的文本信息送入Vanilla BERT模型得到语义匹配分数。将文本信息和关键词信息通过SAT模型得到词级粒度的义原词向量表示并送入DRMM深度文本交互模型，得到关联匹配分数。将得到的语义匹配分数和关联匹配分数归一化后加权融合，得到最终的匹配分数，完成标题与段落之间的文本检索。本发明联合上下文向量表示和文本交互匹配方法，有效增强了文本检索的效果。

4.

发明公开
一种基于网格结构的低资源语言新闻句子情感分析方法及系统有权

公开(公告)号：CN118093874A

公开(公告)日：2024-05-28

申请号：CN202410275955.1

申请日：2024-03-12

Applicant: 北京信息科技大学 , 青海师范大学

Inventor： 吕学强 , 孔春伟 , 张乐 , 才藏太 , 陈玉忠 , 赵海兴

IPC: G06F16/35 , G06F16/33 , G06F18/2415 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/084

Abstract: 本发明涉及一种低资源语言处理领域的情感分析方法。提出一种基于网格结构与多头注意力的新闻句子情感分析方法。包括以下步骤：通过将网格结构无损转换为扁平结构，实现音节序列中单词信息的引入；采用相对位置编码机制，编码音节和单词的位置和方向信息；使用多头自注意力机制，识别序列中音节和单词的关联关系和语义信息；最后通过全连接层进行分类得到低资源语言新闻句子情感类别。本发明解决了传统循环神经网络无法进行大规模并行计算以及卷积神经网络难以建模句子中的长距离依赖关系的问题，其中多头注意力机制的运用，丰富了词语间的关联关系，增强了句子语义和句法结构信息的理解，提高了低资源语言新闻句子情感分类效果。

5.

发明公开
一种中文专利文本相似度计算方法无效

公开(公告)号：CN110134925A

公开(公告)日：2019-08-16

申请号：CN201910404981.9

申请日：2019-05-15

Applicant: 北京信息科技大学

Inventor： 游新冬 , 吕学强 , 张乐 , 董志安

IPC: G06F17/22 , G06K9/62

Abstract: 本发明涉及一种一种中文专利文本相似度计算方法，基于SAO结构和向量空间模型相融合来计算文本相似度，包括：从专利文本中抽取出SAO三元组；计算SAO三元组中词语的相似度；计算SAO之间相似度；基于SAO计算专利文本相似度；把向量空间模型方法和基于SAO结构的方法进行融合。本发明提供的中文专利文本相似度计算方法，基于SAO结构和向量空间模型相融合的方法计算专利文本相似度，充分发挥了二者的优点，克服了二者的缺陷，得到了极佳的正确率、召回率和F值，可以很好地满足实际应用的需要。

6.

发明公开
一种融合多特征和注意力机制的多模态情感分析方法审中-实审

公开(公告)号：CN116028846A

公开(公告)日：2023-04-28

申请号：CN202211628659.2

申请日：2022-12-20

Applicant: 北京信息科技大学

Inventor： 吕学强 , 张乐 , 滕尚志 , 韩晶

IPC: G06F18/24 , G06F18/25 , G10L15/16 , G06V10/82 , G06V20/40 , G06N3/0455 , G06N3/0442

Abstract: 本发明公开了一种融合多特征和注意力机制的多模态情感分析模型，该模型具体包括以下步骤：通过多模态特征提取模块获得各模态丰富的低层特征；通过自注意力机制实现对三种模态内部信息的提取，获得对应的高层特征；通过跨模态注意力机制分别实现音频‑文本和视频‑文本的交互，在空间上实现模态间信息的交互，将学习到的模态内部信息和模态间交互信息进行拼接，得到更加丰富的音频和视频融合特征；最后拼接三种模态的最终表示并传入一个软注意力模块，为三种模态分配不同的权重，通过全连接层实现多模态情感分类结果。在公开数据集CH‑SIMS上进行测试，本发明可以有效提升多模态情感分析的准确性。

7.

发明公开
文本关键词提取方法无效

公开(公告)号：CN114091442A

公开(公告)日：2022-02-25

申请号：CN202111213156.4

申请日：2021-10-19

Applicant: 北京信息科技大学

Inventor： 吕学强 , 游新冬 , 张乐

IPC: G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08

Abstract: 本申请公开了一种文本关键词提取方法。本申请实施例提供的文本关键词提取方法，基于多特征融合进行关键词提取，利用BERT向量和五笔向量捕捉输入序列的语义特征和字形特征，并将字频特征作为权重值进一步获取输入序列的上下文特征，从而使编码层BiLSTM捕捉到长序列更多的语义信息，并利用CRF添加约束信息促使输出标签序列结果更合理有效。本申请实施例提出的文本关键词提取方法，基于多特征融合进行关键词提取，可以有效地提升关键词提取的效果，取得了较高的准确率、召回率和F1值，完全能够满足实际应用的需要。

8.

发明公开
机器翻译方法审中-实审

公开(公告)号：CN114065780A

公开(公告)日：2022-02-18

申请号：CN202111212884.3

申请日：2021-10-19

Applicant: 北京信息科技大学

Inventor： 吕学强 , 张乐 , 孙少奇

IPC: G06F40/58 , G06F40/211 , G06N3/04 , G06N3/08

Abstract: 本申请公开了一种机器翻译方法，通过Transformer模型实现，所述Transformer模型由多个同构的编码器和解码器组成，所述编码器用于编码中文的新能源专利文本，所述解码器用于产出对应英文专利的翻译结果；所述编码器与所述解码器都使用多头自注意力机制来捕获句子内部结构，所述编码器与所述解码器之间通过注意力机制连接来进行对齐翻译。本申请的机器翻译方法，能有效将术语信息整合到新能源中英专利机器翻译中，提高了翻译质量，并且大部分术语词都能得到正确的翻译。

9.

发明公开
一种基于区块链食品溯源系统的后台数据管理方法及系统无效

公开(公告)号：CN112101970A

公开(公告)日：2020-12-18

申请号：CN202011213761.7

申请日：2020-11-04

Applicant: 北京信息科技大学 , 阳光易购(湖南)科技有限公司

Inventor： 吕学强 , 姜阳 , 李果林 , 游新冬 , 张乐 , 李素娟 , 王少鹏

IPC: G06Q30/00 , G06Q50/12 , G16H50/80

Abstract: 本发明公开了一种基于区块链食品溯源系统的后台数据管理方法及系统，所述方法包括获取通过所述客户端上报的疫情信息，其中，所述疫情信息包括门店名和疫情食材名；筛选出与所述门店名一致的所述餐饮主体名，并标记为疫情餐饮主体名；获取包括了所述疫情餐饮主体名的所述餐饮商信息，并标记为源头疫情单位信息；获取所述源头疫情单位信息对应的所有的所述台账信息；本发明提出的一种基于区块链食品溯源系统的后台数据管理方法将防疫功能和食品溯源技术进行了有效的结合，大大提升了食品溯源技术的应用范围，不仅能够对食品安全市场进行监督，还增加了卫生健康监督的能力。

10.

发明公开
基于五笔码的字符级文本分类方法无效

公开(公告)号：CN110059192A

公开(公告)日：2019-07-26

申请号：CN201910404059.X

申请日：2019-05-15

Applicant: 北京信息科技大学

Inventor： 吕学强 , 游新冬 , 董志安 , 张乐

IPC: G06F16/35

Abstract: 本发明涉及一种基于五笔码的字符级文本分类方法，采用五笔字型码对中文进行转换的字符级表示模型，采用五笔码将中文字符转化成唯一的英文字符串，再将英文字符串输入字符级模型中进行分类。本发明提供的基于五笔码的字符级文本分类方法，采用字符级表示模型，无需分词且能进行很好的字符转化，在中文文本分类中有着特殊的优势，分类效果明显优于传统模型和其他深度学习模型，可以有效地应用于中文文本分类，可以很好地满足实际应用的需要。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification