一种场景文本感知的指代表达理解方法、装置及存储介质

    公开(公告)号:CN115082916A

    公开(公告)日:2022-09-20

    申请号:CN202210597250.2

    申请日:2022-05-30

    Inventor: 蔡毅 卜羽琦

    Abstract: 本发明公开了一种场景文本感知的指代表达理解方法、装置及存储介质,其中方法包括:显式地提取图像中的场景文本实例,将其与指代表达句子计算相关性,其后计算场景文本实例在图像特征中的空间位置,以激活场景文本实例在图像特征中的相关区域,最终将场景文本感知的图像特征与句子文本特征进行精练、预测得到指代目标物体的位置坐标。本发明解决了当前指代表达理解技术无法显式对齐场景文本信息而导致目标物体定位错误的问题,能够提升机器人对于场景文本、视觉物体与视觉场景的认知能力,提升面向场景文本的人机交互能力。本发明可广泛应用于自然语言处理与计算机视觉技术领域。

    一种少样本跨领域情感分析方法及装置

    公开(公告)号:CN115080688A

    公开(公告)日:2022-09-20

    申请号:CN202210661020.8

    申请日:2022-06-13

    Inventor: 蔡毅 任浩鹏

    Abstract: 本发明公开了一种少样本跨领域情感分析方法及装置,其中方法包括:获取句子数据,将句子数据输入训练后的BERT编码器,获得第一特征向量;将句子数据输入训练后的GCN编码器,获得第二特征向量;对第一特征向量和第二特征向量进行特征融合,获得句子的向量表示;将句子的向量表示输入到训练后的少样本原型网络模型,输出句子的情感极性;本发明利用少样本学习技术捕捉领域共享特征以及领域特定特征,从而提高模型从源领域迁移到目标领域的情感预测效果。本发明可广泛应用于自然语言处理技术领域。

    开放环境下基于粒度感知的少样本关系抽取方法及应用

    公开(公告)号:CN112507137B

    公开(公告)日:2022-04-22

    申请号:CN202011500258.X

    申请日:2020-12-17

    Inventor: 蔡毅 任浩鹏

    Abstract: 本发明公开了一种开放环境下基于粒度感知的少样本关系抽取方法及应用,该方法包括:输入一个句子及存在于句子中的两个实体,输出该实体对在对应句子中所属的预定义关系或者判断出其不属于任何一个预定义关系;对每个单词采用预训练的词嵌入模型进行初始化,并采用卷积神经网络编码得到句子低维向量表示并映射到同一个高维向量空间中,以支持集的中心点作为每个关系类别的原型表示;通过衡量查询实例到各个关系原型之间距离来度量相似程度,得到查询实例的所属关系类别;对每个关系在空间中度量出其原型区域,判断查询实例是否属于预先定义的关系类别中。本发明适应开放动态环境场景,提高关系抽取的预测效果。

    基于关系路径的远程监督关系抽取方法、装置及介质

    公开(公告)号:CN113268985A

    公开(公告)日:2021-08-17

    申请号:CN202110451394.2

    申请日:2021-04-26

    Inventor: 蔡毅 刘诤

    Abstract: 本发明公开了一种基于关系路径的远程监督关系抽取方法、装置及介质,其中方法包括以下步骤:通过远程监督机制将知识库中的实体对和文本语料中的实体对进行对齐,构建实体对句子集合,根据实体对的内容将句子划分为多个包;通过直接句子编码模块获取实体对的相应关系的预测概率;针对每个包对应的实体对的推理关系路径,通过关系路径编码模块获取关系路径推理出相应关系的预测概率;在联合学习模块中,结合直接句子编码模块中的信息和关系路径编码模块中的信息获取最终对应实体对的预测关系。本发明采用了联合学习框架将直接句子的特征信息和关系路径的推理信息合理地结合起来,提高关系抽取的精准度,可广泛应用于自然语言处理领域。

    一种基于词组多样性的对话生成方法

    公开(公告)号:CN111563148A

    公开(公告)日:2020-08-21

    申请号:CN202010304195.4

    申请日:2020-04-17

    Inventor: 蔡毅 李灿光

    Abstract: 本发明公开了一种基于词组多样性的对话生成方法,构造对话生成模型,包括句子编码器、上下文编码器、转化层、条件变分自编码器、解码器以及词袋层,包括步骤:将对话上下文编码为一个上下文向量;将上下文向量映射为符合解码器输入大小的隐含状态,并将得到的隐含状态作为解码器的初始隐含状态;获取随机潜在变量;将得到的随机潜在变量、上下文向量、前一个词的词向量以及前一个时间步的隐含状态输入解码器的循环神经网络单元,得到循环神经网络单元输出的当前时间步的隐含状态;将解码器输出的当前时间步的隐含状态输入到词分类器,得到词分类器输出的一个词表大小的概率分布向量。本发明能够生成较为流畅且具词组层级多样性的对话回复。

    一种基于分类效用的开集分类方法

    公开(公告)号:CN111191033A

    公开(公告)日:2020-05-22

    申请号:CN201911352812.1

    申请日:2019-12-25

    Inventor: 蔡毅 李泽婷

    Abstract: 本发明公开了一种基于分类效用的开集分类方法,包括步骤:输入数据集,并对数据集进行预处理;采用特征提取器将数据转换为特征;采用训练集的特征训练一个可增量学习少样本分类器;对于一条新数据,对其进行预处理后采用特征提取器提取特征;将新数据的特征输入到分类器中,寻找已知类别中分类分数最高的一个类别,并计算分类效用;将新数据单独作为一个类别,采用新数据的特征计算其分类效用;比较已知类别与新类别情况下的分类效用大小,更新分类器;重复提取特征并计算分类效用的步骤,增加分类器处理的类别数据。本发明解决了开集分类中的未知类别数据识别和新类别的引入问题,并结合增量学习来学习新类别,增强分类器。

    基于Android的二维住房户型识别和三维呈现方法

    公开(公告)号:CN107798725B

    公开(公告)日:2020-05-22

    申请号:CN201710783949.7

    申请日:2017-09-04

    Abstract: 本发明公开了一种基于Android的二维住房户型识别和三维呈现方法,该方法包括下列步骤:二维户型图信息提取与分类,三维户型图建模元素的构建;选取图像格式的二维户型图;对二维户型图片进行尺寸上的适当裁剪和修正,并对二维户型图片进行二值化操作和形态学操作;提取进行三维绘制的各建模元素的基本数据;自动绘制三维户型图;实现通过手势操作来对三维户型图进行漫游操作。本方法发明不仅可以快速便捷地识别二维住房户型同时在移动终端上三维呈现,而且还提供了便捷的交互操作。因此,本发明具有建模难度低、效率高的特点,可以最大程度帮助用户理解和提升用户体验的优点。

    基于用户兴趣和社交主题提取的社交网络用户推荐方法

    公开(公告)号:CN106055713B

    公开(公告)日:2019-10-18

    申请号:CN201610519445.X

    申请日:2016-07-01

    Abstract: 本发明公开了一种基于用户兴趣和社交主题提取的社交网络用户推荐方法,包括以下步骤:获取社交网络中用户的“follower‑followee”关系以及“mutual‑following”关系信息;提取用户的社交主题和兴趣主题;在这些主题的基础上分别形成用户的社交社区和兴趣社区;将各个社区分别整理成矩阵形式,使用矩阵分解方法对各个社区矩阵进行分解以计算各用户对在各个社区矩阵的意愿关注分数,取各个用户对在所有社区的意愿关注分数的最大值为最终意愿关注分数,为目标用户排序其与其他用户的最终意愿关注分数,最终选取分数最高的TOP‑N用户为推荐关注用户。具有得到了更准确的社交网络用户推荐结果等优点。

    一种基于混合模型的足球比赛首发预测方法

    公开(公告)号:CN110222723A

    公开(公告)日:2019-09-10

    申请号:CN201910397057.2

    申请日:2019-05-14

    Abstract: 本发明公开了一种基于混合模型的足球比赛首发预测方法,包括步骤:收集球员比赛数据,对数据进行预处理;构建球员各项比赛数据的统计特征;分别构建并训练逻辑回归模型、Xgboost模型、朴素贝叶斯模型,输入球队内所有球员的比赛数据,得到每个球员未来一场比赛首发上场的概率;对所述三个模型赋予不同权重,根据三种模型得到的概率,采用加权投票法对球员获得首发上场的情况进行投票,取得票最多的前11个球员,为最终预测未来一场比赛首发上场的球员。本发明采用机器学习中的混合模型,可以全面而有效地通过球员的历史比赛数据对其未来首发上场情况做出预测,能够很好地帮助教练和球队进行分析和备战。

    基于层次化模型的数据可视化方法及其系统

    公开(公告)号:CN105912562A

    公开(公告)日:2016-08-31

    申请号:CN201610162397.3

    申请日:2016-03-21

    CPC classification number: G06F17/30572

    Abstract: 本发明公开了一种基于层次化模型的数据可视化方法及系统,其中数据可视化方法包括下列步骤:图形数据准备、图形顶点采样分层、子图顶点连接、图形顶点受力计算、顶点位置更新、图形布局递归计算、图形布局层次化绘制;其中数据可视化系统包括下列模块:图形数据准备模块、图形顶点采样分层模块、子图顶点连接模块、图形顶点受力计算模块、顶点位置更新模块、图形布局递归计算模块、图形布局层次化绘制模块。本发明可以加快算法收敛,正确计算布局,保持效果稳定性。另外,本发明不仅可以科学地绘制大数据的图形布局,而且还提供了便捷的交互操作。因此,本发明具有快速高效地计算美观布局、帮助用户挖掘潜在知识规律的优点。

Patent Agency Ranking