一种意图识别方法及装置
    32.
    发明公开

    公开(公告)号:CN113722492A

    公开(公告)日:2021-11-30

    申请号:CN202111054974.4

    申请日:2021-09-09

    Abstract: 本发明公开了一种意图识别方法及装置,包括:获取待识别文本;对所述待识别文本进行预处理,得到预处理结果;对所述预处理结果进行特征提取,得到文本特征;将所述文本特征输入至目标意图识别模型,获得意图识别结果,其中,所述目标意图识别模型为基于训练样本训练得到的神经网络模型,所述训练样本为标注有意图标签的文本信息。通过生成文本意图分类器的方法,确定与用户匹配的个性化对话风格,并基于机器学习与深度学习算法,准确预测用户消息所表达的意图信息。提升了意图识别的精准度和可靠性。

    一种多轮对话方法及装置
    33.
    发明公开

    公开(公告)号:CN113722463A

    公开(公告)日:2021-11-30

    申请号:CN202111054973.X

    申请日:2021-09-09

    Abstract: 本发明公开了一种多轮对话方法及装置,包括:接收初始状态向量,所述初始状态向量基于用户的输入语音转化得到;将所述初始状态向量传递给强化学习智能体得到初始动作,所述初始动作至少为一个;将每个初始动作传递给环境模型,得到状态向量和强化信号,所述环境模型用于对初始状态向量进行调整和对每个初始动作进行评价,所述强化信号用于表征对应初始动的评价结果;将所述状态向量和所述强化信号传递给所述强化学习智能体,得到目标动作,将所述目标动作转化为回复语句。上述过程,基于初始状态向量确定了至少一个初始动作,并对各个初始动作进行评价,基于评价结果确定目标动作,目标动作是在多个初始动作中选取的,保证了回复的准确性。

    一种基于聚类的表格重构方法及系统

    公开(公告)号:CN113688684A

    公开(公告)日:2021-11-23

    申请号:CN202110843215.X

    申请日:2021-07-26

    Abstract: 本发明公开了一种基于聚类的表格重构方法及系统,该方法包括:S100:获取包括表格的PDF图片;S200:提取PDF图片中的横线和竖线,分别生成横线图片和竖线图片;S300:基于横线图片和竖线图片提取横线和竖线的交叉点;S400:对交叉点进行基于位置的聚类,基于聚类结果对表格进行分离;S500:提取单个表格所包含的交叉点,对交叉点进行去抖处理;S600:基于广度遍历思想,在交叉点间进行路径游走,重构表格。本发明能够从包括不规则表格的图片中识别并重构表格,相比于现有的表格重构方法,可提升表格重构精度,并可有效解决图片中可能会出现的表格扭曲问题,对不规则表格的重构尤其适用。

    一种用于意图识别的词义角色标注方法及系统

    公开(公告)号:CN113688627A

    公开(公告)日:2021-11-23

    申请号:CN202111069148.7

    申请日:2021-09-13

    Abstract: 本发明公开了一种用于意图识别的词义角色标注方法及系统,方法包括:输入句子序列、谓词序列、谓词上下文和谓词上下文区域标记;将谓词序列和谓词上下文扩展为与句子序列长度相同的序列;将句子序列、谓词序列、谓词上下文和谓词上下文区域标记转换为词向量序列;将句子序列、谓词序列、谓词上下文和谓词上下文区域标记的词向量序列输入双向LSTM模型;通过双向LSTM模型学习输入序列的特征表示,得到新的特征表示序列;将新的特征表示序列输入条件随机场;通过条件随机场对新的特征表示序列进行标注,得到标注结果。本发明能够有效的实现自动词义角色标注,减少意图识别中构建词义标注语料库的时间和成本。

    基于正则路径查询的搜索系统

    公开(公告)号:CN113326284B

    公开(公告)日:2021-10-01

    申请号:CN202110883483.4

    申请日:2021-08-03

    Abstract: 本发明公开了基于正则路径查询的搜索系统,包括:数据库构建模块,用来对RDF数据图进行哈希编码,获得哈希值数据图;再以哈希值数据图的谓词作为key,以三元组作为value,使用key‑value分布式存储方式对哈希值数据图进行存储,获得克林闭包特征数据形式的key‑value数据图;遍历key‑value数据图,标记其中存在克林闭包的谓词及克林闭包谓词对应的三元组簇,将递归形式的三元组簇以递归树结构存储;选择度计算模块,用来基于递归树计算谓词的静态选择度以及两个谓词之间的连接选择度;搜索模块,用来在接收到查询语句时在数据库中进行搜索。本发明可获得查询路路径,可有效提高正则路径查询问题的效率,适合广泛应用。

    基于多交互注意力的端到端多模态问答方法及系统

    公开(公告)号:CN113297370A

    公开(公告)日:2021-08-24

    申请号:CN202110848497.2

    申请日:2021-07-27

    Abstract: 本发明公开了基于多交互注意力的端到端多模态问答方法及系统,包括:(1)接收问题和背景知识;(2)从接收的背景知识中筛选出与问题相关的文本背景知识和图像背景知识;(3)对筛选出的文本背景知识进行编码,获得文本背景知识中各段落的特征表示;(4)将筛选出的图像背景知识解析为图像特征表示,并构建可微场景图;(5)融合特征表示和可微场景图,获得背景知识的融合特征表示;(6)将融合特征表示、问题的特征表示、候选答案的特征表示输入非线性层,计算各候选答案的预测概率,输出预测概率最高的候选答案。本发明可有效利用多模态信息,提升多模态语义理解的准确度和全面性,从而提升多模态问答系统的准确率。

    文本分类方法及装置
    39.
    发明公开

    公开(公告)号:CN112182211A

    公开(公告)日:2021-01-05

    申请号:CN202011025556.8

    申请日:2020-09-25

    Abstract: 本发明提供了一种文本分类方法及装置,该方法包括:获取目标文本分类模型;对目标文本进行预处理,获得目标文本对应的目标文本向量;将目标文本向量输入分类模型,获得分类模型输出目标文本分别属于每个文本类别对应的类别概率;将目标文本分配至最大的类别概率对应的文本类别的类别目录中,完成对目标文本的分类。应用该方法,在需要对文本进行分类时先对文本进行预处理获得对应的文本向量,再通过分类模型对文本进行识别,获得分类模型输出的文本属于每个文本类别对应的概率,以确定该文本属于最大的概率对应的文本类别。通过该方法可以快速对文本进行分类,节约文本分类时间。

Patent Agency Ranking