一种基于序列标注的航迹点分类及文本生成方法

    公开(公告)号:CN113360655B

    公开(公告)日:2022-10-04

    申请号:CN202110711121.7

    申请日:2021-06-25

    IPC分类号: G06F16/35 G06F40/186 G06N3/04

    摘要: 本发明提供了一种基于序列标注的航迹点分类及文本生成方法,首先定义关注的事件类型,机器相关的参数,比如转向事件需要关注转向的角度;针对盘旋事件,需要关注盘旋的圈数。通过分析轨迹点及其相邻点的角度、高度变化等特征,判定每个时间点对应的事件类型。对于每个事件及其参数,采用模板填充的方式生成对应的文本。经过以上步骤,本发明能够自动分析航迹数据并抽取关键事件,生成高可读性强、反应目标的活动情况的文本描述。

    一种基于拼音相似度与语言模型的文本检测与纠正方法

    公开(公告)号:CN112232055A

    公开(公告)日:2021-01-15

    申请号:CN202011169315.0

    申请日:2020-10-28

    摘要: 本发明公开了一种基于拼音相似度与语言模型的文本检测与纠正方法,包括搜集大量正确的指令文本语句作为训练语句;从训练语句中选择专业领域的词语,构建自定义词典;利用HanLP语言处理工具包和自定义词典,对训练语句进行分词;统计分词结果中每个词语以及每种词语组合在所有训练语句中的出现次数,并构建Bi‑Gram语言模型;将待纠正语句转化为对应的待纠正拼音,将自定义词典的词语转化为对应的词典拼音;根据待纠正拼音与词典拼音的拼音相似度,结合待纠正语句的句子合理性对待纠正语句进行纠正,获得纠正后的语句。本发明通过词语拼音相似度计算和句子合理性分析,考虑了句子的语义信息和语境,有利于检测出句子中错误的词语,并提高纠正的准确率。

    一种基于双层注意力机制与双向GRU的文本关系抽取方法

    公开(公告)号:CN110502749A

    公开(公告)日:2019-11-26

    申请号:CN201910710075.1

    申请日:2019-08-02

    摘要: 本发明公开了一种基于双层注意力机制与双向GRU的文本关系抽取方法,包括如下步骤:对文本语料进行实体标注和关系标注;对标注数据进行预处理,生成实体抽取模型和关系抽取模型的训练集和测试集;构建关系抽取网络;分别进行实体抽取模型训练和关系抽取模型训练;将测试集数据首先输入实体抽取模型,得到实体识别结果;实体识别结果和测试集数据输入关系抽取模型,得到关系抽取结果。本发明利用实体位置信息和实体标签信息扩充字向量特征,实现文本信息的向量化,为关系识别提供更多的特征信息,提高了双向GRU模型输入信息与输出信息间的相关性,增强关键字对输出的影响力并提高抗噪声能力,并且能够有效地提高中文文本关系抽取的准确率。

    一种基于多文档的复杂问题自动化求解方法

    公开(公告)号:CN111460092B

    公开(公告)日:2022-11-29

    申请号:CN202010165743.X

    申请日:2020-03-11

    摘要: 本发明提供了一种基于多文档的复杂问题自动化求解方法,本发明采用阅读理解加答案排序的策略,并针对带有推理过程的复杂问题引入桥接实体,有效的求解了复杂问题。针对多文档的机器阅读理解技术,首先拆分文档为段落,然后针对每个段落利用阅读理解模型预测出答案,有效的提高了答案的召回率;然后对于多个候选答案利用排序模型进行排序,选择出最有可能的答案;对于带有推理过程的问题首先预测出桥接实体,然后将桥接实体拼接到原始问题之后,有效的解决了推理问题的歧义性。经过以上三个步骤,本发明能够实现针对基于多文档的复杂问题求解。

    一种基于序列标注的航迹点分类及文本生成方法

    公开(公告)号:CN113360655A

    公开(公告)日:2021-09-07

    申请号:CN202110711121.7

    申请日:2021-06-25

    IPC分类号: G06F16/35 G06F40/186 G06N3/04

    摘要: 本发明提供了一种基于序列标注的航迹点分类及文本生成方法,首先定义关注的事件类型,机器相关的参数,比如转向事件需要关注转向的角度;针对盘旋事件,需要关注盘旋的圈数。通过分析轨迹点及其相邻点的角度、高度变化等特征,判定每个时间点对应的事件类型。对于每个事件及其参数,采用模板填充的方式生成对应的文本。经过以上步骤,本发明能够自动分析航迹数据并抽取关键事件,生成高可读性强、反应目标的活动情况的文本描述。

    一种基于多文档的复杂问题自动化求解方法

    公开(公告)号:CN111460092A

    公开(公告)日:2020-07-28

    申请号:CN202010165743.X

    申请日:2020-03-11

    摘要: 本发明提供了一种基于多文档的复杂问题自动化求解方法,本发明采用阅读理解加答案排序的策略,并针对带有推理过程的复杂问题引入桥接实体,有效的求解了复杂问题。针对多文档的机器阅读理解技术,首先拆分文档为段落,然后针对每个段落利用阅读理解模型预测出答案,有效的提高了答案的召回率;然后对于多个候选答案利用排序模型进行排序,选择出最有可能的答案;对于带有推理过程的问题首先预测出桥接实体,然后将桥接实体拼接到原始问题之后,有效的解决了推理问题的歧义性。经过以上三个步骤,本发明能够实现针对基于多文档的复杂问题求解。

    基于多任务联合训练的机器阅读理解方法及计算机存储介质

    公开(公告)号:CN110309305A

    公开(公告)日:2019-10-08

    申请号:CN201910514438.4

    申请日:2019-06-14

    IPC分类号: G06F16/35 G06K9/62

    摘要: 本发明公开了一种基于多任务联合训练的机器阅读理解方法和计算机存储介质,其中方法包括模型构建与训练阶段、测试阶段;所述模型构建与训练阶段包括:1、构建训练集;2、建立机器阅读理解模型,包括编码层、注意力匹配层、解码层;3、将训练集按样本数分为W个子样本集,分别用W个子样本集对机器阅读理解模型进行训练,得到W个机器阅读理解模型;所述测试阶段包括:将待测试的文章进行截断处理,处理后的文章与问题输入训练好的W个机器阅读理解模型中,得到W个预测的答案起始位置、终止位置和对应的分布概率,计算均值作为最终答案的起始位置、终止位置和对应的分布概率。该方法能够解决现有机器阅读理解方法对中文文本的准确率较低等问题。

    一种基于梯度稀疏性与非局部相似性信息的图像复原方法

    公开(公告)号:CN109360158A

    公开(公告)日:2019-02-19

    申请号:CN201810967735.X

    申请日:2018-08-23

    IPC分类号: G06T5/00

    摘要: 本发明公开了一种基于梯度稀疏性与非局部相似性信息的图像复原方法,包括第一阶段基于梯度稀疏性的图像非盲复原,以及第二阶段基于非局部自回归模型的图像质量提升。其中第一阶段基于梯度稀疏性的图像非盲复原包含如下核心步骤:当前梯度图像辅助变量计算;当前复原图像更新;拉格朗日乘子计算。本发明以图像变换域稀疏性为基础,从而能够恢复出图像中的边缘结构,在此基础上,进一步利用图像中的非局部相似性信息,提升了图像复原的质量。

    一种基于线性回归的大模型答案溯源方法

    公开(公告)号:CN118656467A

    公开(公告)日:2024-09-17

    申请号:CN202410844244.1

    申请日:2024-06-27

    摘要: 本发明提供了一种基于线性回归的大模型答案溯源方法,首先针对跟定问题利用检索增强方法引入外部知识作为上下文,拼接问题和上下文输入模型得到原始答案。其次对上下文断句,依概率对句子进行掩码,排除掩盖的句子形成新的上下文,利用后验概率计算新上下文情况下生成原始答案的概率;该过程重复多次,形成多个 序对,生成训练数据。最后利用上一步生成的训练数据,训练线性回归模型以预测掩码后的段落生成原始答案的概率,该回归模型的权重矩阵作为上下文中句子重要性衡量指标,权重较大的句子作为答案的来源。经过以上3个步骤,实现了大模型生成答案的追根溯源,从而增强模型的可解释性,有利于用户评估答案的可靠性。