一种融合规则的文本数字抽取装置

    公开(公告)号:CN113239659A

    公开(公告)日:2021-08-10

    申请号:CN202110427381.1

    申请日:2021-04-21

    摘要: 一种融合规则的文本数字抽取装置,它涉及金融技术领域,它包括信息输出层模块、解码层模块、标签融合层模块、编码层模块、预处理提取模块,所述预处理提取模块连接编码层模块,所述编码层模块与标签融合层模块相连接,所述标签融合层模块通过解码层模块与信息输出层模块相连接本发明有益效果为:对有大量数字类数据的文本抽取,在针对金融领域的数据抽取中准确率能提升%‑%以上,针对金融行业,对算法模型要求高的行业中,使其信息抽取准确率更好的达到商用的标准。

    文字中提取多元组的方法和装置

    公开(公告)号:CN108733636B

    公开(公告)日:2021-07-13

    申请号:CN201710280347.X

    申请日:2017-04-25

    发明人: 林得苗

    摘要: 本发明提供了一种文字中提取多元组的方法和装置,涉及文本处理领域。该文字中提取多元组的方法,包括:将带有合法标识和非法标识的训练数据输入循环神经网络,得到网络参数;识别待测文本中的多元实体,并对待测文本中除多元实体外的其他部分进行分词;按照在待测文本中的排列顺序,将多元实体的词向量和分词后得到的词语的词向量一一对应输入多个子网络中,结合网络参数,得到各子网络输出的隐向量,前一子网络输出的隐向量为后一子网络的输入;将组成多元组的多元实体对应的隐向量进行整合计算,得到判断向量;利用网络参数,对判断向量进行分类,得到分类结果;提取分类结果为合法的多元组,作为合法多元组。能够提高提取多元组的正确率。

    文本处理方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN113011126A

    公开(公告)日:2021-06-22

    申请号:CN202110265746.5

    申请日:2021-03-11

    发明人: 刘刚

    摘要: 本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质,涉及人工智能、自然语言处理、文本处理及云技术领域。该方法包括:通过调用训练好的第一文本处理模型对第一待处理文本进行处理,该模型是通过以下方式训练得到的:获取多个第一文本,将每个第一文本中包含的至少一个字符进行替换,得到各第一文本对应的第二文本;基于各第一文本和各第二文本,对初始特征提取模块进行训练,得到预训练后的特征提取模块,基于第二训练数据对预训练后的特征提取模块和初始文本处理模块进行训练,得到第一文本处理模型。本方案中,由于将第一文本中的字符替换,以使模型主动学习字符间的上下文信息,从而提高了模型的精度。

    用于检测生成域的系统和方法
    75.
    发明公开

    公开(公告)号:CN112771523A

    公开(公告)日:2021-05-07

    申请号:CN201880096365.5

    申请日:2018-12-28

    摘要: 一种用于域分析的计算机实施方法包括:通过计算设备获取域;以及通过所述计算设备将获取的域输入到经训练的检测模型,以确定所述获取的域是否由一种或多种域生成算法生成。所述检测模型包括神经网络模型、基于n‑gram的机器学习模型和集成层。将所述获取的域输入到所述检测模型包括:将所述获取的域输入到所述神经网络模型和所述基于n‑gram的机器学习模型。所述神经网络模型和所述基于n‑gram的机器学习模型都输出到所述集成层。所述集成层输出所述获取的域由域生成算法生成的概率。

    显示窗口中内容信息的确认方法、装置、设备及存储介质

    公开(公告)号:CN112417810A

    公开(公告)日:2021-02-26

    申请号:CN202011282940.6

    申请日:2020-11-17

    发明人: 秦梦娟

    摘要: 本发明涉及计算机技术领域,公开了显示窗口中内容信息的确认方法、装置、设备及存储介质,用于提高在显示窗口中文字信息的确认效率。显示窗口中内容信息的确认方法包括:当接收到语音播报指令时,播放显示窗口中的内容信息;基于预设时长检测内容信息,当文本信息为播放完毕时,利用预置的跳转标签将内容信息定位于操作框的位置,并对操作框进行解禁处理,得到勾选框;获取勾选框的操作结果与确认语音,判断操作结果是否为预置结果;若操作结果为预置结果,则判断确认语音是否为预置语音,若确认语音为预置语音,则完成内容信息的确认;若操作结果不为预置结果,则结束内容信息的确认。此外,本发明还涉及区块链技术,内容信息可存储于区块链中。

    一种古汉语自动分词及词性标注一体化方法及装置

    公开(公告)号:CN110276052B

    公开(公告)日:2021-02-12

    申请号:CN201910495060.8

    申请日:2019-06-10

    发明人: 皇甫伟 于学金

    IPC分类号: G06F40/10 G06F40/253 G06N3/04

    摘要: 本发明提供一种古汉语自动分词及词性标注一体化方法及装置,能够有效提升古汉语分词及词性标注的正确率。所述方法包括:获取古汉语语料库中的古汉语文本;对获取的古汉语文本的标签进行标签转换,得到包含词性标记信息和分词标记信息的二元标签结构;对得到的二元标签结构进行编码;构建双向长短期记忆神经网络,基于编码后得到的二元标签信息,利用获取的古汉语文本对构建的双向长短期记忆神经网络进行训练,得到基于双向长短期记忆神经网络的自动分词及词性标注一体化模型,其中,所述基于双向长短期记忆神经网络的自动分词及词性标注一体化模型,用于对输入的古汉语文本同时进行分词和标注。本发明适用于机器翻译、信息检索、语义识别领域。

    一种确定待签订电子合同的方法和系统

    公开(公告)号:CN112329381A

    公开(公告)日:2021-02-05

    申请号:CN202011140373.0

    申请日:2020-10-22

    发明人: 许宏江

    摘要: 本发明涉及一种确定待签订电子合同的方法和系统,乙方客户端能时刻根据编辑信息确认出电子合同的最新版本,以及根据编辑信息对甲方客户端返回的第一电子合同进行修改和编辑,并将修改得到的第二电子合同作为原始电子合同发送至甲方客户端,即便甲方发生混淆即没有在乙方客户端最新修改的电子合同上进行修改,乙方客户端也可以根据编辑信息进行编辑,以保证电子合同的最新版本实时包括甲方和乙方所作出的所有修改和编辑,直至得到待签订电子合同,从而降低了得到最终的电子合同即待签订电子合同所花费的时间成本,效率高,且从根源上避免了会对甲方和乙方造成损失的可能性。

    即时聊天中语音数据的摘要生成方法、服务器及系统

    公开(公告)号:CN108540373B

    公开(公告)日:2020-12-29

    申请号:CN201810240649.9

    申请日:2018-03-22

    发明人: 范大宇

    摘要: 本发明提供了一种即时聊天中语音数据的摘要生成方法,包括:获取即时聊天时终端发送的语音消息,语音消息包括语音数据和语音数据在终端的存储路径;对语音数据进行语音识别,确定语音数据对应的文本信息,并根据文本信息提取语音数据的摘要信息;根据语音识别结果生成语音消息的摘要数据列表,摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量;将语音消息的摘要数据列表下发至终端,指示终端根据摘要数据列表检索所需的语音消息。本即时聊天中语音数据的摘要生成方法,生成即时聊天软件中语音消息的摘要信息,根据摘要信息来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。