一种文本纠错方法及装置
    51.
    发明公开

    公开(公告)号:CN112560450A

    公开(公告)日:2021-03-26

    申请号:CN202011442529.0

    申请日:2020-12-11

    Abstract: 本申请公开了一种文本纠错方法及装置,该方法包括:在获取到目标领域下的待纠错文本后,先从待纠错文本中确定待纠错对象,并根据该待纠错对象、通用混淆集和专用混淆集,确定该待纠错对象的候选混淆对象;再根据该待纠错文本、该待纠错对象和该待纠错对象的候选混淆对象,生成该待纠错文本对应的纠错后文本。其中,因通用混淆集用于记录通用易混淆对象对之间的对应关系,且专用混淆集用于记录目标领域下专用易混淆对象对之间的对应关系,使得基于通用混淆集和专用混淆集确定的候选混淆对象不仅包括通用易混淆对象,还包括在目标领域下特有的专用易混淆对象,如此使得该候选混淆对象更全面,从而使得基于该候选混淆对象生成的纠错后文本更准确。

    一种文本摘要生成方法
    52.
    发明授权

    公开(公告)号:CN109670035B

    公开(公告)日:2021-03-23

    申请号:CN201811466899.0

    申请日:2018-12-03

    Abstract: 本申请披露了一种文本摘要生成方法,包括:基于输入文本的内容和输入文本对应领域的业务信息,获取普通生成词和领域词的概率;基于所述普通生成词和领域词的概率以及对应词汇,生成输入文本对应的摘要信息。本申请还披露了一种文本摘要生成方法,包括:基于编码后的输入文本,实时获取输入文本对应的普通生成词、复制词和领域词的概率,基于该三者的概率和对应词汇来获取摘要信息。本申请的方法能够结合相关的业务领域,基于对应的领域库纳入该领域的相关业务信息,提取摘要词,更为准确地总结出相关业务过程的摘要信息;同时,综合多种机制可准确识别关键信息、提高流畅度并避免信息冗余。

    一种语义理解方法、装置、设备及存储介质

    公开(公告)号:CN111814487A

    公开(公告)日:2020-10-23

    申请号:CN202010691064.6

    申请日:2020-07-17

    Abstract: 本申请提供了一种语义理解方法、装置、设备及存储介质,其中,方法包括:获取目标文本;根据目标文本以及预先针对目标文本所属领域构建的知识语义树模板,生成能够体现目标文本语义的知识语义树,作为目标知识语义树,其中,知识语义树模板包括目标文本所属领域中能够体现语义的多个实体、多个实体分别对应的实体的类型以及多个实体之间的关系,目标知识语义树包括能够体现目标文本语义的多个目标实体、多个目标实体分别对应的实体类型以及多个目标实体之间的关系;根据目标知识语义树,从标准文本集合中确定目标文本对应的标准文本。本申请提供的语义理解方法能够正确理解目标文本所表达内容的真正语义。

    语义表达式生成方法、装置及设备

    公开(公告)号:CN111460169A

    公开(公告)日:2020-07-28

    申请号:CN202010230282.X

    申请日:2020-03-27

    Abstract: 本发明公开了一种语义表达式生成方法、装置及设备。其中主要构思在于先从待处理文本中提炼出完整涵盖用户意图的各语义要素及各语义要素之间的关联关系,在此基础上,再从中梳理出能够清晰表示出文本语义的关键语义要素,并由此形成可以作为语义表达式的关键语义要素序列。本发明相比现有的语义表达生成方式,能够从整体上考虑提炼语义要素并考虑要素之间的关联关系,而在此基础上整理出的关键语义要素及形成的关键语义要素序列便更为准确、直接地表达出真实语义,并且本发明基于语义要素及相互关联关系的抽取和梳理,使得各语义要素的关键程度清晰展现,无需繁琐、冗余地进行比对、匹配等操作,便可高效地输出最终的语义表达式。

    一种新词发现方法及装置
    55.
    发明公开

    公开(公告)号:CN106445915A

    公开(公告)日:2017-02-22

    申请号:CN201610826780.4

    申请日:2016-09-14

    Abstract: 本发明提供了一种成词概率的计算方法、新词发现方法及装置,所述计算方法包括:获取文本数据;对所述文本数据进行分词,获得候选词;获取所述候选词的词向量;根据所述候选词的词向量和所述候选词在所述文本数据中的出现顺序,计算经过遗忘后的所述候选词的成词概率。若所述经过遗忘后的候选词的成词概率大于预设阈值,并且所述候选词未出现在词典中,将所述候选词标记为新词。可见,在本发明实施例中,无需人工总结规则,从而减少工作量,而且最终计算出的是经过遗忘后的成词概率,从而提高了新词利用率,节省系统资源。

    医疗检索方法及相关方法、装置、设备和存储介质

    公开(公告)号:CN119964827A

    公开(公告)日:2025-05-09

    申请号:CN202411883034.X

    申请日:2024-12-19

    Abstract: 本申请公开了一种医疗检索方法及相关方法、装置、设备和存储介质,其中,医疗检索方法包括:获取目标医疗问题和医疗领域的目标异质图;基于目标医疗问题在目标异质图中提取从起始节点至结束节点的至少一个子图,分别作为候选子图;基于候选子图中起始节点与结束节点之间的相关度,选择候选子图作为目标子图;基于目标子图中各条节点路径分别与目标医疗问题之间的匹配度,选择节点路径作为目标路径;基于目标路径上第一目标节点的属性信息,得到目标医疗问题的检索结果;其中,各个第一目标节点分别所属节点类型包括知识条目、诊疗方案中至少一者。上述方案,能够提升医疗检索的可解释性,有助于推进医疗问答的可解释性。

    一种营销策略的更新方法、装置和计算机可读存储介质

    公开(公告)号:CN113902471B

    公开(公告)日:2025-02-18

    申请号:CN202111129042.1

    申请日:2021-09-26

    Abstract: 本申请公开了一种营销策略的更新方法、装置和计算机可读存储介质,该方法包括:获取营销失败对话数据与营销成功对话数据;采用意图识别模型分别对营销失败对话数据与营销成功对话数据进行意图识别处理,得到第一对话语义标签图与第二对话语义标签图;基于第一对话语义标签图与第二对话语义标签图,对营销失败对话数据和营销成功对话数据进行关联;对与营销失败对话数据关联的营销成功对话数据进行分析处理,生成营销成功策略;将营销成功策略添加至营销失败对话数据的营销策略中,以对营销失败对话数据的营销策略进行更新。通过上述方式,本申请能够提升营销的成功率。

    一种语义理解方法、装置、设备及存储介质

    公开(公告)号:CN111814487B

    公开(公告)日:2024-05-31

    申请号:CN202010691064.6

    申请日:2020-07-17

    Abstract: 本申请提供了一种语义理解方法、装置、设备及存储介质,其中,方法包括:获取目标文本;根据目标文本以及预先针对目标文本所属领域构建的知识语义树模板,生成能够体现目标文本语义的知识语义树,作为目标知识语义树,其中,知识语义树模板包括目标文本所属领域中能够体现语义的多个实体、多个实体分别对应的实体的类型以及多个实体之间的关系,目标知识语义树包括能够体现目标文本语义的多个目标实体、多个目标实体分别对应的实体类型以及多个目标实体之间的关系;根据目标知识语义树,从标准文本集合中确定目标文本对应的标准文本。本申请提供的语义理解方法能够正确理解目标文本所表达内容的真正语义。

    一种业务方案部署方法、装置、系统及设备

    公开(公告)号:CN114268661B

    公开(公告)日:2024-04-30

    申请号:CN202111399582.1

    申请日:2021-11-19

    Abstract: 本申请公开了一种业务方案部署方法、装置及设备,该方法包括:首先获取待部署的业务方案对应的目标业务请求,然后通过自动重新启动程序启动多进程处理服务,利用更新进程和操作类进程,分别处理该业务请求中的目标更新请求和目标操作类请求;接着通过预设的通信协议服务,根据目标更新请求的处理结果,调用更新类功能实现处理进程进行更新;并根据目标操作类请求的处理结果,调用操作类功能实现处理进程进行响应,以便通过操作类功能实现处理进程调用目标操作类请求所需的业务处理模型;进而再利用业务处理模型,将目标业务请求对应的业务方案部署到对应的服务器中。从而实现了业务方案从研发到部署的整个过程在性能上达到高并发和内存利用率高。

    一种语音文本重写模型构建方法、语音识别方法

    公开(公告)号:CN113035175B

    公开(公告)日:2024-04-12

    申请号:CN202110229318.7

    申请日:2021-03-02

    Abstract: 本申请公开了一种语音文本重写模型构建方法、语音识别方法,先利用样本语音的至少一个样本基础识别文本、样本标准识别文本、样本上文信息以及重写分类实际结果对待训练文本重写模型进行两阶段训练,得到语音文本重写模型,以使该语音文本重写模型具有较好地预测性能,以便在对目标用户输入的待识别语音进行语音识别得到至少一个待校正识别文本之后,可以由该语音文本重写模型根据该至少一个待校正识别文本以及该待识别语音的上文信息进行语音识别文本重写,得到并输出该待识别语音的目标语音识别文本,以使该目标语音识别文本能够更准确地表示出待识别语音携带的语音信息,如此能够提高语音识别准确性。

Patent Agency Ranking