一种应用于垂直领域的固定格式文档结构化识别的方法

    公开(公告)号:CN115995088A

    公开(公告)日:2023-04-21

    申请号:CN202211477364.X

    申请日:2022-11-23

    IPC分类号: G06V30/418 G06V30/19

    摘要: 本发明公开了一种应用于垂直领域的固定格式文档结构化识别的方法,属于图像识别技术领域,具体方法包括:步骤一:定义参照区域和目标区域,制作模板文档;从所有文档中选择无形变的图片,进行图片预处理,根据参照区域和目标区域的定义对文档中的参照区域和目标区域进行标注,形成预定好的模板文档格式;步骤二:生成标记数据;步骤三:对参照区域的OCR检测和识别模型进行优化;步骤四:优化目标区域的OCR识别模型;步骤五:通过优化OCR检测和识别模型与优化OCR识别模型对文档进行结构化识别;利用在通用场景训练好的OCR模型并结合模板匹配,自动生成标记数据,对模型进行优化,无需人为标记垂直领域的文档数据。

    一种融合闲聊和常识的多技能任务型对话系统构建方法

    公开(公告)号:CN114153955B

    公开(公告)日:2023-04-07

    申请号:CN202111334457.2

    申请日:2021-11-11

    摘要: 本发明涉及对话系统,具体涉及一种融合闲聊和常识的多技能任务型对话系统构建方法,收集大规模开源的中文闲聊语料,将相邻对话作为闲聊语料对,并构建闲聊模型,收集大规模各领域的常识问答语料以及三元组数据,构建知识图谱,基于常识问答语料训练相似度打分模型,对原始问题进行处理得到候选实体集合,从知识图谱中获取相关两跳关系内所有出度和入度的关系,并得到最终候选实体,利用最终候选实体筛选出实体关系路径,并对实体关系路径进行优选得到最终路径,基于最终路径从知识图谱中查询常识答案,完成常识对话模型的构建;本发明提供的技术方案能够有效克服现有技术所存在的无法兼具常识推理能力和闲聊功能、对话回复召回准确性较低的缺陷。

    一种基于深度学习模型的通话状态检测分类方法

    公开(公告)号:CN115022466A

    公开(公告)日:2022-09-06

    申请号:CN202210803213.2

    申请日:2022-07-07

    摘要: 本发明公开了一种基于深度学习模型的通话状态检测分类方法,涉及通话状态检测技术领域,解决了现有技术在通话状态检测过程中,能够处理的音频类型少,以及数据处理量大,导致通话状态检测效果难以满足要求的技术问题;本发明包括:获取基础语音数据,对基础语音数据进行语音预处理之后获取训练语音数据;通过训练语音数据对深度学习模型进行训练获取状态识别模型;当缓存的用户音频数据超过数据阈值时,进行VAD过滤获取目标音频段,并结合通话状态检测平台对目标音频段进行分析;本发明通过VAD切分标注去除无效音频段,提升了标注效率;在训练过程中有效避免了存储空间的局限性,增强状态识别模型泛化能力,提升状态识别模型的精度。

    一种基于预训练的地址提取和标准化方法

    公开(公告)号:CN114398886A

    公开(公告)日:2022-04-26

    申请号:CN202111582633.4

    申请日:2021-12-22

    IPC分类号: G06F40/289 G06K9/62

    摘要: 本发明涉及地址提取,具体涉及一种基于预训练的地址提取和标准化方法,收集含有地址信息的语料,对模型进行预训练;基于增强型地址语料,通过半监督自学习模式对预训练模型进行微调,并利用微调后的模型进行地名识别;基于自更新自维护字典进行地址纠正;基于多头注意力机制生成模型进行地址规范化;本发明提供的技术方案能够有效克服现有技术所存在的标注语料成本较高、提取得到地址不够标准规范的缺陷。

    一种基于小程序的自助新冠抗原检测与结果识别的方法

    公开(公告)号:CN115272936A

    公开(公告)日:2022-11-01

    申请号:CN202210956853.7

    申请日:2022-08-10

    摘要: 本发明公开了一种基于小程序的自助新冠抗原检测与结果识别的方法,涉及自助新冠抗原检测与结果识别技术领域;通过将检测过程划分为若干步骤;设置了动作识别引擎和结果识别引擎;其中动作识别引擎通过使用ELAN多模态标注工具和TimeSformer神经网络模型,识别用户在每个阶段是否规范执行每个检测步骤的操作;其中结果识别引擎通过使用cvat标注工具进行标注结果展示样本中的检测结果,并训练yolov5神经网络用于识别显色板的检测结果;解决了自动监督用户进行抗原检测的问题。

    一种融合闲聊和常识的多技能任务型对话系统构建方法

    公开(公告)号:CN114153955A

    公开(公告)日:2022-03-08

    申请号:CN202111334457.2

    申请日:2021-11-11

    摘要: 本发明涉及对话系统,具体涉及一种融合闲聊和常识的多技能任务型对话系统构建方法,收集大规模开源的中文闲聊语料,将相邻对话作为闲聊语料对,并构建闲聊模型,收集大规模各领域的常识问答语料以及三元组数据,构建知识图谱,基于常识问答语料训练相似度打分模型,对原始问题进行处理得到候选实体集合,从知识图谱中获取相关两跳关系内所有出度和入度的关系,并得到最终候选实体,利用最终候选实体筛选出实体关系路径,并对实体关系路径进行优选得到最终路径,基于最终路径从知识图谱中查询常识答案,完成常识对话模型的构建;本发明提供的技术方案能够有效克服现有技术所存在的无法兼具常识推理能力和闲聊功能、对话回复召回准确性较低的缺陷。