一种数据处理方法、设备、计算机存储介质及计算机程序产品

    公开(公告)号:CN118982005A

    公开(公告)日:2024-11-19

    申请号:CN202411148124.4

    申请日:2024-08-21

    摘要: 本申请实施例提供了一种数据处理方法、设备、计算机存储介质及计算机程序产品,上述方法包括:通过会话窗口接收用户的语音输入数据,并对语音输入数据进行文本转换;对已转换成功的文本数据进行预设对象识别,确定文本数据中的目标对象;对目标对象对应的文本数据进行会话标记处理,以通过会话标记提醒目标对象查看语音输入数据转换后的文本数据。通过本申请实施例,用户可以便捷地通过语音方式向会话窗口中发送文本形式的会话消息,且在会话消息涉及具有会话能力的目标对象时,无需用户手动执行繁琐的会话对象提醒操作,而自动进行会话标记处理,基于会话标记达到提醒目标对象及时查看通过语音方式发送的文本会话消息的目的。

    一种基于神经网络技术的病历生成方法

    公开(公告)号:CN118657136B

    公开(公告)日:2024-11-05

    申请号:CN202411147021.6

    申请日:2024-08-21

    摘要: 本发明提供了一种基于神经网络技术的病历生成方法,包括以下步骤:S1、采集医疗文字记录数据;S2、识别并纠正医疗文字记录中的同音错译;S3、对经过纠正的医疗文字记录进行词嵌入;S4、使用编码器提取特征;S5、使用条件生成解码器生成短文本;S6、使用条件随机场层从双向长短时记忆网络得到的高维特征优化标签序列的预测;S7、使用条件生成解码器和条件随机场层的预测结果替换病历模板中的占位符生成病例。本发明有益效果:条件生成解码器和双向长短时记忆网络的结合使得生成的短文本不仅基于全文的信息,还考虑了局部上下文的重要性,从而提高了生成的文本的相关性和准确性,提高了输出医学电子病历的准确性。

    一种语句生成方法、装置、终端设备及存储介质

    公开(公告)号:CN118885816A

    公开(公告)日:2024-11-01

    申请号:CN202411354055.2

    申请日:2024-09-27

    发明人: 吴元浩

    摘要: 本申请提供了一种语句生成方法、装置、终端设备及存储介质,适用于计算机技术领域,该方法包括:获取语料信息;根据所述语料信息以及预设的语料组合顺序信息,生成多个初始语句;根据多个所述初始语句以及预设的语料库,进行语义分析计算,得到语义错误率;根据所述多个初始语句、所述语义错误率以及预设的错误率阈值,对初始语句进行调整,生成多个目的语句。本申请根据词汇内容与预设的词汇组合顺序,生成带有语料信息的语句,通过对生成的语句进行特征提取与语义特征的分析运算,判定生成语句的语义准确性,从而确保用于供人工智能模型训练的语句的数量与准确性,有效解决通过人工对文本内容中的语料进行标注的效率低下以及准确性不高的问题。

    基于生成式大语言模型的主机安全规则确定方法及装置

    公开(公告)号:CN118869302A

    公开(公告)日:2024-10-29

    申请号:CN202410939533.X

    申请日:2024-07-12

    发明人: 董皓 郭敬达 张晔

    摘要: 本申请公开了一种基于生成式大语言模型的主机安全规则确定方法及装置,涉及信息安全领域及人工智能领域,该方法包括:获取初始知识图谱模板,其中,初始知识图谱模板用于描述需要检测的主机攻击行为;通过生成式大语言模型对初始知识图谱模板进行内容填充,得到目标知识图谱,其中,目标知识图谱至少包括生成式大语言模型依据初始知识图谱模板生成的至少一个主机攻击行为信息;基于目标知识图谱中的至少一个主机攻击行为信息确定主机安全规则。本申请解决了现有技术中由于使用大语言模型提取的内容准确性较差,导致的难以生成准确度较高的主机安全规则的技术问题。

    一种差异数据监控方法、装置、设备及其存储介质

    公开(公告)号:CN118864127A

    公开(公告)日:2024-10-29

    申请号:CN202410867741.3

    申请日:2024-06-28

    发明人: 姚成浪

    摘要: 本申请实施例属于数字医疗技术领域,应用于医疗保险财务数据核算监控场景中,涉及一种差异数据监控方法、装置、设备及其存储介质,包括获取从目标业务系统发送的批量待核算业务数据;进行汇算生成财务数据;以财务数据生成票据凭证,为票据凭证赋予票头编号;以票头编号绑定相应待核算业务数据;对票据凭证、待核算业务数据进行差异分析;根据差异分析结果向目标监控终端发送相应提示。将该方法应用于医疗保险财务数据核算监控场景中,便于及时发现核算出现异常的财务数据,反查出该财务数据对应的业务数据,及时根据所述业务数据排查医疗保险业务大数据场景下出现的数据处理异常,解决了人工智能大模型下,保险业务数据异常排查困难的问题。

    一种基于多任务的小样本生物医学命名实体识别方法

    公开(公告)号:CN118862887A

    公开(公告)日:2024-10-29

    申请号:CN202410867837.X

    申请日:2024-07-01

    摘要: 一种基于多任务的小样本生物医学命名实体识别方法,属于生物医学命名实体识别技术领域,包括如下步骤:S1、数据增强;S2、预微调;S3、构建下游NER框架。本发明研究了一种更现实的FSNER方法,本发明采用特定的提示模板来引导大型语言模型生成高质量的新样本。本发明提出了一种新颖的更细粒度网格标记策略和单端敏感多任务学习框架,该方法设置了多任务损失,使模型能够从多个任务目标中学习:什么是完全正确的实体、部分正确的实体、不正确的实体。然后通过网格标记策略,模型可以根据更多标记线索对实体进行解码。本发明在少样本场景下训练之后,直接应用于完整的测试集。

    文本处理方法及装置
    9.
    发明公开

    公开(公告)号:CN118862877A

    公开(公告)日:2024-10-29

    申请号:CN202410853211.3

    申请日:2024-06-27

    摘要: 本说明书实施例披露一种文本处理方法及装置。该方法包括:首先,获取目标文本序列,其中包括顺序排列的T个词元。接着,利用状态空间模型进行T次迭代,以得到目标输出;其中,任意第t次迭代包括:利用所述状态空间模型中包括的选择门参数和缩放门参数分别处理第t个词元特征,得到选择门控信号和缩放门控信号;对上一次迭代后的状态空间表征与当前的输入状态进行组合操作,得到本次迭代后的状态空间表征;其中所述输入状态基于所述第t个词元特征而确定,所述组合操作的组合权重通过利用所述缩放门控信号对所述选择门控信号进行缩放处理而确定。之后,基于所述目标输出进行预测处理,得到目标预测结果。

    一种意图识别方法以及计算机设备

    公开(公告)号:CN118861559A

    公开(公告)日:2024-10-29

    申请号:CN202410885867.3

    申请日:2024-07-03

    摘要: 本申请提供了一种意图识别方法以及计算机设备,涉及计算机技术领域,该方法包括:获取通过医疗业务界面输入的自然语言文本;从医疗业务界面中提取自然语言文本对应的上下文背景信息;根据自然语言文本和上下文背景信息,从预设代理程序库中确定目标代理程序;对自然语言文本进行变量提取,得到目标代理程序所需的多个变量参数;对多个变量参数进行拼接,生成目标处理命令;基于目标处理命令执行目标代理程序,得到目标代理程序对应目标医疗业务的处理结果。本申请中的方法提高意图识别的准确性和全面性,能够更好地理解用户的意图,显著提升了用户意图识别的准确性和识别速度。