-
公开(公告)号:CN118982005A
公开(公告)日:2024-11-19
申请号:CN202411148124.4
申请日:2024-08-21
申请人: 钉钉(中国)信息技术有限公司
IPC分类号: G06F40/16 , G06F16/33 , G06F16/332 , H04L51/04 , G10L15/26
摘要: 本申请实施例提供了一种数据处理方法、设备、计算机存储介质及计算机程序产品,上述方法包括:通过会话窗口接收用户的语音输入数据,并对语音输入数据进行文本转换;对已转换成功的文本数据进行预设对象识别,确定文本数据中的目标对象;对目标对象对应的文本数据进行会话标记处理,以通过会话标记提醒目标对象查看语音输入数据转换后的文本数据。通过本申请实施例,用户可以便捷地通过语音方式向会话窗口中发送文本形式的会话消息,且在会话消息涉及具有会话能力的目标对象时,无需用户手动执行繁琐的会话对象提醒操作,而自动进行会话标记处理,基于会话标记达到提醒目标对象及时查看通过语音方式发送的文本会话消息的目的。
-
公开(公告)号:CN118966226A
公开(公告)日:2024-11-15
申请号:CN202411453086.3
申请日:2024-10-17
申请人: 时代新媒体出版社有限责任公司
IPC分类号: G06F40/295 , G06F40/253 , G06F16/36 , G06N3/045 , G06N3/0442 , G06N5/02 , G06F18/25 , G06V10/44 , G06F40/16
摘要: 本发明提供了一种基于深度学习的古籍文本实体关系抽取方法及系统,涉及古籍识别处理技术领域,该方法旨在提高古籍文本处理的准确性和效率。系统通过融合多模态信息(文字和插图)、自注意力机制、图神经网络及动态知识图谱技术,实现了对古籍文本中实体及其关系的精准识别和抽取。该方法有效处理了古籍中文言文的复杂语法结构,确保长距离依赖关系的捕捉。通过构建和实时更新知识图谱,系统大大提升了知识管理的效能。此技术降低了人工干预,实现了古籍处理的自动化和大规模应用,促进了文化遗产的保护和学术研究的进展。
-
公开(公告)号:CN118657136B
公开(公告)日:2024-11-05
申请号:CN202411147021.6
申请日:2024-08-21
申请人: 天津医科大学总医院
IPC分类号: G06F40/186 , G06F40/16 , G06F40/232 , G16H10/60 , G06N3/0442 , G06N3/0455 , G06N3/0475
摘要: 本发明提供了一种基于神经网络技术的病历生成方法,包括以下步骤:S1、采集医疗文字记录数据;S2、识别并纠正医疗文字记录中的同音错译;S3、对经过纠正的医疗文字记录进行词嵌入;S4、使用编码器提取特征;S5、使用条件生成解码器生成短文本;S6、使用条件随机场层从双向长短时记忆网络得到的高维特征优化标签序列的预测;S7、使用条件生成解码器和条件随机场层的预测结果替换病历模板中的占位符生成病例。本发明有益效果:条件生成解码器和双向长短时记忆网络的结合使得生成的短文本不仅基于全文的信息,还考虑了局部上下文的重要性,从而提高了生成的文本的相关性和准确性,提高了输出医学电子病历的准确性。
-
公开(公告)号:CN118885816A
公开(公告)日:2024-11-01
申请号:CN202411354055.2
申请日:2024-09-27
申请人: 北京资采信息技术有限公司
发明人: 吴元浩
IPC分类号: G06F18/214 , G06F40/16 , G06F40/211 , G06F40/30
摘要: 本申请提供了一种语句生成方法、装置、终端设备及存储介质,适用于计算机技术领域,该方法包括:获取语料信息;根据所述语料信息以及预设的语料组合顺序信息,生成多个初始语句;根据多个所述初始语句以及预设的语料库,进行语义分析计算,得到语义错误率;根据所述多个初始语句、所述语义错误率以及预设的错误率阈值,对初始语句进行调整,生成多个目的语句。本申请根据词汇内容与预设的词汇组合顺序,生成带有语料信息的语句,通过对生成的语句进行特征提取与语义特征的分析运算,判定生成语句的语义准确性,从而确保用于供人工智能模型训练的语句的数量与准确性,有效解决通过人工对文本内容中的语料进行标注的效率低下以及准确性不高的问题。
-
公开(公告)号:CN118869302A
公开(公告)日:2024-10-29
申请号:CN202410939533.X
申请日:2024-07-12
申请人: 山石网科通信技术股份有限公司
摘要: 本申请公开了一种基于生成式大语言模型的主机安全规则确定方法及装置,涉及信息安全领域及人工智能领域,该方法包括:获取初始知识图谱模板,其中,初始知识图谱模板用于描述需要检测的主机攻击行为;通过生成式大语言模型对初始知识图谱模板进行内容填充,得到目标知识图谱,其中,目标知识图谱至少包括生成式大语言模型依据初始知识图谱模板生成的至少一个主机攻击行为信息;基于目标知识图谱中的至少一个主机攻击行为信息确定主机安全规则。本申请解决了现有技术中由于使用大语言模型提取的内容准确性较差,导致的难以生成准确度较高的主机安全规则的技术问题。
-
公开(公告)号:CN118866216A
公开(公告)日:2024-10-29
申请号:CN202410906087.2
申请日:2024-07-08
申请人: 哈尔滨理工大学 , 哈尔滨工业大学 , 中数(深圳)时代科技有限公司
IPC分类号: G16H10/60 , G16H50/20 , G16H50/30 , G16H50/70 , G16H40/67 , G06N5/025 , G06N3/042 , G06N3/098 , G06F40/16 , G06F18/213 , G06N3/045 , G06N3/0464
摘要: 本发明一种基于联邦学习和知识图谱的痛风病分期预测方法、系统及存储介质,涉及智能医疗领域,为解决现有的机器学习模型难以全面、准确地捕捉病例数据中的关键信息,且存在隐私数据泄露的风险,及医院之间的数据孤岛问题。本发明客户端基于患者病历数据集构建关键词相关的知识图谱子图;中心服务端构建有R‑GCN模型,客户端采用知识图谱子图对R‑GCN模型进行训练,模型参数经加密后发送至中心服务端聚合,至模型满足训练条件。采用训练后的模型对知识图谱子图进行编码,得到编码信息R1;对数据集中的文本特征数据进行向量化编码与数值特征进行横向连接得到编码信息R2;横向连接编码信息R1与R2后,经过深度学习网络模型对痛风病的不同分期进行分类预测。
-
公开(公告)号:CN118864127A
公开(公告)日:2024-10-29
申请号:CN202410867741.3
申请日:2024-06-28
申请人: 平安健康保险股份有限公司
发明人: 姚成浪
IPC分类号: G06Q40/12 , G06Q40/08 , G06N3/045 , G06F40/194 , G06F40/16
摘要: 本申请实施例属于数字医疗技术领域,应用于医疗保险财务数据核算监控场景中,涉及一种差异数据监控方法、装置、设备及其存储介质,包括获取从目标业务系统发送的批量待核算业务数据;进行汇算生成财务数据;以财务数据生成票据凭证,为票据凭证赋予票头编号;以票头编号绑定相应待核算业务数据;对票据凭证、待核算业务数据进行差异分析;根据差异分析结果向目标监控终端发送相应提示。将该方法应用于医疗保险财务数据核算监控场景中,便于及时发现核算出现异常的财务数据,反查出该财务数据对应的业务数据,及时根据所述业务数据排查医疗保险业务大数据场景下出现的数据处理异常,解决了人工智能大模型下,保险业务数据异常排查困难的问题。
-
公开(公告)号:CN118862887A
公开(公告)日:2024-10-29
申请号:CN202410867837.X
申请日:2024-07-01
申请人: 大连民族大学
IPC分类号: G06F40/295 , G06F40/253 , G06F40/16 , G06F40/186 , G06N3/045 , G06N3/0442 , G06N3/0464
摘要: 一种基于多任务的小样本生物医学命名实体识别方法,属于生物医学命名实体识别技术领域,包括如下步骤:S1、数据增强;S2、预微调;S3、构建下游NER框架。本发明研究了一种更现实的FSNER方法,本发明采用特定的提示模板来引导大型语言模型生成高质量的新样本。本发明提出了一种新颖的更细粒度网格标记策略和单端敏感多任务学习框架,该方法设置了多任务损失,使模型能够从多个任务目标中学习:什么是完全正确的实体、部分正确的实体、不正确的实体。然后通过网格标记策略,模型可以根据更多标记线索对实体进行解码。本发明在少样本场景下训练之后,直接应用于完整的测试集。
-
公开(公告)号:CN118862877A
公开(公告)日:2024-10-29
申请号:CN202410853211.3
申请日:2024-06-27
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F40/284 , G06F40/16 , G06N3/0499 , G06N3/0442 , G06N3/0464 , G06N3/045
摘要: 本说明书实施例披露一种文本处理方法及装置。该方法包括:首先,获取目标文本序列,其中包括顺序排列的T个词元。接着,利用状态空间模型进行T次迭代,以得到目标输出;其中,任意第t次迭代包括:利用所述状态空间模型中包括的选择门参数和缩放门参数分别处理第t个词元特征,得到选择门控信号和缩放门控信号;对上一次迭代后的状态空间表征与当前的输入状态进行组合操作,得到本次迭代后的状态空间表征;其中所述输入状态基于所述第t个词元特征而确定,所述组合操作的组合权重通过利用所述缩放门控信号对所述选择门控信号进行缩放处理而确定。之后,基于所述目标输出进行预测处理,得到目标预测结果。
-
公开(公告)号:CN118861559A
公开(公告)日:2024-10-29
申请号:CN202410885867.3
申请日:2024-07-03
申请人: 卫宁健康科技集团股份有限公司
IPC分类号: G06F18/20 , G06F18/22 , G06F40/16 , G06F40/194 , G06F40/30
摘要: 本申请提供了一种意图识别方法以及计算机设备,涉及计算机技术领域,该方法包括:获取通过医疗业务界面输入的自然语言文本;从医疗业务界面中提取自然语言文本对应的上下文背景信息;根据自然语言文本和上下文背景信息,从预设代理程序库中确定目标代理程序;对自然语言文本进行变量提取,得到目标代理程序所需的多个变量参数;对多个变量参数进行拼接,生成目标处理命令;基于目标处理命令执行目标代理程序,得到目标代理程序对应目标医疗业务的处理结果。本申请中的方法提高意图识别的准确性和全面性,能够更好地理解用户的意图,显著提升了用户意图识别的准确性和识别速度。
-
-
-
-
-
-
-
-
-