-
公开(公告)号:CN110442861B
公开(公告)日:2023-04-07
申请号:CN201910608625.9
申请日:2019-07-08
Applicant: 万达信息股份有限公司 , 上海市内分泌代谢病研究所
IPC: G06F40/295 , G06F40/242 , G06F40/216
Abstract: 本发明涉及一种基于真实世界统计的中文专业术语与新词发现的方法。本发明使用了点间互信息(PMI)以及邻接熵(BE)来判断来寻找“种子”(具有高聚合性的词),采用这两个方法的原因主要是他们都属于无监督学习并且有着互补的作用。在找到“种子”之后,我们用基于16亿字的真实世界语料中所提炼出的统计信息来筛选出新词。
-
公开(公告)号:CN110442861A
公开(公告)日:2019-11-12
申请号:CN201910608625.9
申请日:2019-07-08
Applicant: 万达信息股份有限公司 , 上海市内分泌代谢病研究所
IPC: G06F17/27
Abstract: 本发明涉及一种基于真实世界统计的中文专业术语与新词发现的方法。本发明使用了点间互信息(PMI)以及邻接熵(BE)来判断来寻找“种子”(具有高聚合性的词),采用这两个方法的原因主要是他们都属于无监督学习并且有着互补的作用。在找到“种子”之后,我们用基于16亿字的真实世界语料中所提炼出的统计信息来筛选出新词。
-
公开(公告)号:CN119811575A
公开(公告)日:2025-04-11
申请号:CN202411850523.5
申请日:2024-12-16
Applicant: 万达信息股份有限公司 , 蛮牛健康管理服务有限公司
Abstract: 本发明公开了一种基于大模型实现跨机构体检报告检查项标准化方法。本发明通过大语言模型对不同机构的体检报告中的检查项名称进行推理判断,实现对不同来源的医疗文本数据的有效理解和标准化映射。最终,本发明能够实现不同医院机构的同一指标名称的统一,不局限于知识库范围和对编码的依赖,通过大语言模型代替部分人工,节省人工成本。
-
公开(公告)号:CN111986148B
公开(公告)日:2024-03-08
申请号:CN202010679683.3
申请日:2020-07-15
Applicant: 万达信息股份有限公司 , 上海复高计算机科技有限公司
IPC: G06T7/00 , G06T7/11 , G06T7/62 , G06T7/90 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464
-
公开(公告)号:CN111524570B
公开(公告)日:2024-01-16
申请号:CN202010371381.X
申请日:2020-05-06
Applicant: 万达信息股份有限公司 , 上海市公共卫生临床中心
Abstract: 本发明提供了一种基于机器学习的超声随访患者筛选方法。由于深度学习技术的快速发展,利用自然语言处理技术和深度学习技术成为了分析医疗文本的重要手段,是替代人工筛查文本的有效途径。本发明通过JIEBA分词工具对文本内容进行分词,并采用TF‑IDF方法和Word2Vec算法分别构建词向量,进一步利用卡方检验方法对特征向量进行选择。分类模型选择XGBoost、Lightgbm和CNN对特征数据进行训练建模,实现了对超声检查随访列表的自动筛选。(56)对比文件王根生;黄学坚.基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型.小型微型计算机系统.2019,(第05期),全文.常炳国;刘清星.基于深度学习的慢性肝病CT报告相似度分析.计算机应用与软件.2018,(第08期),全文.丁尚伟;谢玉环;陈俊君;陈沛芬;何志忠;罗海波.数字化病例随访系统在超声医师规范化培训中的应用.南方医学教育.2018,(第01期),全文.
-
公开(公告)号:CN110060773B
公开(公告)日:2023-10-27
申请号:CN201910322584.7
申请日:2019-04-22
Applicant: 东华大学 , 万达信息股份有限公司
IPC: G16H50/20 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明提出了一种基于双向LSTM的阿尔茨海默症病情发展预测系统,其特征在于,包括:预处理单元及基于深度学习的双向LSTM结合Attention机制模型。本发明主要从已获取到的神经心理学数据出发,分析数据的时间可利用性,参考深度学习中时间序列问题,把时间这一个关键的属性应用到模型上去。这样就可以降低由于单个时间点做预测而出现的性能问题。同时利用了深度学习中特有的给不同属性附加权重的方法,使得属性值有了各自的权重。
-
公开(公告)号:CN111312354B
公开(公告)日:2023-10-24
申请号:CN202010085426.7
申请日:2020-02-10
Applicant: 东华大学 , 万达信息股份有限公司
IPC: G16H15/00 , G06F40/295 , G06F40/284 , G06F40/169 , G06N3/047 , G06N3/045 , G06N3/092
Abstract: 本发明公开了一种基于多智能体强化学习的乳腺病历实体识别标注增强系统,其特征在于,包括用于将原始数据处理为系统可识别分析的表示形式的乳腺临床电子病历数据预处理模块,对乳腺临床电子病历数据从病历内容、结构特征、语言特征和语义特征进行分析,用于提取文本中的医疗概念实体的医疗临床实体识别模块及用于对从乳腺电子病历中抽取出的错误实体标签进行修正的强化学习标注增强模块。本发明基于部分可观测马尔科夫决策过程设计了针对实体识别序列标注的多智能体强化学习模型,对标注结果进行修正,相比于传统深度学习实体识别模型,有效提高了准确率。
-
公开(公告)号:CN116740000A
公开(公告)日:2023-09-12
申请号:CN202310609181.7
申请日:2023-05-26
Applicant: 上海市同济医院 , 万达信息股份有限公司
Abstract: 本发明为一种基于大脑医学影像的AD特征信息分析方法,通过对需分析的脑部MRI影像进行数据预处理,以获得各脑区标准影像;全脑及关键脑区空间特征分析;全脑影像特征分析;全脑及关键脑区认知特征分析;聚合分析结果,以形成相应的解释数据。本发明还公开了一种基于大脑医学影像的AD特征信息分析系统。使用深度学习技术从脑部MRI图像中分析出脑龄、逻辑记忆评分、视觉记忆评分、长时延迟记忆评分等认知指标特征的方法,可为医生提供脑部MRI图像的分析结果以及其他重要医学指标,也为其后续的科研分析及判读提供了有效的论据及解释。
-
公开(公告)号:CN109918672B
公开(公告)日:2023-06-02
申请号:CN201910188140.9
申请日:2019-03-13
Applicant: 东华大学 , 万达信息股份有限公司
Abstract: 本发明涉及一种依照词性词典和依存关系树建立的树形结构化模板,并且参照此模板进行甲状腺超声报告的结构化的方法。总体流程主要包括词性词典建立模块、树形结构模板建立模块、树形模板调用进行结构化三个阶段。词性词典建立模块:对报告进行短句切分,进行短句聚类。然后使用命名实体识别技术,根据器官词ORG、位置词LOC、属性词ATT、属性名,建立完成词性词典。树形模板建立模块:使用依存句法分析得到每个短句的语义关系,使用词性词典得到每个词的词性。结合二者提出一个树形模板建立的流程。树形模板调用模块:使用树形模板进行文本结构化。
-
公开(公告)号:CN110189802B
公开(公告)日:2023-05-02
申请号:CN201910349116.9
申请日:2019-04-28
Applicant: 万达信息股份有限公司
Abstract: 本发明涉及一种基于指标存储模型的双向映射队列研究信息系统。本发明采用无结构的数据存储方式,为数据采集中指标建立指标模型和指标库,提供一套可供用户修改的基本采集模板,根据用户需求提供对应的分析数据,对于同一指标可提供具有时序性的数据序列,系统可直接对用户数据建模进行分析,无需管理员部署数据库,简化操作、节省人力物力,最大化保证了所需即所得。
-
-
-
-
-
-
-
-
-