-
公开(公告)号:CN113033210A
公开(公告)日:2021-06-25
申请号:CN202110596995.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06F40/242 , G06F40/216 , G06K9/62 , G16H70/40
Abstract: 本发明公开了一种基于社交媒体数据分析的药物潜在副作用挖掘方法,所述方法包括:获取社交媒体的药物评论数据并对所述药物评论数据进行数据预处理,得到药物评论预处理数据,再基于经过训练的BERT语言模型识别所述药物评论预处理数据的药物副作用实体;基于排序的实体标准化方式将所述药物副作用实体映射到标准副作用概念词典,得到初始药物副作用概念;根据所述初始药物副作用概念和官方报告药物副作用概念,得到潜在药物副作用概念。本发明实施例通过上述方法通过对广大民众最真实的用药体验进行分析,可以得到药物更加全面的潜在副作用信息。