基于机器学习可解释性的人体指标-脑卒中关系分析系统

    公开(公告)号:CN112447292B

    公开(公告)日:2022-03-25

    申请号:CN202011336107.5

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于机器学习可解释性的人体指标‑脑卒中关系分析系统,包括数据输入模块、数据预处理模块、机器学习模块、相关性分析模块、指标近邻寻找模块、新样本制造模块、新样本预测统计模块,通过对属性进行相关性分析,当一个属性改变时,与它相关的属性也随之改变,使生成的新样本更接近实际情况,由此来研究脑卒中患病情况与人体指标变化的关系,本发明可以得到身体指标变化对是否患脑卒中的影响,对进一步研究疾病的预防有着重要的作用。

    基于机器学习可解释性的人体指标-脑卒中关系分析系统

    公开(公告)号:CN112447292A

    公开(公告)日:2021-03-05

    申请号:CN202011336107.5

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于机器学习可解释性的人体指标‑脑卒中关系分析系统,包括数据输入模块、数据预处理模块、机器学习模块、相关性分析模块、指标近邻寻找模块、新样本制造模块、新样本预测统计模块,通过对属性进行相关性分析,当一个属性改变时,与它相关的属性也随之改变,使生成的新样本更接近实际情况,由此来研究脑卒中患病情况与人体指标变化的关系,本发明可以得到身体指标变化对是否患脑卒中的影响,对进一步研究疾病的预防有着重要的作用。

    一种基于tf-idf和倒排索引的众测助理实现方法

    公开(公告)号:CN113360596A

    公开(公告)日:2021-09-07

    申请号:CN202110634912.4

    申请日:2021-06-08

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于tf‑idf和倒排索引的众测助理实现方法。数据采集阶段,从百度问答中爬取问答数据集,在爬取过程中进行筛选;数据预处理阶段,对每一个问题进行分词,并计算每一个词的频率,获得每个句子的tf‑idf向量表示;输入预处理阶段,对用户的输入进行分词,若涉及到不合适的词,如敏感词,政治词,则不予返回,将用户的输入去除停用词后转化为tf‑idf向量表示;答案返回阶段,利用倒排索引获得与输入相关的候选问题,计算输入与候选问题的相似度,并将相似度最高的k个问题的答案返回给用户作为结果。本发明利用倒排索引的思想加快了查找相似问题的效率,能应对问答对增加带来的内存爆炸问题。

Patent Agency Ranking