-
公开(公告)号:CN112989798B
公开(公告)日:2024-02-13
申请号:CN202110310939.8
申请日:2021-03-23
Applicant: 中南大学
IPC: G06F40/211 , G06F40/284 , G06F40/289
Abstract: 本发明公开了一种中文词库的构建方法、中文词库及应用,方法包括:S1.1.对语料集进行预处理,将语料集中的每个句子划分为分句词,基于多叉树方法由所述分句词生成精简词词库;S1.2.计算所述精简词词库中词的完整性概率,构建细分领域精简词词库,所述细分领域精简词词库中的词为所述完整性概率小于预设阈值的词;S1.3.对于每个句子的分句词,以所述细分领域精简词词库中的词作为分界线,将所述分句词进行分割,以分割后得到词生成细分领域模式匹配词库。具有词库构建方便、高效,特征提取可靠等优点。
-
公开(公告)号:CN112989798A
公开(公告)日:2021-06-18
申请号:CN202110310939.8
申请日:2021-03-23
Applicant: 中南大学
IPC: G06F40/211 , G06F40/284 , G06F40/289
Abstract: 本发明公开了一种中文词库的构建方法、中文词库及应用,方法包括:S1.1.对语料集进行预处理,将语料集中的每个句子划分为分句词,基于多叉树方法由所述分句词生成精简词词库;S1.2.计算所述精简词词库中词的完整性概率,构建细分领域精简词词库,所述细分领域精简词词库中的词为所述完整性概率小于预设阈值的词;S1.3.对于每个句子的分句词,以所述细分领域精简词词库中的词作为分界线,将所述分句词进行分割,以分割后得到词生成细分领域模式匹配词库。具有词库构建方便、高效,特征提取可靠等优点。
-
公开(公告)号:CN110957041A
公开(公告)日:2020-04-03
申请号:CN201911275353.1
申请日:2019-12-12
Applicant: 中南大学
IPC: G16H50/50
Abstract: 本发明公开了一种性别识别系统构建方法、系统及识别方法,性别识别系统构建方法包括如下步骤:根据待识别年龄段,采集构建训练样本集,所述训练样本集中的训练样本包括年龄、性别和医学检查项目指标;根据预设的区间个数将所述待识别年龄段划分为年龄子区间,并将所述训练样本集按照年龄划分为与所述年龄子区间对应的训练样本子集;为每个所述年龄子区间分别构建性别识别智能算法模型;对每个所述性别识别智能模型,选择所述训练样本集中的训练样本,以所述医学检查项目指标值为特征,以性别标签,对所述性别识别智能模型进行训练,得到性别识别系统。具有识别效率高,识别准确性好等优点。
-
-