-
公开(公告)号:CN116089689A
公开(公告)日:2023-05-09
申请号:CN202211604366.0
申请日:2022-12-13
Applicant: 上海市研发公共服务平台管理中心
IPC: G06F16/953 , G06F40/242 , G06F18/22 , G06F16/215
Abstract: 本发明的人名规范化与语言预测方法、系统及终端,通过采集多国姓名与频次分布,构建了多国语系的姓名字典表并归一化频次,有效、科学地为后续姓名语言预测提供参考范本,避免人工处理时的经验主义;实现姓名数据预处理、标准化过程的半自动化,大幅节省了人工预处理的成本,通过输入自定义预处理配置文件,可适用于不同语系姓名的标准化处理需求。实现了待匹配姓名数据与姓名字典表的匹配,进而对待匹配姓名可能所属的国家语言及概率进行预测,很大程度上能判别人才的国别信息;通过标准化姓名,可将同一人才的不同姓名表达方式进行统一,并利用预测后的国别信息,可用于解决同名学者消歧、人才流动分析等研究工作。