基于文本挖掘的科技项目立项查重方法、系统及设备

    公开(公告)号:CN117520509A

    公开(公告)日:2024-02-06

    申请号:CN202311551773.4

    申请日:2023-11-21

    摘要: 一种基于文本挖掘的科技项目立项查重方法、系统及设备,首先收集并处理待检测项目与历史项目的文本数据,建立文本数据库,并构建自定义词典与自定义停用词库,提取关键词并建立多层级关键词模型,计算相似度与权重,以确认相关项目并定位查重目标层级及其对应的项目指标;本设计在应用中,通过考虑不同项目类型与研究领域对项目立项的偏好影响,建立多维关联,并构建多层级关键词模型,有助于多方位、全面的评估项目,并且通过对立项过程中的可研报告的内容进行深入比对和分析,实现定位查重,确保了查重效率的准确性,同时提高了查重过程的效率。因此,本设计不仅效率较高,而且准确性较高。