一种基于语义挖掘的技术路线图构建方法及系统

    公开(公告)号:CN115730080A

    公开(公告)日:2023-03-03

    申请号:CN202211392156.X

    申请日:2022-11-08

    Abstract: 本申请属于技术路线图构建技术领域,公开了一种基于语义挖掘的技术路线图构建方法及系统。通过获取文本数据,确认所述文本数据的摘要文本,利用Textrank算法对所述摘要文本进行关键句提取,得到所述摘要文本的关键句;将所述摘要文本的关键句输入到Bert模型中进行向量化表达,将所述向量化表达进行加权融合,得到所述关键句的向量表示;将所述关键句的向量表示输入到文档主题生成模型中提取所述向量表示的聚类主题;计算所述聚类主题的语义相似度,并根据所述语义相似度绘制技术路线图。实现提高构建技术路线图的准确性。

    一种基于文本挖掘的课程设置分析方法

    公开(公告)号:CN112861530A

    公开(公告)日:2021-05-28

    申请号:CN202110287512.0

    申请日:2021-03-17

    Abstract: 本发明公开了一种基于文本挖掘的课程设置分析方法,该方法包括:根据确定的数据搜索关键词,从选定的招聘网站中采集研究专业的招聘要求数据和非研究专业的招聘要求数据;对采集的招聘要求数据进行预处理操作;提取招聘要求数据中的知识点,并构建知识词库;对知识词库中的知识点进行聚类分析,并将分类后的知识点归类到课程,获得就业市场对该专业的课程需求。本发明利用文本挖掘技术获取就业市场对人才的知识要求,通过课程归类得到课程需求,无需大量耗费时间和人力进行调研就能快速获得合理的课程设置建议,能在各个专业领域进行快速应用推广,为高校课程设置的优化和改进提供决策支持。

    一种基于TRIZ的中文专利语料库半自动构建方法

    公开(公告)号:CN112487192A

    公开(公告)日:2021-03-12

    申请号:CN202011487942.9

    申请日:2020-12-16

    Abstract: 本发明提出一种基于TRIZ的中文专利语料库半自动构建方法,是对40个TRIZ发明原理进行重组,使重新分组的发明原理类别之间存在较大的歧义,类内的歧义就相对较小,进一步提升语料库的质量。专利文本包含很多低频的领域术语,利用一般的中文分词将破坏完整的术语,本法能采集到较为完整的术语关键词,为专利语义分析提供良好的基础。关键词所能提供的语义信息有限,本法还对句子进行依存句法解析,获取更充分的语义信息让机器识别更准确,还有助于非领域专业人员对句子的理解进而更好地完成少量的标注工作。本法基于表示学习方法抽取专利文本的句子、依存特征,捕获更深层次、更为抽象的专利语义表示,将能抽取到最具判别性的特征从而有助于文本的聚类。

Patent Agency Ranking