一种从文本中挖掘和定位个人能力的方法

    公开(公告)号:CN110263341B

    公开(公告)日:2023-06-20

    申请号:CN201910538161.9

    申请日:2019-06-20

    Abstract: 本发明公开了一种从文本中挖掘和定位个人能力的方法,该方法包括步骤:将文档数据和邮件数据入数据库;采用数据库生成人名词库以及系统词库文件;根据生成的人名词库以及系统词库分词并去掉停用词;提取出所有谓词并生词谓词文件;利用谓词文件人工标注出能力词并形成能力词库文件;利用能力词文件、人名词库和系统词库分词并去掉停用词,根据正则和规则判断能力、人名之间是不是并列的关系,若是,生成能力和人员对应关系,否,则根据距离计算最近的,然后将生成对应人员能力并存入数据库。本发明能自动从对应能力查找人员,进而大幅度提高了办公效率。

    一种日程信息中抽取实体的方法

    公开(公告)号:CN110245354A

    公开(公告)日:2019-09-17

    申请号:CN201910539137.7

    申请日:2019-06-20

    Abstract: 本发明公开了一种日程信息中抽取实体的方法,该方法包括步骤:对已知数据信息进行自扩展学习,寻找未知信息与已知信息之间的链接点;提取数据进行句子切分成单句、分词和词性标注,选择几个事件的抽取模式作为种子模式,构建抽取模式库:在每次迭代过程中把新生成的抽取模式追加到抽取模式库;用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;若抽取模式库中,不能进行模式匹配,则将关键词会自动添加到抽取模式库中。本发明把企业大量数据分成单句和词性标注进行提取,通过初始化种子模式的方式,自扩展的构建抽取模式库,做到自动模式匹配,匹配灵活性高,效率高,使人为纠错减少,节省企业正本,节省时间。

    一种用户行为的微服务智能管理方法

    公开(公告)号:CN109325172A

    公开(公告)日:2019-02-12

    申请号:CN201810916186.3

    申请日:2018-08-13

    Abstract: 本发明公开了一种用户行为的微服务智能管理方法,利用网站、app或微信公众号本身自带的操作日志记录功能,采集用户使用电网网站、app或微信公众号的操作信息,结合电网存储的用户联系方式、用户用电区域、具体位置信息、电网设备运行信息及故障信息,并采集实时外部环境信息;将信息进行预先进行分类和关联,再采集到所有信息后,根据分类和关联关系,自动向用户的终端发送符合关联关系的信息,达到优化微服务,推广微服务,并分发微服务的目的。

    一种基于海量文本的新词发现方法

    公开(公告)号:CN110222157A

    公开(公告)日:2019-09-10

    申请号:CN201910538149.8

    申请日:2019-06-20

    Abstract: 本发明公开了一种基于海量文本的新词发现方法,该方法包括步骤:(1)计算每个词内部凝固程度:计算成词概率;(2)计算每个词内部自由运用程度,计算成词的左邻/右舍字的信息熵;(3)抽离词语:把文本中出现过的所有长度不超过d的子串都当作潜在的词,即候选词;(4)发现新词:若是第一次运行,那么所有的词都是新词,若已有一个基本词库,用目前发现的新词与旧词对比,就能够发现新词。本发明通过对海量文本数据,不依赖于任何已有的词库,仅仅根据词的共同特征,将一段大规模语料中可能成词的文本片段全部提取出来,不管它是新词还是旧词,适用于任何领域。然后,再把所有抽出来的词和已有词库进行比较,从而找出新词。

    一种从文本中挖掘和定位个人能力的方法

    公开(公告)号:CN110263341A

    公开(公告)日:2019-09-20

    申请号:CN201910538161.9

    申请日:2019-06-20

    Abstract: 本发明公开了一种从文本中挖掘和定位个人能力的方法,该方法包括步骤:将文档数据和邮件数据入数据库;采用数据库生成人名词库以及系统词库文件;根据生成的人名词库以及系统词库分词并去掉停用词;提取出所有谓词并生词谓词文件;利用谓词文件人工标注出能力词并形成能力词库文件;利用能力词文件、人名词库和系统词库分词并去掉停用词,根据正则和规则判断能力、人名之间是不是并列的关系,若是,生成能力和人员对应关系,否,则根据距离计算最近的,然后将生成对应人员能力并存入数据库。本发明能自动从对应能力查找人员,进而大幅度提高了办公效率。

    一种基于海量文本数据的人事关系知识图谱构建方法

    公开(公告)号:CN110245244A

    公开(公告)日:2019-09-17

    申请号:CN201910539129.2

    申请日:2019-06-20

    Abstract: 本发明公开了一种基于海量文本数据的人事关系知识图谱构建方法,该方法包括步骤:解析海量word数据,提取所需文本内容;挖掘事件、人、部门及时间实体;计算实体距离,判断实体关系;数据插入Neo4j构建知识图谱。本发明通过挖掘海量数据,得到人名实体、部门实体、事件实体和时间实体,通过计算实体之间的距离判断事件实体的所属是人还是部门,及时间,最后将发现的关系数据插入Neo4j数据库,构建知识图谱,通过数据库构建的知识图谱,可以发现人与事的关系,人与人的关系。

Patent Agency Ranking