-
公开(公告)号:CN110888983A
公开(公告)日:2020-03-17
申请号:CN201911171315.1
申请日:2019-11-26
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种正负面情感分析方法、终端设备及存储介质,该方法中包括:S1:构建和维护对应不同行业的行业关键词规则和行业情感词典;S2:判断待分析的文本数据中是否包含行业关键词规则中所包含的关键词,如果包含,进入S3;否则,进入S4;S3:根据关键词所属的行业和行业所对应的行业关键词规则,判断该文本数据所属的所有行业后,根据每个行业对应的行业情感词典计算每个行业的情感得分,进而获得该文本数据的情感正负面分析结果;S4:通过训练后的机器学习模型得到该文本数据的情感正负面分析结果。本发明采用基于行业情感词与机器学习模型融合的情感分析方法,将网络文本分而治之,提高分析效果。
-
公开(公告)号:CN108170680A
公开(公告)日:2018-06-15
申请号:CN201711480960.2
申请日:2017-12-29
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/27
Abstract: 本发明涉及一种基于隐马尔科夫模型关键词识别方法,包括以下步骤:S1、构建隐马尔科夫模型,隐马尔科夫模型包括五个元素:隐含状态S、可观测状态O、初始状态概率矩阵π、隐含状态转移概率矩阵A和观测状态矩阵B;S2、将目标文章通过分词算法拆分成词语+词性的格式后,输入已经构建好的隐马尔科夫模型中,获得可观测状态序列O,然后将可观测状态序列O输入构建好的隐马尔科夫模型,得到模型μ;S3、利用构建好的隐马尔科夫模型μ和得到的观测状态序列O={O1,O2,….OT},通过维特比算法,计算隐藏状态的最大可能值,从而识别每个词是否为关键词。本发明实现较好的通用性,可同时针对较长文章及短小文章提取关键词,识别的准确性高。
-
公开(公告)号:CN106570130A
公开(公告)日:2017-04-19
申请号:CN201610955408.3
申请日:2016-10-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于RDF知识库的文本地域判断方法及其系统,方法包括:构建关于地域信息的RDF知识库,并建立索引;预设地域区划的层级;预设地域相关名词的位置权重;获取文本中的地域相关名词;获取文本中所有地域相关名词各自对应的地域区划集合;分别计算地域区划集合中各地域区划对应一地域相关名词的第一分值;获取所有地域区划集合中各地域区划所对应的地域相关名词集合;将各地域区划的第一分值进行累加,得到地域区划的第二分值;根据第二分值,计算各地域区划为文本属地的概率。本发明在RDF知识库的基础上来实现文本的地域打标,提高方法的召回率,同时保证较高的准确率。
-
公开(公告)号:CN103955547B
公开(公告)日:2017-02-15
申请号:CN201410218382.5
申请日:2014-05-22
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种发现论坛热帖的方法和系统,其中,上述方法包括:对论坛帖子源数据的一般特性进行汇总,获得特征化数据;依据所述特征化数据,将内容相似的帖子聚合成帖子簇;综合考虑预设影响因素计算每一个帖子簇的热度值,将热度值较高的帖子簇作为论坛热帖,所述预设影响因素包括:类簇贴子数、网站权重、发帖者等级、帖子浏览量、回帖数量、回帖者等级、发帖时间、最后回帖时间。采用本发明提供的发现论坛热帖的方法,能够综合考虑贴子标题、帖子正文内容、发帖人等级、发帖时间、浏览量、帖子链接、域名、回帖信息等多种因素的影响,更加有效、客观、准确地发现论坛热帖。
-
公开(公告)号:CN103336847B
公开(公告)日:2016-11-30
申请号:CN201310308455.5
申请日:2013-07-22
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种新闻热点标签的生成方法及系统。该方法包括:提取新闻数据集中的新闻簇,其中,新闻数据集由多个新闻记录组成,一个新闻簇包括至少两个新闻记录;确定提取出的多个新闻簇中的热点新闻簇;提取热点新闻簇中各新闻记录的关键字;生成由一个新闻记录的至少两个关键字组合的组合词,其中,一个新闻记录对应一个或多个组合词;以及根据组合词的热度值生成新闻热点标签。通过本发明,能够提高获取新闻热点标签的准确性。
-
公开(公告)号:CN103647636B
公开(公告)日:2016-08-24
申请号:CN201310748951.2
申请日:2013-12-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种安全访问数据的方法及装置,其中,所述方法包括:对源数据进行加密,将源数据封装为加密数据;将用户访问加密数据使用的数据访问模块封装为加密数据访问接口;在用户访问加密数据时,使用接口加密密钥,通过自定义类加载器加载加密数据访问接口;进而使用数据加密密钥,通过加密数据访问接口获得加密数据。通过本方法可以提供了一种在弱安全环境下对数据安全访问的方法,可以从后端的数据存储到前端的数据访问都给出了一个有效的解决方法;其次,不需要任何加密设备投入,能有效控制成本;第三,用户使用高效、便利、安全,学习成本低,使用简单。
-
公开(公告)号:CN103955547A
公开(公告)日:2014-07-30
申请号:CN201410218382.5
申请日:2014-05-22
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30702
Abstract: 本发明提供了一种发现论坛热帖的方法和系统,其中,上述方法包括:对论坛帖子源数据的一般特性进行汇总,获得特征化数据;依据所述特征化数据,将内容相似的帖子聚合成帖子簇;综合考虑预设影响因素计算每一个帖子簇的热度值,将热度值较高的帖子簇作为论坛热帖,所述预设影响因素包括:类簇贴子数、网站权重、发帖者等级、帖子浏览量、回帖数量、回帖者等级、发帖时间、最后回帖时间。采用本发明提供的发现论坛热帖的方法,能够综合考虑贴子标题、帖子正文内容、发帖人等级、发帖时间、浏览量、帖子链接、域名、回帖信息等多种因素的影响,更加有效、客观、准确地发现论坛热帖。
-
公开(公告)号:CN103647636A
公开(公告)日:2014-03-19
申请号:CN201310748951.2
申请日:2013-12-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种安全访问数据的方法及装置,其中,所述方法包括:对源数据进行加密,将源数据封装为加密数据;将用户访问加密数据使用的数据访问模块封装为加密数据访问接口;在用户访问加密数据时,使用接口加密密钥,通过自定义类加载器加载加密数据访问接口;进而使用数据加密密钥,通过加密数据访问接口获得加密数据。通过本方法可以提供了一种在弱安全环境下对数据安全访问的方法,可以从后端的数据存储到前端的数据访问都给出了一个有效的解决方法;其次,不需要任何加密设备投入,能有效控制成本;第三,用户使用高效、便利、安全,学习成本低,使用简单。
-
公开(公告)号:CN102591948A
公开(公告)日:2012-07-18
申请号:CN201110445475.8
申请日:2011-12-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于用户行为分析的搜索结果改进的方法及其系统,是在用户的初次查询过程中记录用户对初次搜索结果的搜索行为,而在再次查询过程中,先不将获取的再次搜索结果提供给用户,而是首先判断前后两次查询是否为相同主题,当判断为不是相同主题时则将再次查询过程获取的再次搜索结果提供给用户,当判断为是相同主题时则根据用户的搜索行为,对再次搜索结果进行处理并重新排序,并将处理和重新排序后的搜索结果提供给用户。该方法及其系统,通过对用户的搜索行为进行分析处理,判断用户相邻的两次搜索之间的关联性,进而导出主题相关性高的搜索结果,达到节省人力、提高搜索结果相关性进而提升用户的搜索体验的目的。
-
公开(公告)号:CN101826085B
公开(公告)日:2012-01-18
申请号:CN200910113121.6
申请日:2009-12-30
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于AJAX的网页在线导入/导出大文件的方法,是采用AJAX技术和DHTML,使得页面可以局部刷新,同时采用了循环多次发送短请求的方式,以能够有效减轻服务器在处理访问大文件以及插入数据库的负担和查询数据库导出大量的数据时的负担,解决了现有技术中大文件通过网页倒入数据库和大量数据通过网页从数据库导出时的超时问题,并避免了现有技术中后台写个导入的应用程序或服务,必须要有能在服务器上安装应用程序的权限的局限性,达到了能够很好地改善网页在线导入大文件的不足和改善网页在线导出大文件的不足的目的。
-
-
-
-
-
-
-
-
-