-
公开(公告)号:CN110888983B
公开(公告)日:2022-07-15
申请号:CN201911171315.1
申请日:2019-11-26
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种正负面情感分析方法、终端设备及存储介质,该方法中包括:S1:构建和维护对应不同行业的行业关键词规则和行业情感词典;S2:判断待分析的文本数据中是否包含行业关键词规则中所包含的关键词,如果包含,进入S3;否则,进入S4;S3:根据关键词所属的行业和行业所对应的行业关键词规则,判断该文本数据所属的所有行业后,根据每个行业对应的行业情感词典计算每个行业的情感得分,进而获得该文本数据的情感正负面分析结果;S4:通过训练后的机器学习模型得到该文本数据的情感正负面分析结果。本发明采用基于行业情感词与机器学习模型融合的情感分析方法,将网络文本分而治之,提高分析效果。
-
公开(公告)号:CN111026868A
公开(公告)日:2020-04-17
申请号:CN201911230765.3
申请日:2019-12-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种多维度舆情危机预测方法、终端设备及存储介质,在该方法中包括:S1:采集一定时间内的舆情文本数据,并根据每个文本数据在不同维度的属性计算其负面情感热度总指数;S2:根据舆情危机知识库中存储的各类型舆情危机事件,通过聚类算法对文本数据进行分类,并计算每个文本数据与其聚类中心的相关度;S3:根据每个文本数据与其聚类中心的相关度和该文本数据的负面情感热度总指数计算每个文本数据的危机程度。本发明通过不同维度的属性计算负面情感热度总指数,并与历史的各类型舆情危机事件进行聚类,得到每个文本数据的危机程度,实现对重大负面舆情的预测,可以提高舆情预测的准确性和时效性。
-
公开(公告)号:CN106570130B
公开(公告)日:2019-10-01
申请号:CN201610955408.3
申请日:2016-10-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/332
Abstract: 本发明公开了一种基于RDF知识库的文本地域判断方法及其系统,方法包括:构建关于地域信息的RDF知识库,并建立索引;预设地域区划的层级;预设地域相关名词的位置权重;获取文本中的地域相关名词;获取文本中所有地域相关名词各自对应的地域区划集合;分别计算地域区划集合中各地域区划对应一地域相关名词的第一分值;获取所有地域区划集合中各地域区划所对应的地域相关名词集合;将各地域区划的第一分值进行累加,得到地域区划的第二分值;根据第二分值,计算各地域区划为文本属地的概率。本发明在RDF知识库的基础上来实现文本的地域打标,提高方法的召回率,同时保证较高的准确率。
-
公开(公告)号:CN109815386A
公开(公告)日:2019-05-28
申请号:CN201811577206.5
申请日:2018-12-21
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/953 , G06F16/9535 , G06F17/27
Abstract: 本发明提供了一种基于用户画像的构建方法、装置及存储介质,该方法包括:登记用户的个人信息数据,记录用户的网页浏览记录和收藏的网页记录,对所述用户的搜索网页记录和收藏的网页记录进行处理得到初始兴趣标签,以所述初始兴趣标签为起点关联用户的网页浏览记录,以生成最终兴趣标签,基于用户的所述最终兴趣标签和个人信息数据为该用户构建用户画像。本发明从用户在浏览器的使用记录信息生成初始兴趣标签,然后,通过改进PageRank算法生成所有用户的最终兴趣标签,减少用户无意识浏览对用户兴趣标签的影响,减少广告网页对用户最终兴趣标签产生的不利影响,以及对未知兴趣标签属性的挖掘,使用户兴趣标签更加准确,使得构建的用户画像信息更为准确。
-
公开(公告)号:CN107908780A
公开(公告)日:2018-04-13
申请号:CN201711272600.3
申请日:2017-12-06
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开一种新闻网站的网页判别处理方法、终端设备及存储介质,通过采集当前网页的子网页信息,进而对子网页进行分类,再根据每个分类中子网页链接的标题的平均长度,来筛选出新闻详文页,进而通过当前网页所包含的新闻详文页的个数,判断出新闻版块页,从而将新闻版块页作为采集目标并从筛选出的新闻详闻页里采集提取新闻数据,从而提高新闻数据采集的效率。
-
公开(公告)号:CN103873597B
公开(公告)日:2017-10-10
申请号:CN201410149901.7
申请日:2014-04-15
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种分布式网页下载方法和系统,所述方法包括:网络爬虫向任务调度服务单元发送网页下载请求;所述任务调度服务单元接收并将上述网页下载请求保存至第一消息队列;上网客户端从所述任务调度服务单元的第一消息队列获取一个网页下载请求,下载相应的网页数据,保存至所述任务调度服务单元的第二消息队列;所述任务调度服务单元将所述第二消息队列中的网页数据返回至请求网页下载的相应网络爬虫。本发明基于双消息队列的点对点分布式网页下载方式,可利用分散在各处的可上网机器来抓取网页,准实时响应网页下载请求,可有效的突破网站对并发下载请求的限制。
-
公开(公告)号:CN103873597A
公开(公告)日:2014-06-18
申请号:CN201410149901.7
申请日:2014-04-15
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种分布式网页下载方法和系统,所述方法包括:网络爬虫向任务调度服务单元发送网页下载请求;所述任务调度服务单元接收并将上述网页下载请求保存至第一消息队列;上网客户端从所述任务调度服务单元的第一消息队列获取一个网页下载请求,下载相应的网页数据,保存至所述任务调度服务单元的第二消息队列;所述任务调度服务单元将所述第二消息队列中的网页数据返回至请求网页下载的相应网络爬虫。本发明基于双消息队列的点对点分布式网页下载方式,可利用分散在各处的可上网机器来抓取网页,准实时响应网页下载请求,可有效的突破网站对并发下载请求的限制。
-
公开(公告)号:CN101827115B
公开(公告)日:2012-11-21
申请号:CN200910113112.7
申请日:2009-12-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种全息式企业服务总线,包括第一接入模块、第二接入模块、列表服务管理模块、智能服务寻址模块、集中式权限与安全管理模块和DSA处理模块,该总线形成的系统架构是将服务区分为ESB核心服务,ESB驱动服务,外部接入服务三种,以ESB核心服务作为Holo-ESB的构建基础,ESB驱动服务以ESB核心服务为依托,成为统一服务门面,外部接入服务则将IT应用整合范围延伸至任意服务。这种以智能服务寻址和可插拔服务接入/卸载技术为基础,整合多种类型应用服务,智能指导服务间通讯,集中管理权限与安全,支持多种访问模式,统一服务门面入口的方式;并利用服务“注册”模式,弱化企业应用边界,使得ESB具有可控可管的任意服务接入、任意服务访问的特点。
-
公开(公告)号:CN101908071A
公开(公告)日:2010-12-08
申请号:CN201010250103.5
申请日:2010-08-10
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种提高搜索引擎搜索效率的方法及其系统,包括搜索结果预处理模块、网页url分析模块、网页爬虫模块、网页结构分析模块、网页正文分析模块、分类搜索结果库和分类显示模块;它将搜索引擎的返回结果进行预处理,获取网页url、命中关键字;再对网页url进行分析,并保存到分类搜索结果库中,其中包括对属于网站首页类型的网页进行过滤,对其余的网页进行下载,并根据文字链接比,判断是否属于目录型网页,对非网站首页类型和非目录网页类型的网页进行正文抽取,提取正文字数,并判断正文中是否包含关键字;最后对保存到分类搜索结果库中的分析结果进行分类显示。通过本发明,能够大幅提高用户的搜索效率,减少其劳动强度。
-
公开(公告)号:CN116132146A
公开(公告)日:2023-05-16
申请号:CN202310014346.6
申请日:2023-01-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提出了一种局域网数据安全传输方法,包括:通过预先编写的自动下载软件脚本,从远程数据生产服务器不断下载json数据;根据下载成功的json数据,定时往磁盘Disk生成一份.my文件;通过预先开发的数据迁移软件模块,定时扫描S1生成的文件夹及子文件夹;根据扫描获取到的文件数据,核对无误后迁移到临时目录,并删除源文件;调用文件压缩模块生成压缩包,并将压缩包通过接口上传到MinioDB文件服务器;通过在内网服务器预先编写的定时脚本,调用文件解压模块,将数据储存在临时目录;入库程序根据.ok文件确认数据已完整迁移。通过临时目录及时固化数据,防止增量数据污染,高效传输;通过中转服务器,实现内外部网络的物理隔离,减少DOS攻击和暴力破解。
-
-
-
-
-
-
-
-
-