-
公开(公告)号:CN106303548B
公开(公告)日:2019-03-19
申请号:CN201510268776.6
申请日:2015-05-22
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: H04N19/625 , H04N19/11 , H04N19/593 , H04N19/176 , H04N19/91
Abstract: 本发明提供一种HEVC帧内预测编码方法,包括:对当前编码单元进行DCT变换,获得当前编码单元的DCT系数;根据DCT系数确定当前编码单元的图像复杂度,根据当前编码单元的块类型确定当前编码单元的划分深度;根据当前编码单元和与当前编码单元相邻的相邻编码单元的图像复杂度比较结果、划分深度比较结果,确定是否对当前编码单元进行划分;若确定不对当前编码单元进行划分,则根据DCT系数确定当前编码单元的纹理方向;根据纹理方向确定当前编码单元的预测模式类型和预测模式偏移度之后,确定当前编码单元的预测主模式,并根据预测主模式对当前编码单元进行编码。可以降低算法的复杂度,减少编码时间。
-
公开(公告)号:CN103853770B
公开(公告)日:2018-08-14
申请号:CN201210511269.7
申请日:2012-12-03
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本申请公开了一种抽取论坛网页中帖子内容的方法及系统,所述方法包括:获得一论坛网页;将所述论坛网页转换成DOM树,其中,所述DOM树至少包括一根节点及从属于所述根节点的至少一个子节点;一一对应地为所述根节点及所述至少一个子节点生成频繁模式;根据所述频繁模式中一符合预设条件的频繁模式,确定出与所述论坛网页中信息内容所对应的节点;基于一预设的公共子树算法,从所述与所述论坛网页中信息内容所对应的节点中提取所述论坛网页中的信息内容。
-
公开(公告)号:CN104572687B
公开(公告)日:2018-07-31
申请号:CN201310488236.X
申请日:2013-10-17
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供种微博传播的关键用户识别方法和装置,在微博传播的网络架构中,按照连接节点个数从少到多的顺序执行多次删除操作,每次删除操作将连接节点个数相同的节点从网络架构中删除直至网络架构中剩余连接节点个数相同的至少个目标节点,最后将目标节点确定为微博传播的关键用户节点。从而提高确定的微博传播的关键用户的准确度。
-
公开(公告)号:CN104572643B
公开(公告)日:2018-06-19
申请号:CN201310470200.9
申请日:2013-10-10
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种搜索方法和搜索引擎,通过接收用户终端发送的用于对网页进行搜索的关键字,利用各从节点的内存中存储的第一索引文件,进行搜索,获得与关键字相匹配的第一匹配网页后,若第一匹配网页的个数少于第一阈值,再利用各节点的磁盘中所存储的第二索引文件,进行搜索,获得与所述关键字相匹配的第二匹配网页,向用户终端发送包含第一匹配网页和第二匹配网页的搜索结果,由于首先利用内存中存储的第一索引文件进行搜索,不需要占用I/O接口,从而避免了由于全部将索引文件存储在磁盘所导致的检索速度下降,提高了检索效率。
-
公开(公告)号:CN103885985B
公开(公告)日:2018-05-18
申请号:CN201210564284.8
申请日:2012-12-24
Applicant: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了微博实时检索方法,包括:对微博空间中的各个微博进行文档扩展以生成文档扩展逻辑式;获取来自用户的关键词;对关键词进行逻辑扩展得到以生成扩展检索逻辑式;以扩展检索逻辑式检索各个文档扩展逻辑式以获得最终检索结果。本发明还提供了一种微博实时检索装置,包括:文档扩展模块,用于对微博空间中的各个微博进行文档扩展以生成文档扩展逻辑式;关键词模块,用于获取来自用户的关键词;检索扩展模块,用于对关键词进行逻辑扩展得到以生成扩展检索逻辑式;匹配模块,用于以扩展检索逻辑式检索各个文档扩展逻辑式以获得最终检索结果。本发明提高了微博检索的准确度。
-
公开(公告)号:CN104572679B
公开(公告)日:2017-11-03
申请号:CN201310485075.9
申请日:2013-10-16
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种舆情数据存储方法和装置,通过利用哈希值算法对接收到的舆情数据进行计算,获得舆情数据的哈希值,根据该舆情数据的哈希值和计算获得的历史舆情数据的哈希值,从舆情数据中筛选出与历史舆情数据不重复的目标舆情数据,从而仅对目标舆情数据进行存储,解决了现有技术中由于将相互重复的舆情数据均保存到数据库中所导致的存储空间利用率低的技术问题。
-
公开(公告)号:CN107291754A
公开(公告)日:2017-10-24
申请号:CN201610204038.X
申请日:2016-04-01
Applicant: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
Abstract: 本发明提供了一种新闻评论的预测方法和新闻评论的预测系统,其中,新闻评论的预测方法包括:确定发布新闻所属的领域;获取预设时间范围内用户对所述领域的新闻的评论记录集合;根据所述发布新闻的关键字,确定所述发布新闻属于所述评论记录集合的评论概率;在所述评论记录集合中,确定用户评论过的新闻数量与新闻总数的评论比例;根据所述评论概率和所述评论比例对所述发布新闻的评论数目进行预测。通过本发明的技术方案,提高了对互联网的舆论热点新闻的宏观预测能力和调控性。
-
公开(公告)号:CN107229654A
公开(公告)日:2017-10-03
申请号:CN201610179206.4
申请日:2016-03-25
Applicant: 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种热搜词获取方法及系统。该热搜词获取方法包括:获取预设时间段内搜索词的第一词频数据和热词的第二词频数据;根据所述第一词频数据获取搜索词的舆情相关度,根据所述第二词频数据获取与所述搜索词对应的热词的舆情相关度;根据搜索词的舆情相关度和所述与搜索词对应的热词的舆情相关度从搜索词中获取热搜词。本发明基于舆情相关度对搜索词和热词进行检测,获取热搜词,与现有技术相比,具有提高热搜词准确性的作用。
-
公开(公告)号:CN107203764A
公开(公告)日:2017-09-26
申请号:CN201610158219.3
申请日:2016-03-18
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
Abstract: 本发明提供一种长微博图片识别方法和装置,该方法包括:获取待识别微博图片;将待识别微博图像转换为灰度图片;对灰度图片进行图像形态学处理,其中,图像形态学处理包括二值化处理、腐蚀和膨胀处理;对所述图像形态学处理后的图片进行文字行识别;当识别出的文字行数大于预设行数阈值时,确定待识别微博图片为长微博图片。基于对待识别微博图片的图像处理,以及有效文字行的识别处理,能够准确而高效地识别出待识别微博图片是否为长微博图片。进而使得基于对长微博图片的识别结果而进行的数据分析更加具有针对性,信息处理冗余度更低,数据分析处理效率更高。
-
公开(公告)号:CN103914494B
公开(公告)日:2017-05-17
申请号:CN201310008156.X
申请日:2013-01-09
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
CPC classification number: G06F17/3053 , G06F17/30598 , G06F21/316
Abstract: 本发明提供一种微博用户身份识别方法及系统,所述方法包括:获取待识别用户行为数据以及用户行为的特征库信息;预处理所述获取的待识别用户行为数据;将所述预处理后的用户行为数据,进行语义单元重构;获取所述语义单元的属性信息以及其对应的权重;根据所述语义单元的属性信息以及其对应的权重,获取所述待识别用户行为特征;将所述待识别用户行为特征与用户行为的特征库信息中的每个特征类型进行比较;当所述待识别用户行为特征与所述用户行为的特征库信息中的一个特征类型的相似度超过预设阈值,则所述待识别用户身份确定。采用本发明提供的微博用户身份识别方法及系统可以有效提高微薄用户身份识别的准确性及实时性。
-
-
-
-
-
-
-
-
-