一种文字信息地域识别方法及装置

    公开(公告)号:CN102426603A

    公开(公告)日:2012-04-25

    申请号:CN201110356631.3

    申请日:2011-11-11

    Abstract: 本发明涉及一种文字信息地域识别方法及装置,其中识别方法包括步骤:A、获取待进行地域分析的文字信息,构建词向量序列;B、进行地域分层分析,得出地域分层路径;C、进行地域扩展分析,进一步得出相关的地域特征词;D、根据地域分层路径和由地域扩展分析得出的地域特征词,得到最优地域分层路径;E、构建第一主题词向量空间和第二主题词向量空间;F、对第一主题词向量空间和第二主题词向量空间进行相似度计算,根据最优地域分层路径和相似度计算结果判断文字信息所属地域。本发明实现了对信息内容所属地域进行了准确判断,这样不但判断更加准确,地域层次分明详细,还能排除与信息主题无关的地域特征词信息。

    一种违规音视频节目取证方法和装置

    公开(公告)号:CN105630462B

    公开(公告)日:2018-10-02

    申请号:CN201410584315.5

    申请日:2014-10-27

    Abstract: 本发明公开了一种违规音视频节目取证方法和装置,用于解决现有的网络音视频监管系统中取证操作依赖于现有的独立的取证工具,功能集成度低,操作繁琐的技术问题。方法包括:S11、在接收到启动指令时,提供取证操作界面;S12、当接收到触发指令时,获取待取证网页的视窗的静态图像并存储于本地的特定文件夹;S13、当接收到触发指令时,录制待取证网页的视窗显示的内容以生成录屏文件并存储于本地的特定文件夹;S14、当接收到触发指令时,获取待取证网页的快照信息并存储于本地的特定文件夹;S15、当接收到触发指令时,下载待取证网页的音视频内容流并存储于本地的特定文件夹。兼容性强,整个操作过程简单易行。

    一种甄别音视频网站的方法及系统

    公开(公告)号:CN105635038B

    公开(公告)日:2018-08-21

    申请号:CN201410584314.0

    申请日:2014-10-27

    Abstract: 本发明提供了一种甄别音视频网站的方法,基于中心系统和多个与所述中心系统通信的地域系统,该方法包括以下步骤:S1、中心系统通过爬虫采集域名信息;S2、对所述域名信息通过AC自动机对疑似音视频网站的域名进行标记;S3、接收地域系统请求,同步项目所属地域的域名信息给所述地域系统;S4、所述地域系统将接收到的疑似音视频网站放到爬虫采集,根据爬虫的采集情况,判断域名是否为音视频网站。本发明还提供了对应的甄别音视频网站的系统。本发明能自动、快速甄别音视频网站,及提供了高效、便捷的域名信息统一维护方法。

Patent Agency Ranking