基于新闻客户端的突发事件预警信息分析系统及其方法

    公开(公告)号:CN116882401A

    公开(公告)日:2023-10-13

    申请号:CN202310510969.2

    申请日:2023-05-08

    Abstract: 本发明提供了一种基于新闻客户端的突发事件预警信息分析系统,包括:数据处理模块,其对原始文章数据进行格式化预处理;自定义标签模块,其用于获取突发预警标签;文本分析模块,其对格式化文本数据进行分析,提取出时间、地点、人物、机构和自定义的预警信息;图片分析模块,其对格式化图片数据进行分析,对特征目标区域的字符进行分割和分类;评论情绪分析模块,其用于对格式化评论数据进行分析,获得原始文章数据的情绪类型。本发明还提供了一种基于新闻客户端的突发事件预警信息分析方法。本发明能够快速分析新闻文章信息中时间、地点、人物、机构和主题信息,以及能够从文本正文、正文中图片和评论正负面情绪三个维度进行全方位识别分析。

    一种恶意加密流量检测方法
    54.
    发明公开

    公开(公告)号:CN116708003A

    公开(公告)日:2023-09-05

    申请号:CN202310863918.8

    申请日:2023-07-14

    Abstract: 本发明属于网络安全技术领域,具体是一种恶意加密流量检测方法。包括:S1:采集加密流量数据;S2:对采集的加密流量数据进行处理,将加密流量数据转换为统一尺度;S3:计算加密流量数据信息熵,并将信息熵作为加密流量的一种特征向量;S4:将特征向量作为新的数据集,并将数据集分为训练集、测试集以及验证集;S5:利用训练集、测试集以及验证集分别对神经网络模型进行训练、测试以及验证,将训练好的神经网络模型用于对异常流量进行检测。本发明提出的模型进行二分类或多分类多维数据检测时检测指标和稳定性方面综合性能较好,可避免人为选择参数对预测结果带的不利影响,对开展恶意加密流量网安全检测具有重要意义。

    一种基于多粒度融合与Bert筛选的中文文本自动校对方法

    公开(公告)号:CN113221542A

    公开(公告)日:2021-08-06

    申请号:CN202110348599.8

    申请日:2021-03-31

    Abstract: 本发明涉及一种基于多粒度融合与Bert筛选的中文文本自动校对方法,属于自然语言处理技术领域;本发明通过结合字粒度与词粒度级别的校对模型,以期能够利用不同粒度级别的信息。字粒度模型采用集成规则生成候选集与Bert筛选的方法,词粒度采用传统方法,先构建候选集,然后使用N‑Gram模型计算句子困惑度取最佳候选。另外该方法还解决了多字少字等错误类型问题。实验结果验证了该方法能有效提高检错纠错的召回率,有效提升校对模型性能。对比现有技术,本发明规避了字粒度校对模型和词粒度校对模型带来的局限性,基于多粒度融合与Bert筛选通过两种粒度有效结合不同层次信息,通过N‑Gram LM打分与Bert进行筛选,能够有效提高错误的召回率和校对的准确率。

    一种不同信息源的房产数据同一性判别方法

    公开(公告)号:CN109977287A

    公开(公告)日:2019-07-05

    申请号:CN201910242011.3

    申请日:2019-03-28

    Abstract: 本发明涉及一种不同信息源的房产数据同一性判别方法,属于互联网数据分析与挖掘技术领域。所述同一性判别方法基于链家、我爱我家、中原、麦田网站公布的房屋数据及其相关性;通过分析房屋数据的特点,通过区域去重、小区去重以及房屋去重的三大步骤剔除重复的房屋数据,所述房屋数据是对实际的房屋客体的特点描述,虽然描述的角度和方式存在差异,但数据之间存在很强的相关性。所述方法能对来源于不同网站的房屋数据去重,能够准确、高效的对来源于不同信息源的房屋数据的同一性判别,并能有效去除重复区域、小区,可以实现面向多源异构的房屋数据的有效融合,为房地产市场分析提供“干净”,“整齐”的数据。

    跨平台的信息溯源方法和装置
    58.
    发明公开

    公开(公告)号:CN119135650A

    公开(公告)日:2024-12-13

    申请号:CN202410712886.6

    申请日:2024-06-04

    Abstract: 本发明公开了一种跨平台的信息溯源方法和装置,包括:在对信息进行溯源时,对涉及信息传播的用户进行跨平台的用户对齐,并在对齐的用户间添加虚拟边;为在多个平台中的用户分配节点标签,然后计算每个节点在节点之间迭代地传播标签信息的标签值;当达到收敛时,停止本次迭代;通过得到的收敛结果,将具有最高标签值的局部峰值作为潜在的信息源节点。本发明针对多个社交平台的信息溯源的难点,提出跨网络用户对齐方法在不同平台之间增加“虚拟边”,使得多平台间可以通过“虚拟边”之间考虑跨平台的信息传播行为。同时,该方法提出基于源显著性理论,在不依赖传播模型的情况下自动识别实际的源节点,摆脱了基于传播模型方法的局限性。

    舆情态势数据智能识别及异常检测方法

    公开(公告)号:CN118780275A

    公开(公告)日:2024-10-15

    申请号:CN202410586391.3

    申请日:2024-05-13

    Abstract: 本发明涉及数据识别与检测领域,尤其涉及一种舆情态势数据智能识别及异常检测方法,包括以下步骤:S1:采用多策略数据抽取方法,处理不同格式的数据源;引入自适应语义映射机制,通过语义深度调节因子SDF动态调整每个词的语义向量vi,使动态语义融合网络捕获更加丰富和准确的语义信息;S2:时间序列异常态势预测器通过融合动态解码模型TSIM,结合时间‑语义交互机制,将文本的语义信息与时间信息进行深度融合,评估舆情态势,预测及判断舆情态势异常,本方法大幅提升数据处理的准确性和工作效率,有利于及时发现并响应舆情异常,准确预测及判断舆情异常态势。

    文本深度语义匹配方法及其匹配装置

    公开(公告)号:CN118503360A

    公开(公告)日:2024-08-16

    申请号:CN202410669746.5

    申请日:2024-05-28

    Abstract: 本发明公开了一种文本深度语义匹配方法,包括:构建词语级别交互信号模型:获取多维度词语交互信号向量矩阵和词向量堆叠矩阵,进行拼接得到词语级别的交互表示向量矩阵;构建句子级别交互信号模型:获取双向句向量余弦距离、双向句向量点积和双向句向量堆叠矩阵,进行拼接得到句子级别的交互表示向量矩阵;将词语级别和句子级别的交互表示向量矩阵进行拼接,得到整合向量矩阵;通过空间循环神经网络、最大池化采样以及多层感知机对整合向量矩阵处理得到两个文本的匹配度。还提供一种文本深度语义匹配装置。该方法能够将文本交互信号和句子表示信息集成,解决现有技术难以同时利用交互信号和句子表示信息,难以兼顾局部性信息和全局性信息的问题。

Patent Agency Ranking