-
公开(公告)号:CN112685204B
公开(公告)日:2024-03-05
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN113496780B
公开(公告)日:2023-11-03
申请号:CN202010197391.6
申请日:2020-03-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: G16H50/80
Abstract: 本发明实施例提供了一种传染病确诊者数量预测方法、装置、服务器及存储介质,该方法包括:确定传染病预测天数、基本传染数、传染病潜伏周期,基于以下步骤进行迭代,直至传染病预测天数归零输出传染病第二累计确诊者数量:获取第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量;基于第一累计痊愈者数量、第一累计确诊者数量、基本传染数、传染病潜伏周期更新预设传染病预测模型中系数;基于第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量、经过更新的传染病预测模型,输出第二易感者数量、第二现存疑似者数量、第二累计确诊者数量、第二累计痊愈者数量;对传染病预测天数进行递减。
-
公开(公告)号:CN119862889A
公开(公告)日:2025-04-22
申请号:CN202411940326.2
申请日:2024-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30
Abstract: 本公开涉及一种基于裁判模型的大语言模型评价方法、装置、设备及介质,该方法包括:将预先获取的测试问题分别输入待评价的多个大语言模型,并获取各个大语言模型的输出结果;将测试问题、各个大语言模型的输出结果以及预设的第一引导指令输入预先建立的裁判模型,得到裁判模型输出的模型评价结果,第一引导指令用于引导裁判模型采用准确性、相关性、创造性、逻辑连贯性和信息完整性等目标评价标准对多个大语言模型的模型性能进行评价,模型评价结果包括性能最优的目标大语言模型的信息的。本公开通过将多个大语言模型针对同一问题的输出结果输入裁判模型,引导裁判模型从多角度对各个大语言模型的输出结果进行评价,能够自动对大语言模型进行全面评价。
-
公开(公告)号:CN119357469A
公开(公告)日:2025-01-24
申请号:CN202411434652.6
申请日:2024-10-15
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/9535 , G06F40/284 , G06F40/216 , G06F18/22
Abstract: 本发明涉及自然语言处理领域,提供一种新闻推荐方法、电子设备和存储介质,包括:获取新闻数据库对应的初始新闻特征;获取新闻数据库对应的用户,并基于用户对应的感兴趣新闻的初始新闻特征获取对应的初始用户特征;基于用户间相似度、用户新闻相似度、新闻间相似度、共现实体词频和用户感兴趣领域,从所述新闻数据库中获取用户潜在感兴趣的候选新闻集;对初始新闻特征进行更新,得到更新新闻特征,以及对初始用户特征进行更新,得到更新用户特征;基于更新用户特征和对应的候选新闻的更新新闻特征获取候选新闻对应的推荐值;将候选新闻集中推荐值大于预设推荐值的候选新闻作为推荐新闻并推荐给对应的用户。本发明能够为用户提供更准确的新闻。
-
公开(公告)号:CN118940826B
公开(公告)日:2024-12-20
申请号:CN202411434591.3
申请日:2024-10-15
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06N5/02
Abstract: 本发明涉及自然语言处理领域,提供一种事件知识图谱构建方法、装置和电子设备,包括:基于源文本数据集构建事件图谱;基于所述事件图谱和开源知识图谱之间的共同实体,对所述事件图谱和所述开源知识图谱进行融合,得到融合了事件图谱和开源知识图谱的事件知识图谱;获取所述事件知识图谱中的节点和有向边的特征向量,得到进行了知识表示的事件知识图谱,作为目标事件知识图谱。本发明通过将事件图谱与知识图谱深度融合得到具有丰富知识表示的事件知识图谱。
-
公开(公告)号:CN118485046B
公开(公告)日:2024-09-17
申请号:CN202410907835.9
申请日:2024-07-08
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/169 , G06F16/35 , G06F18/214 , G06F18/27 , G06F40/35 , G06F16/332
Abstract: 本公开提供了一种标注数据处理方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取初始标注指令数据集,初始标注指令数据集包括标注回复文本数据;基于初始标注指令数据集中的标注回复文本数据,得到筛选标注指令数据集,筛选标注指令数据集中的标注回复文本数据不具有重复内容;基于筛选标注指令数据集,确定内容问题类型;基于内容问题类型以及多种不同类型的大模型,对筛选标注指令数据集进行处理,得到目标标注指令数据集。
-
公开(公告)号:CN113553839B
公开(公告)日:2024-05-10
申请号:CN202010340711.9
申请日:2020-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/194
Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN112685204A
公开(公告)日:2021-04-20
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN112364641B
公开(公告)日:2024-10-22
申请号:CN202011259475.4
申请日:2020-11-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/284 , G06F40/166
Abstract: 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。
-
公开(公告)号:CN118485046A
公开(公告)日:2024-08-13
申请号:CN202410907835.9
申请日:2024-07-08
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/169 , G06F16/35 , G06F18/214 , G06F18/27 , G06F40/35 , G06F16/332
Abstract: 本公开提供了一种标注数据处理方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取初始标注指令数据集,初始标注指令数据集包括标注回复文本数据;基于初始标注指令数据集中的标注回复文本数据,得到筛选标注指令数据集,筛选标注指令数据集中的标注回复文本数据不具有重复内容;基于筛选标注指令数据集,确定内容问题类型;基于内容问题类型以及多种不同类型的大模型,对筛选标注指令数据集进行处理,得到目标标注指令数据集。
-
-
-
-
-
-
-
-
-