-
公开(公告)号:CN117077632B
公开(公告)日:2024-01-09
申请号:CN202311345180.2
申请日:2023-10-18
申请人: 北京国科众安科技有限公司
IPC分类号: G06F40/166 , G06F18/23 , G06F40/284 , G06F16/23 , G06F40/216
摘要: 本发明提供了一种用于资讯主题的自动生成方法,属于智能生成技术领域,其方法包括:对预置新闻资讯进行时效性分析及聚类处理,并抽取每个聚类结果中的关键词;将每个聚类结果中抽取的关键词进行语义度排序以及正式度判断,根据排序结果与判断结果筛选每个聚类结果中的主题词集,并构建主题词库;收集实时新闻资讯,并判断所述实时新闻资讯的产生时长是否大于预设时长,若是,对所述实时新闻资讯进行资讯解析,获取得到新词汇对所述主题词库进行更新,否则,根据未更新的主题词库对所述实时新闻资讯进行主题规划,自动生成所述实时新闻资讯的实时主题,实现在新闻资讯的信息时效内准确高效的生成对应新闻资讯的主题。
-
公开(公告)号:CN117850924A
公开(公告)日:2024-04-09
申请号:CN202410264809.9
申请日:2024-03-08
申请人: 北京国科众安科技有限公司
IPC分类号: G06F9/448 , G06F40/205 , G06F40/35 , G06F16/332 , G06F16/33
摘要: 本发明公开了基于大模型的问答会话数据调用处理方法、设备和介质。本发明方法包括获取数据源的预定义;判断回答问题是否需要调用数据源的数据;如果需要,则提示大模型根据数据源的预定义生成工作流,然后按照工作流完成数据调用处理,最后生成答案。本发明的方法利用大模型实现了对组织私有数据的整合和利用,能够对私有数据的全面理解和学习,实现了高效、智能、精准和自动化的数据分析与回答生成,显著提升了组织私有数据库数据的可用性和访问性,同时也大幅降低了对专业人员依赖,减少了人力物力成本,提高了数据应用的时效性和准确性,能为组织提供及时、准确的决策支持。
-
公开(公告)号:CN117076963B
公开(公告)日:2024-01-02
申请号:CN202311337284.9
申请日:2023-10-17
申请人: 北京国科众安科技有限公司
IPC分类号: G06F18/23 , G06F40/284 , G06F40/44 , G06F18/241 , G06F40/30 , G06F17/16
摘要: 本发明提供了一种基于大数据平台的资讯热度分析方法,涉及自然语言处理技术领域,包括分析采用聚类算法对多个目标领域预设时间周期内获取的资讯进行聚类得到的第一聚类结果,生成第一热词集合;计算所述第一聚类结果中的每篇资讯与对应第一热词集合的语义度;获取所述第一聚类结果中每篇资讯的发布时间以及用户行文数据,再结合语义度计算得到资讯热度。通过采用聚类算法将多个领域资讯进行聚类后,生成对应的热词集合;通过热词集合计算该类中每篇资讯与此相关的语义度,再将语义度与多维度数据综合计算得到热度,有效实现改变传统人工获取方式的同时,依据大量新闻资讯快速自动计算资讯热度值,从而在多领域资讯分析中发挥了重要作用。
-
公开(公告)号:CN117077632A
公开(公告)日:2023-11-17
申请号:CN202311345180.2
申请日:2023-10-18
申请人: 北京国科众安科技有限公司
IPC分类号: G06F40/166 , G06F18/23 , G06F40/284 , G06F16/23 , G06F40/216
摘要: 本发明提供了一种用于资讯主题的自动生成方法,属于智能生成技术领域,其方法包括:对预置新闻资讯进行时效性分析及聚类处理,并抽取每个聚类结果中的关键词;将每个聚类结果中抽取的关键词进行语义度排序以及正式度判断,根据排序结果与判断结果筛选每个聚类结果中的主题词集,并构建主题词库;收集实时新闻资讯,并判断所述实时新闻资讯的产生时长是否大于预设时长,若是,对所述实时新闻资讯进行资讯解析,获取得到新词汇对所述主题词库进行更新,否则,根据未更新的主题词库对所述实时新闻资讯进行主题规划,自动生成所述实时新闻资讯的实时主题,实现在新闻资讯的信息时效内准确高效的生成对应新闻资讯的主题。
-
公开(公告)号:CN117850924B
公开(公告)日:2024-05-14
申请号:CN202410264809.9
申请日:2024-03-08
申请人: 北京国科众安科技有限公司
IPC分类号: G06F9/448 , G06F40/205 , G06F40/35 , G06F16/332 , G06F16/33
摘要: 本发明公开了基于大模型的问答会话数据调用处理方法、设备和介质。本发明方法包括获取数据源的预定义;判断回答问题是否需要调用数据源的数据;如果需要,则提示大模型根据数据源的预定义生成工作流,然后按照工作流完成数据调用处理,最后生成答案。本发明的方法利用大模型实现了对组织私有数据的整合和利用,能够对私有数据的全面理解和学习,实现了高效、智能、精准和自动化的数据分析与回答生成,显著提升了组织私有数据库数据的可用性和访问性,同时也大幅降低了对专业人员依赖,减少了人力物力成本,提高了数据应用的时效性和准确性,能为组织提供及时、准确的决策支持。
-
公开(公告)号:CN117573959B
公开(公告)日:2024-04-05
申请号:CN202311344752.5
申请日:2023-10-17
申请人: 北京国科众安科技有限公司
IPC分类号: G06F16/951 , G06F18/232 , G06N5/04 , G06F40/20 , G06F16/958
摘要: 本发明提供了一种基于网页xpath获取新闻正文的通用方法,属于自然语言处理技术领域,其方法包括:通过Scrapy爬虫框架工具获取新闻网站的xpath;用k‑means相似度聚类分组算法,将网页中的xpath进行分组,得到n组xpath;通过n组xpath中每组xpath反向推出每个xpath所对应内容;获取每组xpath总内容文本大小,筛选出文本最大的组;将所述文本最大的组作为xpath正文部分入库,实现对网页新闻正文内容的爬取。解决了新类型的网站也需要通过维护规则库的方式达到获取正文的目的,人工投入量较大,维护成本较高的问题。
-
公开(公告)号:CN117076963A
公开(公告)日:2023-11-17
申请号:CN202311337284.9
申请日:2023-10-17
申请人: 北京国科众安科技有限公司
IPC分类号: G06F18/23 , G06F40/284 , G06F40/44 , G06F18/241 , G06F40/30 , G06F17/16
摘要: 本发明提供了一种基于大数据平台的资讯热度分析方法,涉及自然语言处理技术领域,包括分析采用聚类算法对多个目标领域预设时间周期内获取的资讯进行聚类得到的第一聚类结果,生成第一热词集合;计算所述第一聚类结果中的每篇资讯与对应第一热词集合的语义度;获取所述第一聚类结果中每篇资讯的发布时间以及用户行文数据,再结合语义度计算得到资讯热度。通过采用聚类算法将多个领域资讯进行聚类后,生成对应的热词集合;通过热词集合计算该类中每篇资讯与此相关的语义度,再将语义度与多维度数据综合计算得到热度,有效实现改变传统人工获取方式的同时,依据大量新闻资讯快速自动计算资讯热度值,从而在多领域资讯分析中发挥了重要作用。
-
-
-
-
-
-