-
公开(公告)号:CN119807275A
公开(公告)日:2025-04-11
申请号:CN202411850948.6
申请日:2024-12-16
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供一种用于数据要素处理的异构资源集成系统,包括资源单元:融合数据资源、算法资源、模型资源和应用资源,依据资源列表调用对应资源并给出任务结果;资源分类单元:包含若干类典型应用场景下数据资源、算法资源、模型资源和应用资源之间关联关系的关联网络结构;资源推荐单元:依据任务数据和关联网络结构生成资源列表;资源应用单元:接收任务数据并输出任务结果。本发明能够单独且灵活调用不同数据资源、算法资源、模型资源和应用资源,实现各种数据资源与算法资源、模型资源和应用资源之间的松耦合,灵活扩展数据资源和应用场景,实现突发任务时应用场景的快速构建和及时响应。
-
公开(公告)号:CN119782612A
公开(公告)日:2025-04-08
申请号:CN202411850946.7
申请日:2024-12-16
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06F16/335 , G06F16/334 , G06F40/289 , G06F40/30
Abstract: 本发明提供一种基于文本数据的性格预测方法和社交画像生成方法,包括采集用户发表的贴文数据并清洗处理以生成贴文数据,获取用户所有贴文数据以生成用户数据;LDA模型识别用户数据以获取主题数据和与主题对应的关键词数据;MBTI模型基于关键词数据确定与MBTI四个维度之间的映射关系,以确定用户MBTI的四个维度特征,基于四个维度特征预测用户的性格特征。本发明能够依据用户发布文本所包含的主题和关键词预测其性格特征,再依据性格特征生成用户画像。
-
公开(公告)号:CN118964492A
公开(公告)日:2024-11-15
申请号:CN202411228573.X
申请日:2024-09-03
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供一种基于数据模型的跨数据库数据同步方法,包括步骤1,获取并解析同步任务以确定待同步的数据模型和同步信息,解析数据模型和与数据模型关联的若干外键模型以获取数据结构、外键结构、数据模型与外键模型之间的关联顺序;步骤2,获取数据结构、外键结构生成结构文件,获取数据模型与外键模型之间的关联顺序生成顺序文件,获取数据模型和外键模型的数据记录生成内容文件;步骤3,目标数据库接收结构文件并实例化目标数据库表,接收顺序文件和内容文件,依据反向的关联顺序获取数据模型的数据记录,并写入目标数据库表。本发明能够实现外键查找,提高数据的一致性。
-
公开(公告)号:CN119760542A
公开(公告)日:2025-04-04
申请号:CN202411840901.1
申请日:2024-12-13
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F18/2415 , G06F18/214
Abstract: 本发明涉及用户行为预测领域,且公开了一种基于时序分析的用户行为预测方法,包括将用户行为数据按时间切分成固定长度的时间窗口,根据数据的周期性特征进行特征编码,在每个时间窗口内计算统计特征;对少数类别进行过采样或对多数类别进行欠采样,使用数据增强技术生成新的样本;选择时序模型,对用户行为的时间依赖性进行建模,采用不同的时序分析方法捕捉用户行为在时间维度上的变化规律和潜在模式;使用多种评估指标评估模型的预测能力,通过网格搜索进行模型超参数调优,优化模型的性能。本发明具备提高预测准确性的优点。
-
公开(公告)号:CN119443235A
公开(公告)日:2025-02-14
申请号:CN202411512086.6
申请日:2024-10-28
Applicant: 中科天玑数据科技股份有限公司
IPC: G06N5/022 , G06F40/194 , G06F40/30
Abstract: 本发明提供一种基于多智能体协同的信息优化和分析方法,包括采集数据信息;依据处理者智能体的处理提示词识别和处理数据信息,并输出第一处理结果;依据监督者智能体的监督提示词识别和处理第一处理结果,并输出评价信息和建议信息;处理者智能体依据处理提示词、评价信息和建议信息重新识别和处理数据信息,以输出第二处理结果;依据裁判者智能体的识别和处理第一处理结果和第二处理结果,并输出优化值;判断优化值是否超过优化阈值,否,第二处理结果定义为第一处理结果,并运行监督者智能体,是,输出第二处理结果。本发明能够高效准确对互联网潜在重要信息进行关联和汇聚分析,智能发现和分析重要信息。
-
公开(公告)号:CN116932737A
公开(公告)日:2023-10-24
申请号:CN202310919742.3
申请日:2023-07-25
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/335 , G06F40/205 , G06F40/279 , G06F16/35 , G06N5/025
Abstract: 本发明公开了一种基于大数据的人物属性抽取方法,涉及信息抽取技术领域。包括以下步骤:S1、获取关联人物信息文本;S2、关联人物属性抽取识别;S3、关联人物属性分析处理;S4、关联人物行为关联;S5、关联人物属性数据的补充。通过人物属性抽取模型对属性集的增补能够提供更全面、时效性的属性信息,满足不同应用场景和用户需求的个性化要求,促进深层次的人物理解和分析,并改善决策支持和业务效果,通过使用词向量技术获取属性的同义词、相似词可提高属性抽取模型的覆盖率、准确性和灵活性,降低数据稀疏性,并支持跨语言的属性抽取。这使得模型能够更好地适应不同场景和需求,提供更全面、准确的人物属性信息。
-
公开(公告)号:CN116911704A
公开(公告)日:2023-10-20
申请号:CN202310915856.0
申请日:2023-07-25
Applicant: 中科天玑数据科技股份有限公司
IPC: G06Q10/067 , G06Q10/063 , G06Q50/00
Abstract: 本发明涉及媒体数据技术领域,且公开了一种基于社交媒体数据的候选人影响力评估方法,包括以下步骤:S1、面向候选人影响力评估任务,建立社交媒体数据体系;S2、建立基于社交媒体数据的候选人影响力评估模型。本发明通过在评估候选人影响力时,算法不仅考虑其社交网络中的连接关系,还考虑其他多个维度的因素,如用户行为、交互量、内容质量、活跃度等,通过综合考虑这些因素,可以更全面地评估人物的影响力,算法根据候选人的个人属性和动态行为信息进行评估,能够生成针对不同用户的个性化影响力排名结果,即不同用户可看到适合其个人兴趣的高影响力候选人,提供更加精准的候选人影响力计算。
-
公开(公告)号:CN119474931A
公开(公告)日:2025-02-18
申请号:CN202411583245.1
申请日:2024-11-07
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F18/231 , G06F18/21 , G06F18/22 , G06F40/30
Abstract: 本发明提供一种基于多模态融合的认知分析方法,包括输入层,采集社交平台内与用户相关的音频数据、视频数据、图像数据和文本数据并将其向量化以生成向量信息;多维度认知空间层:创建包含若干超平面的TransH模型,一个超平面对应一个认知层面,社交平台内用户的向量信息分别映射至每个超平面,以生成与超平面个数等数量的得分函数;分析聚类层,基于聚类策略确定每个超平面内用户其得分函数之间的相似度,基于相似度对用户进行聚类并输出聚类集合。本发明能够结合多模态信息进行多认知角度分析,高效准确的确定用户的认知情况,以便为用户续针对性投送信息,降低恶意热点的流量扩散的概率。
-
公开(公告)号:CN118646588A
公开(公告)日:2024-09-13
申请号:CN202410908967.3
申请日:2024-07-08
Applicant: 中科天玑数据科技股份有限公司
IPC: H04L9/40
Abstract: 本发明提供一种基于用户行为的爬虫用户识别方法,包括第一次认证用户,访问页面或访问接口设置验证信息,获取设备ID的请求记录,将请求记录异常的设备ID标记为爬虫;第二次认证用户,设置埋点信息获取设备ID或IP地址的行为日志,进而获取设备ID或IP地址在每个埋点处的行为模式,将行为模式异常的设备ID或IP地址标记为爬虫;应对措施,判断特征库内设备ID或IP地址是否被标记,若是,限制设备ID或IP地址的访问频率、屏蔽请求或引导至验证码页面,否,允许正常访问,将设备ID的行为特征更新至特征库。本发明能够有效区分正常用户和爬虫,从而在不影响正常用户体验的同时,保护网络资源和数据安全。
-
公开(公告)号:CN120046710A
公开(公告)日:2025-05-27
申请号:CN202510141033.6
申请日:2025-02-08
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供一种对于复杂长文本的大模型知识库构建和检索方法,包括多粒度分块,接收并预处理文本数据,基于变粒度分块策略多粒度层级拆分文本数据,每个粒度层级对应若干粒度一致的文本块;构建知识库,获取每个文本块的文本元数据,文本块与文本元数据向量化并生成文本块向量和文本元数据向量,依据文字信息少的文本元数据向量调用文字信息多的文本块向量。本发明能够多粒度层级划分文本块,有效保留文本数据内的上下文逻辑信息,提高知识库的检索准确性。
-
-
-
-
-
-
-
-
-