-
公开(公告)号:CN117609279A
公开(公告)日:2024-02-27
申请号:CN202311788083.0
申请日:2023-12-22
申请人: 杭州西湖数据智能研究院
IPC分类号: G06F16/242 , G06F16/22 , G06F16/28
摘要: 本发明提供了一种基于LLM模型的NL2SQL方法及存储介质,涉及自然语言处理领域,所述方法包括:获取训练用自然语句列表和训练用SQL语句列表,获取预测SQL语句列表并对预测SQL语句进行拆分,获取预测SQL语句对应的键值对,获取预测SQL语句对应的难度等级,获取任意难度等级的预测SQL语句列表且计算该难度等级的预测SQL语句列表对应的损失,若对任意难度等级的预测SQL语句列表的损失均小于对应的损失阈值,将初始LLM模型作为目标LLM模型,使用目标LLM模型获取目标语句对应的SQL语句;本发明通过对预测SQL语句划分为不同的难度等级,达到对LLM模型转化SQL语句的特定难度等级的训练。
-
公开(公告)号:CN117555580A
公开(公告)日:2024-02-13
申请号:CN202410047516.5
申请日:2024-01-12
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
摘要: 本发明涉及数据处理领域,尤其涉及一种应用程序的分组方法、装置、介质及设备,包括:根据安装量将初始应用程序分类为主应用程序和候选副应用程序,根据安装设备列表获取主应用程序和候选副应用程序的相关性,根据主应用程序的安装量和活跃量获取安装量范围和活跃量范围,并筛选出第一副应用程序,根据相关性筛选出第二副应用程序和第三副应用程序,根据活跃量筛选出第四副应用程序,得到包括主应用程序、第二副应用程序和第四副应用程序的应用程序组,在用户下载应用程序组中的任一应用程序时,可以为用户推荐该应用程序组中的其他应用程序,从而提高了安装量和活跃量较低的候选副应用程序的曝光量,且提升了用户的下载体验感和使用体验感。
-
公开(公告)号:CN113115231A
公开(公告)日:2021-07-13
申请号:CN202110401152.2
申请日:2021-04-14
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
摘要: 本发明涉及一种基于LBS的数据处理系统,包括预先构建的第一数据库、第二数据库、处理器和存储有计算及程序的处理器,其中,所述第一数据库中存储有路网信息,所述路网信息包括预设区域内所有的位置点信息和任意两个位置点之间存在的所有可能的第一路线信息,所述第一路线信息为多个位置点信息按照到达的先后顺序组成的位置点序列;所述第二数据库用于实时存储每一样本设备上报的轨迹信息和所述轨迹信息中的每一位置点对应的上报时间信息,所述轨迹信息为多个位置点信息按照样本设备上报时间的先后排序组成的位置点序列。本发明能够提高基于位置数据来预测目标数量的准确性。
-
公开(公告)号:CN113094506A
公开(公告)日:2021-07-09
申请号:CN202110401151.8
申请日:2021-04-14
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
摘要: 本发明公开了一种基于关系图谱的预警方法、计算机设备及存储介质,所述方法包括:获取目标用户的ID;根据所述ID,确定所述ID对应的目标关系图谱;将所述目标关系图谱进行特征提取,生成第一预警特征向量S=(S1,S2,……,Si,……,Sk),其中,所述Si是指第i个预警特征值;将所述第一预警特征向量输入至预警模型,生成用户的预警值;本发明能够通过ID确定对应的目标关系图谱,并且基于所述关系图谱确定用户的预警等级,保证确定用户的预警等级的准确性,进而保证根据预警等级对用户采取的措施,避免对第三方造成损失。
-
公开(公告)号:CN113010731A
公开(公告)日:2021-06-22
申请号:CN202110197952.7
申请日:2021-02-22
申请人: 杭州西湖数据智能研究院
IPC分类号: G06F16/73 , G06F16/783
摘要: 本发明涉及一种多模态视频检索系统,包括信息交互界面、预先构建的RE I D行人识别模型、预先构建的多模态视频数据库,处理器和存储有计算机程序的存储器,所述视频数据库包括多条视频段数据记录,所述视频段数据记录包括视频段、时间信息、位置信息、RE I D特征向量、人脸特征向量和步态特征向量字段,所述RE I D特征向量基于所述RE I D行人识别模型得到。本发明提高了视频检索的效率和准确性。
-
公开(公告)号:CN117555580B
公开(公告)日:2024-04-05
申请号:CN202410047516.5
申请日:2024-01-12
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
摘要: 本发明涉及数据处理领域,尤其涉及一种应用程序的分组方法、装置、介质及设备,包括:根据安装量将初始应用程序分类为主应用程序和候选副应用程序,根据安装设备列表获取主应用程序和候选副应用程序的相关性,根据主应用程序的安装量和活跃量获取安装量范围和活跃量范围,并筛选出第一副应用程序,根据相关性筛选出第二副应用程序和第三副应用程序,根据活跃量筛选出第四副应用程序,得到包括主应用程序、第二副应用程序和第四副应用程序的应用程序组,在用户下载应用程序组中的任一应用程序时,可以为用户推荐该应用程序组中的其他应用程序,从而提高了安装量和活跃量较低的候选副应用程序的曝光量,且提升了用户的下载体验感和使用体验感。
-
公开(公告)号:CN117131248A
公开(公告)日:2023-11-28
申请号:CN202311084905.7
申请日:2023-08-25
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
IPC分类号: G06F16/904 , G06F16/901
摘要: 本发明提供了一种数据血缘图谱显示方法、电子设备及存储介质,方法包括:S100,基于用户在预设数据血缘图谱上选择的中心节点,生成对应的基础数据血缘图;基于用户对当前数据血缘图的点击操作,更新当前数据血缘图;如果当前数据血缘图中存在回连线,并且,节点数量和层级数满足设定条件,则在当前数据血缘图中的回连处理节点后侧增加与对应的回连数据节点对应的虚拟数据节点,并将所述虚拟数据节点与所述回连处理节点连接,并且删除所述回连线。本发明能够提高数据血缘图谱的可视化显示效果,能够提升用户体验。
-
公开(公告)号:CN113010671A
公开(公告)日:2021-06-22
申请号:CN202110197951.2
申请日:2021-02-22
申请人: 杭州西湖数据智能研究院
摘要: 本发明涉及一种app分类系统,包括预设的第一数据库、第二数据库、第一向量生成模型、第二向量生成模型、分类模型、处理器和存储有计算机程序的存储器,其中,所述第一数据库中存储有多条app的描述信息记录;所述第二数据库中存储有多条app安装序列;所述第一向量生成模型生成预设M维度的第一向量,所述二向量生成模型生成预设N维度的第二向量。本发明针对有描述信息和无描述信息的app均可进行分类,提高了app分类的通用性和准确性。
-
公开(公告)号:CN117932069A
公开(公告)日:2024-04-26
申请号:CN202410101384.X
申请日:2024-01-24
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
IPC分类号: G06F16/35 , G06F40/186 , G06F40/279
摘要: 本发明提供了一种日报生成方法,涉及大语言模型领域,所述方法包括如下步骤:获取目标日报模版、预设文本主类别列表和预设实体类别列表集,获取待处理事件文本列表,基于预设文本主类别列表,获取预设文本主类别,基于预设文本主类别和预设实体类别列表集,对待处理事件文本进行实体抽取,获取最终抽取结果,基于最终抽取结果,生成事件简报,从而生成事件简报列表,基于预设文本主类别,将事件简报填写到目标日报模版对应的预设位置,从而获取最终日报,通过进行实体抽取在生成事件简报的方法,保证生成的事件简报的准确性,从而保证最终日报的准确性。
-
公开(公告)号:CN113115231B
公开(公告)日:2022-06-24
申请号:CN202110401152.2
申请日:2021-04-14
申请人: 每日互动股份有限公司 , 杭州西湖数据智能研究院
摘要: 本发明涉及一种基于LBS的数据处理系统,包括预先构建的第一数据库、第二数据库、处理器和存储有计算及程序的处理器,其中,所述第一数据库中存储有路网信息,所述路网信息包括预设区域内所有的位置点信息和任意两个位置点之间存在的所有可能的第一路线信息,所述第一路线信息为多个位置点信息按照到达的先后顺序组成的位置点序列;所述第二数据库用于实时存储每一样本设备上报的轨迹信息和所述轨迹信息中的每一位置点对应的上报时间信息,所述轨迹信息为多个位置点信息按照样本设备上报时间的先后排序组成的位置点序列。本发明能够提高基于位置数据来预测目标数量的准确性。
-
-
-
-
-
-
-
-
-