数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112884501A

    公开(公告)日:2021-06-01

    申请号:CN201911207323.7

    申请日:2019-11-29

    Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。

    数据归一化的方法、装置、电子设备及存储介质

    公开(公告)号:CN112822302A

    公开(公告)日:2021-05-18

    申请号:CN201911127228.6

    申请日:2019-11-18

    Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。

    信息提取方法和装置
    3.
    发明授权

    公开(公告)号:CN105677764B

    公开(公告)日:2020-05-08

    申请号:CN201511022937.X

    申请日:2015-12-30

    Abstract: 本申请公开了信息提取方法和装置。所述方法的一具体实施方式包括:将预先获取的网页文件解析为标签树结构,并从所述标签树的节点中识别出所述网页文件中的网页正文所在的至少一个正文节点;将所述至少一个正文节点包含的内容进行段落划分,生成各个段落块,并根据各个段落块关联的标签的属性为各个段落块设定标签属性;基于各个段落块的标签属性将各个段落块包含的文本内容进行分类;基于分类结果从段落块包含的文本内容中提取包含问题和答案的信息。该实施方式实现了信息自动、精确的提取。

    用于提供搜索结果的方法和装置

    公开(公告)号:CN105677927B

    公开(公告)日:2019-04-12

    申请号:CN201610200781.8

    申请日:2016-03-31

    Abstract: 本申请公开了用于提供搜索结果的方法和装置。所述方法的一具体实施方式包括:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及根据所述至少一个待展示网页生成交互式对话。该实施方式能够为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。

    生成网页的方法和装置
    7.
    发明公开

    公开(公告)号:CN108205532A

    公开(公告)日:2018-06-26

    申请号:CN201611168916.3

    申请日:2016-12-16

    Abstract: 本申请公开了一种生成网页的方法和装置。该方法的一具体实施方式包括:获取用户的浏览目标信息;对根据上述浏览目标信息所抓取的网页的页面内容进行识别,以得到至少一个内容单元集合,其中,每个上述内容项集合包括至少一个内容单元;计算上述浏览目标信息与各个内容单元集合所包含的内容的第一相关度;基于上述内容单元集合,按照上述第一相关度由高到低的排列顺序生成新网页。该实施方式可以根据用户的浏览目标信息重新生成新网页,使网页内容具有针对性,可以有效缩短用户获取信息的路径,从而提高信息呈现效率。

    用于推送信息的方法、装置及服务器

    公开(公告)号:CN106874507A

    公开(公告)日:2017-06-20

    申请号:CN201710111055.3

    申请日:2017-02-28

    Abstract: 本申请公开了用于推送信息的方法、装置及服务器。该方法的一具体实施方式包括:接收终端设备发来的搜索关键词;查询上述终端设备的用户网络搜索记录,上述用户网络搜索记录包括与接收到上述搜索关键词的时间相差设定时间内的网络搜索记录;根据上述搜索关键词和用户网络搜索记录从预置的搜索信息集合中确定上述搜索关键词对应的搜索信息;将所确定的搜索信息发送给上述终端设备,以供在上述终端设备上进行呈现。该实施方式提高了用户获取信息的效率。

Patent Agency Ranking