一种图片相似度检测方法及系统

    公开(公告)号:CN108960280B

    公开(公告)日:2020-07-24

    申请号:CN201810488427.9

    申请日:2018-05-21

    Abstract: 本发明涉及一种图片相似度检测方法及系统,该检测方法包括:分别筛选出互联网图片和参考图片中的互联网图片特征点和参考图片特征点;根据所有互联网图片特征点和所有参考图片特征点得到互联网图片和参考图片中的匹配特征点;当匹配特征点的个数大于或等于预设阈值时,互联网图片和参考图片相似。本发明实施例通过获取进行对比的两个图片的特征点,获取得到互联网图片和参考图片的特征点是否相匹配,并统计相匹配的特征点的数量,当匹配的特征点的数量超过预设阈值时,即可确认互联网图片和参考图片相似,本发明实施例计算数据量少,抗噪能力强,实现了快速识别检验图片之间是否相似。

    一种信息流行度预测方法、设备和存储介质

    公开(公告)号:CN110334275A

    公开(公告)日:2019-10-15

    申请号:CN201910471730.2

    申请日:2019-05-31

    Abstract: 本发明公开了一种信息流行度预测方法、设备和存储介质。该方法包括:获取待预测信息;按照预先确定的流行度影响特征类别,提取所述待预测信息的流行度影响特征;将所述流行度影响特征输入预先训练的集成了多个预测模型的多模型预测器中,获得所述多模型预测器输出的所述待预测信息的流行度。本发明使用集成了多个预测模型的多模型预测器对待预测信息进行信息流行度预测,采用多模型预测器预测信息流行度不仅可以提高预测模型预测结果的稳定性,还可以显著提高预测模型的预测性能,使得流行度预测更加稳定,预测结果更加精准。

    一种图片相似度检测方法及系统

    公开(公告)号:CN108960280A

    公开(公告)日:2018-12-07

    申请号:CN201810488427.9

    申请日:2018-05-21

    Abstract: 本发明涉及一种图片相似度检测方法及系统,该检测方法包括:分别筛选出互联网图片和参考图片中的互联网图片特征点和参考图片特征点;根据所有互联网图片特征点和所有参考图片特征点得到互联网图片和参考图片中的匹配特征点;当匹配特征点的个数大于或等于预设阈值时,互联网图片和参考图片相似。本发明实施例通过获取进行对比的两个图片的特征点,获取得到互联网图片和参考图片的特征点是否相匹配,并统计相匹配的特征点的数量,当匹配的特征点的数量超过预设阈值时,即可确认互联网图片和参考图片相似,本发明实施例计算数据量少,抗噪能力强,实现了快速识别检验图片之间是否相似。

    一种文字传播路径分析方法及系统

    公开(公告)号:CN108595439A

    公开(公告)日:2018-09-28

    申请号:CN201810435632.9

    申请日:2018-05-04

    Abstract: 本发明涉及一种文字传播路径分析方法及系统,该分析方法包括:将互联网稿件和参考稿件分别按语句向量化,得到互联网稿件语句维度向量和参考稿件语句维度向量;通过计算相应的汉明距离判断互联网稿件与参考稿件是否有共有语句;当互联网稿件与参考稿件有共有语句时,且互联网稿件不包含预设关键词时,确定互联网稿件与参考稿件采用关系的种类。在本发明实施例中,根据互联网稿件和参考稿件分别得到对应语句维度向量,通过语句维度向量计算互联网稿件和参考稿件的汉明距离,利用互联网稿件和参考稿件的汉明距离和互联网稿件是否包含预设关键词确认互联网稿件与参考稿件的采用关系,为用户提供了不同稿件之间关系的处理方法,提高工作的效率。

    一种基于大模型的树形结构知识构建方法、设备及介质

    公开(公告)号:CN119886307A

    公开(公告)日:2025-04-25

    申请号:CN202510070907.3

    申请日:2025-01-16

    Abstract: 本发明提供了一种基于大模型的树形结构知识构建方法、设备及介质,涉及人工智能技术领域,所述方法包括:初始化栈,并创建栈的根节点,获取目标文章的第i行文本;若第i行文本是标题,获取目标文章的第i行文本的标题类型,按照从栈顶到栈底的顺序遍历栈中的子节点,若存在子节点与第i行文本的标题类型相同,将该子节点标记为相同类型节点,并将从栈顶到相同类型节点的全部节点出栈,若栈为空,将第i行文本作为根节点的子节点,并将第i行文本入栈;若栈不为空,获取栈的栈顶,将第i行文本作为栈顶的子节点,并将第i行文本入栈,直到目标文章的所有行遍历完成,生成目标文章的解析树;从而更加高效且准确的获取到目标文章的解析树。

    基于上下文的大语言模型对话处理方法、装置及电子设备

    公开(公告)号:CN119831045A

    公开(公告)日:2025-04-15

    申请号:CN202411915111.5

    申请日:2024-12-24

    Abstract: 本申请实施例公开了一种基于上下文的大语言模型对话处理方法、装置及电子设备,可解决如何提供一种基于上下文相似度分析与智能筛选的动态管理方法来优化大语言模型交互的问题。该方法包括:获取用户输入的当前文本信息;对当前文本信息和预存的多个历史对话信息分别进行编码,得到当前文本向量和多个历史对话向量;根据每个历史对话向量和当前文本向量之间的语义相似度,对多个历史对话向量进行筛选,得到筛选后的目标历史对话信息;将当前文本信息和筛选后的目标历史对话信息进行拼接,得到目标输入文本;将目标输入文本输入到目标语言模型中,得到目标输出响应信息,目标语言模型包括大语言模型。

    一种大模型问答的知识溯源方法、装置、介质和设备

    公开(公告)号:CN119829717A

    公开(公告)日:2025-04-15

    申请号:CN202411905240.6

    申请日:2024-12-23

    Abstract: 本申请涉及人工智能技术领域,特别是涉及一种大模型问答的知识溯源方法、装置、介质和设备。包括:获取大模型问答生成的待溯源文本;根据目标问题和目标任务模式对应的每一置信数据源,得到初始知识载体列表C;根据待溯源文本和C,得到关键知识载体列表M;根据待溯源文本和M,得到关键知识片段匹配度列表集DP;若MAX(DPj)<EP;则将Mj从M中删除;否则不删除,以更新M,得到目标知识载体列表G。本申请提高了知识溯源的准确性,减少了溯源的工作量。且节约了计算机资源,能够为待溯源文本提供较为准确的溯源知识载体,使得用户能够获取大模型问答输出结果的知识来源,辅助用户对于大模型问答输出结果的置信度的判断。

    大模型的优化训练、数据处理方法、装置、设备和介质

    公开(公告)号:CN119761417A

    公开(公告)日:2025-04-04

    申请号:CN202411808552.5

    申请日:2024-12-10

    Abstract: 本申请涉及数据处理技术领域,尤其提供一种大模型的优化训练、数据处理方法、装置、设备和存储介质,首先,针对每条样本指令,将样本指令输入基础模型,得到样本指令的N条候选答案,利用M个不同的奖励模型分别对候选答案进行评分,得到候选答案的M个评分结果;然后对候选答案的M个评分结果进行加权计算,得到候选答案的偏好值;基于候选答案的偏好值从N条候选答案中选取第一答案和第二答案;最后构建偏好样本数据集,偏好样本数据集包括偏好样本,偏好样本包括样本指令以及样本指令对应的第一答案和第二答案,偏好样本数据集用于采用离线方式对基础模型进行优化训练。以减少了对巨量计算资源的消耗,使大模型偏好对齐训练任务更易实施。

    一种大模型RAG召回策略智能规划方法、装置、介质及设备

    公开(公告)号:CN119760097A

    公开(公告)日:2025-04-04

    申请号:CN202411952374.3

    申请日:2024-12-27

    Abstract: 本发明涉及智能问答技术领域,尤其涉及一种大模型RAG召回策略智能规划方法、装置、介质及设备,通过引入提示词将初始问题转化为目标问题,对目标问题进行关键信息和向量的多维度处理,以基于预设大模型获取到参考召回数据,将初始场景类别、预设召回路径、目标问题、参考召回数据和预设提示词输入至预设大模型中,获取到目标召回路径,按照顺序依次执行目标召回路径中的所有数据召回环节,获取到目标召回数据,通过为大模型提供多维度参考信息,辅助大模型获取到由多个按顺序排列的数据召回环节构成的目标召回路径,使得数据召回过程更加高效,并能够适应各种复杂多变的应用场景和问题类型,提高了召回方法的准确性和效率。

Patent Agency Ranking