-
公开(公告)号:CN118569266A
公开(公告)日:2024-08-30
申请号:CN202411038307.0
申请日:2024-07-31
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F40/30 , G06F40/284 , G06N5/022 , G06F18/213
摘要: 本公开提供了内容生成方法、装置、电子设备、存储介质及产品,该方法包括,获得目标提示语,所述目标提示语中至少包括任务描述信息;基于模型,根据所述目标提示语,生成针对所述任务描述信息的目标内容;其中,所述模型通过多步的推理生成所述目标内容,在多步的推理过程中,针对目标步推理的第一候选推理结果,进行风险检测,获得风险检测结果,并根据所述风险检测结果,确定出符合目标风险要求的第二候选推理结果,以使所述第二候选推理结果用于下一步推理,从而提高风险检测效率,以及提升内容质量。
-
公开(公告)号:CN118504584A
公开(公告)日:2024-08-16
申请号:CN202410944723.0
申请日:2024-07-15
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F40/30 , G06F40/284 , G06N5/022 , G06F18/213
摘要: 本公开提供了内容生成方法、装置、电子设备、存储介质及产品,该方法包括:获取输入的参考内容和背景知识信息;基于多维度的特征提取要求,对所述参考内容进行语义分析,获得多维度的内容特征,其中,所述内容特征表征内容生成时的内容要求;根据多维的所述内容特征和所述背景知识信息,生成目标内容,从而提高生成内容的效率、质量及准确性。
-
公开(公告)号:CN117520549B
公开(公告)日:2024-07-02
申请号:CN202311549681.2
申请日:2023-11-20
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/35 , G06F40/205 , G06Q40/12
摘要: 本申请公开了一种文档切分方法、装置、设备及可读存储介质,涉及计算机技术领域,以提高获得的文档片段的质量和相关性。该方法包括:将待处理文档进行第一切分,得到至少一个文档片段;将所述至少一个文档片段进行分类,得到第一类型文档片段和第二类型文档片段;对所述第一类型文档片段进行第一文档切分处理,得到至少一个第一类型文档片段;对所述第二类型文档片段进行第二文档切分处理,得到至少一个第二类型文档片段;利用所述至少一个第一类型文档片段和所述至少一个第二类型文档片段,得到文档切分片段集合。本申请实施例可以提高获得的文档片段的质量和相关性。
-
公开(公告)号:CN117708597A
公开(公告)日:2024-03-15
申请号:CN202311766102.X
申请日:2023-12-20
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F18/214 , G06F18/24 , G06N20/00
摘要: 本申请实施例提供了一种意图识别的方法、装置、电子设备和计算机可读介质,涉及自然语言处理技术领域。所述方法包括基于训练集数据,得到用于识别第一意图类别的第一模型,所述第一意图类别的数量不小于2;在所述第一意图类别中,确定第二意图类别和第三意图类别,其中,所述第二意图类别对应的第一评价指标小于第一阈值,所述第一评价指标用于评估所述第一模型对各意图类别的识别准确性,所述第三意图类别对应的样本量小于第二阈值;基于所述训练集数据,得到用于识别所述第二意图类别的第二模型以及用于识别所述第三意图类别的第三模型;根据所述第一模型、所述第二模型和所述第三模型各自的输出,确定目标意图类别。
-
公开(公告)号:CN117390451A
公开(公告)日:2024-01-12
申请号:CN202311422478.9
申请日:2023-10-30
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F18/214 , G06Q40/04
摘要: 本公开提供了一种趋势预测模型的训练方法及装置、电子设备、计算机可读存储介质,该方法包括:获取第一趋势预测模型,其中,第一趋势预测模型为使用与目标业务对应的文本数据对初始的第二趋势预测模型进行训练后得到的模型,第二趋势预测模型包括大语言模型;获取样本数据和样本数据的标注文本,其中,样本数据包括与目标业务的趋势数据存在关联关系的文本数据,标注文本至少用于表示趋势数据的数值在样本数据的影响下在预设时间范围内的变化方向;基于样本数据和标注文本对第一趋势预测模型进行微调,得到目标趋势预测模型。根据本公开的实施例可以提升训练得到的模型的预测结果的准确性。
-
公开(公告)号:CN117033642A
公开(公告)日:2023-11-10
申请号:CN202311293136.1
申请日:2023-10-08
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/35 , G06F40/109 , G06V30/148 , G06V30/19 , G06F16/34
摘要: 本申请公开了一种文档解析方法及装置,涉及人工智能技术领域。其中,该方法包括:对待解析的文档进行文字提取,得到文档中文字的信息,文字的信息包括文字的内容和文字的位置信息;根据文字的位置信息对文字进行聚类,得到多个文字块;根据文字块内文字的信息,确定文字块的信息,文字块的信息包括文字块的内容和文字块的位置信息;根据文字块的内容和/或文字块的位置信息,对多个文字块进行排序,得到排序结果;根据文字块的内容和排序结果,生成文档解析结果。本申请的文档解析方法,即使对于分栏、分块的内容,也可以实现对文字的准确排序,进而提高了解析出的内容的质量,以及基于解析出的内容获取的问答和摘要结果的准确性。
-
公开(公告)号:CN116484005B
公开(公告)日:2023-09-08
申请号:CN202310746224.6
申请日:2023-06-25
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/35 , G06F40/279 , G06F18/2135 , G06F18/214
摘要: 本发明提供一种分类模型构建方法、装置及存储介质,涉及自然语言处理技术领域,所述方法包括:基于获取的多个预训练模型对训练数据集进行向量化,得到多个预训练模型分别对应的向量化数据;根据多个预训练模型中每个预训练模型对应的向量化数据,在多个预训练模型中确定目标预训练模型;基于目标预训练模型,构建分类模型。多个预训练模型对训练数据集进行向量化,以获取多个预训练模型分别对应的向量化数据,根据每个预训练模型对应的向量化数据,在多个预训练模型中确定目标预训练模型,基于目标预训练模型构建分类模型。通过每个预训练模型对应的向量化数据对多个预训练模型进行筛选,优化了模型训练的过程,从而提升了训练效率。
-
公开(公告)号:CN115881108A
公开(公告)日:2023-03-31
申请号:CN202211073547.5
申请日:2022-09-02
申请人: 北京中关村科金技术有限公司
IPC分类号: G10L15/197 , G10L15/04 , G06F40/284 , G06F40/242
摘要: 本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;基于预设的用户词典和分词器对所述修正语句文本进行语句回测;根据语句回测结果确定对应的语音识别结果。本发明结合同义词词典进行词条匹配,增加对用户口语化表达的泛化匹配能力,同时利用用户词典和分词器对修正语句进行回测验证,确保修正结果的正确性,从而提高了语音识别的准确性。
-
公开(公告)号:CN115859065A
公开(公告)日:2023-03-28
申请号:CN202210612859.2
申请日:2022-05-31
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F18/21 , G06F18/2431 , G06F40/30
摘要: 本发明公开了一种模型评测方法、装置、设备及存储介质。该方法包括:获取测试语句及对应的原始意图,并将所述测试语句输入待测模型,得到所述待测模型输出的第一预测意图,以根据所述第一预测意图获得第一评测结果;在所述第一评测结果不满足预设条件的情况下,根据所述原始意图和所述第一预测意图、在所述测试语句中确定负例语句;获取所述待测模型的训练语句,并根据所述训练语句和所述负例语句确定目标语句;根据所述目标语句更新所述测试语句;将所述更新后的测试语句输入所述待测模型,得到所述待测模型输出的第二预测意图,以根据所述第二预测意图获得第二评测结果。本发明可实现评测结果的自动修正,提高模型评测的准确性。
-
公开(公告)号:CN115858722A
公开(公告)日:2023-03-28
申请号:CN202210917686.5
申请日:2022-08-01
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06F40/194 , G06F40/279 , G06F40/242
摘要: 本发明公开了一种文本匹配方法、装置及存储介质,所述方法包括:根据获取目标识别文本,并基于预设实体识别模型进行实体识别,获取实体识别结果;基于实体识别结果中的实体词进行召回,获取至少一个候选项文本;分别计算每个候选项文本和所述目标识别文本的文本相似度;基于文本相似度进行文本匹配,返回针对于所述目标识别文本的响应信息。本发明基于实体识别模型获取实体词,并通过同义词词典进行实体词的扩充,能够扩大检索词的覆盖范围,有效地召回候选项文本,通过对候选项文本进行进一步筛选,可以缩短相似度计算时间,提高响应的时效性,但不需要增加硬件成本,能够实现高效准确地进行文本匹配,提升用户的满意度,增强用户的体验感受。
-
-
-
-
-
-
-
-
-