-
公开(公告)号:CN116089597A
公开(公告)日:2023-05-09
申请号:CN202310085815.3
申请日:2023-01-17
Applicant: 中国南方电网有限责任公司
IPC: G06F16/335 , G06F40/169 , G06F40/194 , G06F40/279 , G06F40/30 , G06F18/214
Abstract: 本发明实施例公开了一种语句推荐方法、装置、设备及存储介质,其中,该方法,包括:获取用户的输入内容,通过已训练的文档主题生成模型对所述输入内容进行主题识别,得到主题向量;通过已训练的第一BERT模型将所述输入内容转换成句子本体向量;将所述主题向量和所述句子本体向量进行拼接,形成目标语句向量;将所述目标语句向量输入至已训练的第二BERT模型中,得到所述输入内容的特征向量,基于所述输入内容的特征向量与文言文语句库中文言文语句的特征向量的相似度确定与所述输入内容匹配的文言文语句。本发明实施例提供的技术方案,可以精准提供文言文语句,降低文言文使用门槛。
-
公开(公告)号:CN115858764A
公开(公告)日:2023-03-28
申请号:CN202211698516.9
申请日:2022-12-28
Applicant: 中国南方电网有限责任公司
IPC: G06F16/335 , G06F16/35 , G06F16/33 , G06F40/216 , G06N20/00
Abstract: 本发明公开了一种文稿推荐方法、装置、设备及介质。该方法包括:将用户上传的多个采集文本进行规范化处理,生成多个规范文本,并根据规范文本生成文本数据库;将语言表征模型以及词频‑逆频率模型进行拼接,获取拼接后的融合模型,并根据融合模型获取各规范文本的特征向量;获取用户输入的搜索文本,根据搜索文本以及各规范文本的特征向量,在文本数据库中获取多个与搜索文本相似的候选文本,并利用候选文本组成候选文本集合;根据预设的文本组合方式,在候选文本集合中筛选出至少一组目标文本,并根据目标文本生成至少一篇推荐文稿。通过采用上述技术方案,能够自动生成与用户输入的搜索文本匹配的推荐文稿,且能够提高推荐文稿结构的多样性。
-
公开(公告)号:CN115827852A
公开(公告)日:2023-03-21
申请号:CN202211698492.7
申请日:2022-12-28
Applicant: 中国南方电网有限责任公司
IPC: G06F16/335 , G06F16/338 , G06F40/30
Abstract: 本发明公开了一种文稿汇编方法、装置、设备及介质。该方法包括:获取用户输入的搜索文本,并根据搜索文本生成语句语义特征向量;在预先建立的数据库中获取各文本段落,并计算语句语义特征向量与各文本段落之间的场景相关度以及业务相关度;根据场景相关度与业务相关度计算语句语义特征向量与各文本段落之间的综合相关度,并根据综合相关度获取多个相关段落展示于用户端;获取用户根据相关段落生成的文稿汇编请求,并根据文稿汇编请求生成汇编文稿。通过上述技术方案,能够根据用户输入的搜索文本,自动推荐与搜索文本相似的相关段落,并根据用户发送的汇编请求,将选中的相关段落汇编成一篇文稿,进而能够使得用户通过便捷操作快速获取汇编文稿。
-
公开(公告)号:CN116187280A
公开(公告)日:2023-05-30
申请号:CN202211698507.X
申请日:2022-12-28
Applicant: 中国南方电网有限责任公司
IPC: G06F40/166 , G06F40/211 , G06F16/36 , G06F16/35 , G06F16/33
Abstract: 本发明公开了一种文本生成方法、装置、设备及存储介质。包括:根据获取的初始写作文本构建文本素材库;获取用户输入的写作提纲,确定写作提纲中的各提纲关键字;从文本素材库中提取与各提纲关键字匹配的候选写作文本分句,并将各候选写作文本分句进行展示,以供用户进行选择;将用户选择的候选写作文本分句作为目标写作文本分句,并根据目标写作文本分句生成最终文本。通过对获取的初始写作文本处理生成的初始写作文本分句来构建文本素材库,并通过确定出的提纲关键字从文本素材库提取候选写作文本分句供用户进行选择,更好的满足用户的需求,最后根据用户选择的目标写作文本分句生成最终文本,保证了文本生成的质量,提高了用户写作效率。
-
公开(公告)号:CN116108839A
公开(公告)日:2023-05-12
申请号:CN202211727595.1
申请日:2022-12-30
Applicant: 中国南方电网有限责任公司
IPC: G06F40/284 , G06F40/30 , G06F16/335
Abstract: 本发明实施例提供了一种词语推荐方法、装置、设备及存储介质,其中,该方法,包括:对输入内容进行分词识别,得到至少一个目标词语,提取目标词语的本义、衍生义、引申义、比喻义、词性以及情感,形成目标词语向量;通过词语匹配模型从公文词库中匹配与目标词语向量符合相似度条件的候选词语向量,并基于目标词语向量和候选词语向量的相似度,以及候选词语向量对应的候选词语在公文词库中的频次,确定候选词语向量与目标词语向量的匹配程度;基于匹配程度在候选词语向量对应的候选词语中筛选词语,并将筛选出的词语进行推荐,可以提高词语在公文写作应用场景的适配程度,为公文写作高效提供精准词语推荐。
-
公开(公告)号:CN115934915A
公开(公告)日:2023-04-07
申请号:CN202211699293.8
申请日:2022-12-28
Applicant: 中国南方电网有限责任公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06F40/40 , G06F40/289 , G06F18/22
Abstract: 本发明公开了一种古诗词搜索方法、装置、设备及存储介质。包括:根据获取的各古诗词的原诗句以及对应的相关信息构建古诗词数据库,其中,古诗词数据库中包含原诗句和第一特征的对应关系;获取用户输入的目标语句,确定目标语句对应的第二特征,其中,第一特征和第二特征中包括相关向量、匹配向量和契合向量;根据第二特征和第一特征确定古诗词数据库中与目标语句匹配的搜索结果。通过获取的古诗词原诗句和相关信息构建古诗词数据库,再通过确定目标语句对应的第二特征,根据第一特征和第二特征中包含的相关向量、匹配向量和契合向量进行多维度匹配,从古诗词数据库中获取与目标语句匹配的搜索结果,不会扩散场景理解范围,提高了搜索的准确率。
-
-
-
-
-