-
公开(公告)号:CN119579102A
公开(公告)日:2025-03-07
申请号:CN202411647180.2
申请日:2024-11-18
Applicant: 北京灵数科技有限公司
IPC: G06Q10/10 , G06Q50/26 , G06N5/04 , G06N3/0455 , G06N3/0475 , G06N3/0895 , G06N3/088 , G06N3/09 , G06N3/096 , G06F16/353 , G06F40/126
Abstract: 本发明提供本发明的目的是提供一种基于大语言模型的政府预算项目分类方法,包括:步骤一:根据预定训练数据集,对其每个预算项目构建标签,生成目标训练数据集;步骤二:将所述目标训练数据集转化成大语言模型可识别的结构;步骤三:选择预训练大模型,所述预训练大模型为根据所述预算项目需求选择包括至少文本生成和文本分类功能的预训练大模型;步骤四:修改所述预训练大模型的配置文件,以适配所述目标训练数据集;步骤五:将所述所述目标训练数据集训练所述预训练大模型,并进行修正,得到训练好的大模型;步骤六:提取新预算项目数据的核心字段信息拼接成长字符串传入所述训练好的大模型进行预测并返回预测标签。大大提高模型预测准确性。
-
公开(公告)号:CN119578420A
公开(公告)日:2025-03-07
申请号:CN202411728788.8
申请日:2024-11-28
Applicant: 北京中绿讯科科技有限公司
IPC: G06F40/284 , G06F40/242 , G06F40/268 , G06F16/353
Abstract: 本公开提供一种文本表征方法、装置、存储介质和电子设备,其中,所述方法包括:获取输入的语句文本;对所述语句文本进行分词,得到多个分词数据;对每个分词数据进行向量化,得到每个分词数据的分词矩阵,其中,所述分词矩阵中包括词根向量、词性向量和词位向量,所述词性向量用于表示所述分词数据的词性信息;对所述多个分词数据的分词矩阵进行拼接,得到所述语句文本的目标语句矩阵。通过构建包括词根向量、词性向量和词位向量的目标语句矩阵,增强了文本表征的丰富性和准确性。在使用目标语句矩阵训练语言处理模型时,可以使语言处理模型准确学习到中文文本的词性信息,提高语言处理模型的学习准确性和理解能力。
-
公开(公告)号:CN119578397A
公开(公告)日:2025-03-07
申请号:CN202411490130.8
申请日:2024-10-24
Applicant: 中国太平洋人寿保险股份有限公司
IPC: G06F40/194 , G06F40/30 , G06F40/232 , G06N3/0455 , G06N3/09 , G06Q40/08 , G06F16/353 , G06F18/22
Abstract: 本发明涉及一种智能保险代理人面访日志文本重复度检测装置及其方法,该装置包括依次连接的输入模块、预处理模块、相似度计算模块和后处理模块,该方法包括:获取待检测的当前日志和历史日志,构造文本对数据,历史日志包括历史N天内的客户拜访日志记录;针对文本对数据进行文本清洗处理,得到处理后的当前日志文本和历史日志文本;针对当前日志文本和历史日志文本,分别计算两者之间的字符相似度和语义相似度;基于字符相似度和语义相似度,结合预设的对应阈值进行比较判断,输出得到重复度检测结果。与现有技术相比,本发明将字符相似度和语义相似度相结合,能够从文字相似和语义重复方面进行高效、准确的日志重复度检测,有效提升日志质量。
-
公开(公告)号:CN119577150A
公开(公告)日:2025-03-07
申请号:CN202510131180.5
申请日:2025-02-06
Applicant: 乾成理想(深圳)信息技术有限公司
Inventor: 赵君喜
IPC: G06F16/358 , G06F16/353 , G06F16/34 , G06F40/169 , G06F40/205 , G06F40/258
Abstract: 本发明适用于数据识别的技术领域,提供了一种智慧办公的任务处理方法、装置、设备及介质,所述智慧办公的任务处理方法包括:获取待识别文本数据和待识别文本数据的一级分类信息;提取待识别文本数据中的当前标题部分和/或当前摘要部分;根据当前标题部分和/或所述当前摘要部分,确定待识别文本数据的目标二级分类信息;根据目标关键内容类别对应的关键词,提取待识别文本数据中的目标关键内容类别对应的文本区域;在待识别文本数据中,标注多个文本区域对应的目标关键内容类别。本技术方案通过智能化的文档分类、关键内容提取和区域标注,能够极大地提升文档处理的自动化程度和精确度。
-
公开(公告)号:CN119577146A
公开(公告)日:2025-03-07
申请号:CN202411656885.0
申请日:2024-11-19
Applicant: 安徽省公安厅
IPC: G06F16/353 , G06F16/334 , G06F18/214 , G06F18/2415 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于大语言模型微调技术的机器生成文本检测方法与系统,相关方案包括:构建包含人类机器文本对比数据的训练集,使用所述训练集对预训练的大语言模型进行微调,微调时使用焦点损失函数缓解难易样本不均衡的问题,基于微调后的大语言模型进行文本检测。本发明提供的上述方案,基于预训练的大语言模型,结合基于焦点损失的微调策略,可以更好的区分机器生成的文本和人类编写的文本之间的特征差异,显著提升了分类精确度,能够更为准确的检测出机器生成文本。
-
公开(公告)号:CN119577145A
公开(公告)日:2025-03-07
申请号:CN202411647276.9
申请日:2024-11-18
Applicant: 国网福建省电力有限公司 , 重庆大学 , 北京科东电力控制系统有限责任公司
IPC: G06F16/353 , G06F40/35 , G06F40/211 , G06F40/242 , G06F40/284 , G06F18/2415 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 一种电网调控指令的意图识别模型构建方法及系统,包括:为所有的电网调控指令标记不同的关键词;基于电网全设备模型建立参数词典;为意图配置关键词和参数词典;构建意图分类模型和槽位提取模型;意图分类模型用于提取电网调控指令的可能的意图的集合,若该集合包含多个意图,则查找电网调控指令的关键词,根据关键词得到对应的意图,并得到对应的参数词典;槽位提取模型用于提取电网调控指令对应意图中的槽参数,获取的槽参数只能为对应的参数词典的参数;以采集的各种电网调控指令的集合为训练语料进行预处理,用其训练意图识别模型。本发明解决部分调控指令过于相似,从而导致意图识别错误的问题,能准确识别调度指令意图和槽参数。
-
公开(公告)号:CN119577110A
公开(公告)日:2025-03-07
申请号:CN202411617129.7
申请日:2024-11-13
Applicant: 国网江苏省电力有限公司信息通信分公司
IPC: G06F16/334 , G06F16/353 , G06F18/2415 , G06N20/00
Abstract: 本发明公开了一种基于文本情感分析的搜索引擎系统,涉及搜索引擎技术领域,包括实时参数捕获与存储模块、异常分析与模型比对模块、风险评估模块以及应对措施模块:实时参数捕获与存储模块,在情感分析过程中,每一条文本都会生成一系列参数,对情感分析模型进行文本分析时生成的参数进行实时捕获和存储,确保数据流动的低延迟和完整性。本发明通过引入情感极化指数和预期违背指数,使系统精准捕捉复杂情绪,避免误判。实时参数捕获保障低延迟,机器学习多层次分析提升鲁棒性。通过低、中、高风险等级划分,系统实现按需干预和资源优化,避免业务损失与品牌形象受损,确保企业高效应对市场反馈与不确定性。
-
公开(公告)号:CN114997165B
公开(公告)日:2025-03-07
申请号:CN202210623512.8
申请日:2022-06-02
Applicant: 中债金科信息技术有限公司
IPC: G06F40/289 , G06F40/242 , G06F16/353 , G06N3/0442 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种文本分类方法,包括:获取待分类文本,将待分类文本输入文本分类模型,得到待分类文本的至少一个类别,从而得到所述至少一个类别所体现的待分类文本的有效信息。在训练文本分类模型时,可以对训练文本进行编码,得到第一编码向量,并基于第一编码向量和标签关系特征进行解码,得到解码结果,标签关系特征用于指示标签字典中的标签之间的关联关系。进一步地,基于解码结果和训练文本对应的至少一个标签,更新文本分类模型的参数。由此可见,本方案训练得到的文本分类模型在对待分类文本进行分类时,所得到的分类结果更加准确。而待分类文本的标签,可以体现待分类文本的有效信息,故而本方案可以准确的确定待分类文本的有效信息。
-
公开(公告)号:CN113094507B
公开(公告)日:2025-03-07
申请号:CN202110409592.2
申请日:2021-04-16
Applicant: 中国工商银行股份有限公司
IPC: G06F16/353 , G06F16/31 , G06F16/335 , G06F40/216 , G06F40/30 , G06Q30/015 , G06Q30/0282
Abstract: 本文提供了一种客户端应用信息反馈方法、装置、客户端及设备,所述方法包括:根据用户操作指令,确定用户反馈的业务类型;接收用户针对所述业务类型的反馈信息,并将所述反馈信息和所述业务类型打包成反馈文件;将所述反馈文件发送至与所述业务类型对应的后台服务器,以使后台人员对所述反馈文件进行处理,本文简化了客户问题反馈途径,提高了客户对客户反馈信息的处理效率,进而提升了客户的用户体验。
-
公开(公告)号:CN119558295A
公开(公告)日:2025-03-04
申请号:CN202411709350.5
申请日:2024-11-26
Applicant: 中国农业银行股份有限公司
IPC: G06F40/186 , G06F16/3329 , G06F16/353 , G06Q10/107
Abstract: 本发明实施例公开了一种邮件主题生成方法、装置、设备和存储介质。该方法包括:响应于目标邮件的主题生成触发操作,获取目标邮件的目标正文信息;根据预先训练获得的目标分类模型和目标正文信息进行邮件分类,确定目标邮件类型;获取目标邮件类型对应的目标主题模板;根据目标正文信息,确定目标主题模板中待填入的目标主题项对应的目标主题项信息;将目标主题项信息填入到目标主题模板中,获得目标邮件对应的目标主题信息,并在目标邮件的主题内容框中展示目标主题信息。通过本发明实施例的技术方案,可以实现邮件主题信息的自动生成和展示,无需人工填写,并且对同一邮件类型的邮件主题信息进行格式标准化,提高了邮件查看体验。
-
-
-
-
-
-
-
-
-