一种基于大语言模型的政府预算项目分类方法及系统

    公开(公告)号:CN119579102A

    公开(公告)日:2025-03-07

    申请号:CN202411647180.2

    申请日:2024-11-18

    Abstract: 本发明提供本发明的目的是提供一种基于大语言模型的政府预算项目分类方法,包括:步骤一:根据预定训练数据集,对其每个预算项目构建标签,生成目标训练数据集;步骤二:将所述目标训练数据集转化成大语言模型可识别的结构;步骤三:选择预训练大模型,所述预训练大模型为根据所述预算项目需求选择包括至少文本生成和文本分类功能的预训练大模型;步骤四:修改所述预训练大模型的配置文件,以适配所述目标训练数据集;步骤五:将所述所述目标训练数据集训练所述预训练大模型,并进行修正,得到训练好的大模型;步骤六:提取新预算项目数据的核心字段信息拼接成长字符串传入所述训练好的大模型进行预测并返回预测标签。大大提高模型预测准确性。

    文本表征方法、装置、存储介质和电子设备

    公开(公告)号:CN119578420A

    公开(公告)日:2025-03-07

    申请号:CN202411728788.8

    申请日:2024-11-28

    Inventor: 李明 袁野 孔飞

    Abstract: 本公开提供一种文本表征方法、装置、存储介质和电子设备,其中,所述方法包括:获取输入的语句文本;对所述语句文本进行分词,得到多个分词数据;对每个分词数据进行向量化,得到每个分词数据的分词矩阵,其中,所述分词矩阵中包括词根向量、词性向量和词位向量,所述词性向量用于表示所述分词数据的词性信息;对所述多个分词数据的分词矩阵进行拼接,得到所述语句文本的目标语句矩阵。通过构建包括词根向量、词性向量和词位向量的目标语句矩阵,增强了文本表征的丰富性和准确性。在使用目标语句矩阵训练语言处理模型时,可以使语言处理模型准确学习到中文文本的词性信息,提高语言处理模型的学习准确性和理解能力。

    智能保险代理人面访日志文本重复度检测装置及其方法

    公开(公告)号:CN119578397A

    公开(公告)日:2025-03-07

    申请号:CN202411490130.8

    申请日:2024-10-24

    Abstract: 本发明涉及一种智能保险代理人面访日志文本重复度检测装置及其方法,该装置包括依次连接的输入模块、预处理模块、相似度计算模块和后处理模块,该方法包括:获取待检测的当前日志和历史日志,构造文本对数据,历史日志包括历史N天内的客户拜访日志记录;针对文本对数据进行文本清洗处理,得到处理后的当前日志文本和历史日志文本;针对当前日志文本和历史日志文本,分别计算两者之间的字符相似度和语义相似度;基于字符相似度和语义相似度,结合预设的对应阈值进行比较判断,输出得到重复度检测结果。与现有技术相比,本发明将字符相似度和语义相似度相结合,能够从文字相似和语义重复方面进行高效、准确的日志重复度检测,有效提升日志质量。

    一种智慧办公的任务处理方法、装置、设备及介质

    公开(公告)号:CN119577150A

    公开(公告)日:2025-03-07

    申请号:CN202510131180.5

    申请日:2025-02-06

    Inventor: 赵君喜

    Abstract: 本发明适用于数据识别的技术领域,提供了一种智慧办公的任务处理方法、装置、设备及介质,所述智慧办公的任务处理方法包括:获取待识别文本数据和待识别文本数据的一级分类信息;提取待识别文本数据中的当前标题部分和/或当前摘要部分;根据当前标题部分和/或所述当前摘要部分,确定待识别文本数据的目标二级分类信息;根据目标关键内容类别对应的关键词,提取待识别文本数据中的目标关键内容类别对应的文本区域;在待识别文本数据中,标注多个文本区域对应的目标关键内容类别。本技术方案通过智能化的文档分类、关键内容提取和区域标注,能够极大地提升文档处理的自动化程度和精确度。

    一种基于文本情感分析的搜索引擎系统

    公开(公告)号:CN119577110A

    公开(公告)日:2025-03-07

    申请号:CN202411617129.7

    申请日:2024-11-13

    Abstract: 本发明公开了一种基于文本情感分析的搜索引擎系统,涉及搜索引擎技术领域,包括实时参数捕获与存储模块、异常分析与模型比对模块、风险评估模块以及应对措施模块:实时参数捕获与存储模块,在情感分析过程中,每一条文本都会生成一系列参数,对情感分析模型进行文本分析时生成的参数进行实时捕获和存储,确保数据流动的低延迟和完整性。本发明通过引入情感极化指数和预期违背指数,使系统精准捕捉复杂情绪,避免误判。实时参数捕获保障低延迟,机器学习多层次分析提升鲁棒性。通过低、中、高风险等级划分,系统实现按需干预和资源优化,避免业务损失与品牌形象受损,确保企业高效应对市场反馈与不确定性。

    一种文本分类方法及装置

    公开(公告)号:CN114997165B

    公开(公告)日:2025-03-07

    申请号:CN202210623512.8

    申请日:2022-06-02

    Abstract: 本申请公开了一种文本分类方法,包括:获取待分类文本,将待分类文本输入文本分类模型,得到待分类文本的至少一个类别,从而得到所述至少一个类别所体现的待分类文本的有效信息。在训练文本分类模型时,可以对训练文本进行编码,得到第一编码向量,并基于第一编码向量和标签关系特征进行解码,得到解码结果,标签关系特征用于指示标签字典中的标签之间的关联关系。进一步地,基于解码结果和训练文本对应的至少一个标签,更新文本分类模型的参数。由此可见,本方案训练得到的文本分类模型在对待分类文本进行分类时,所得到的分类结果更加准确。而待分类文本的标签,可以体现待分类文本的有效信息,故而本方案可以准确的确定待分类文本的有效信息。

    一种邮件主题生成方法、装置、设备和存储介质

    公开(公告)号:CN119558295A

    公开(公告)日:2025-03-04

    申请号:CN202411709350.5

    申请日:2024-11-26

    Inventor: 沈乐 徐辉

    Abstract: 本发明实施例公开了一种邮件主题生成方法、装置、设备和存储介质。该方法包括:响应于目标邮件的主题生成触发操作,获取目标邮件的目标正文信息;根据预先训练获得的目标分类模型和目标正文信息进行邮件分类,确定目标邮件类型;获取目标邮件类型对应的目标主题模板;根据目标正文信息,确定目标主题模板中待填入的目标主题项对应的目标主题项信息;将目标主题项信息填入到目标主题模板中,获得目标邮件对应的目标主题信息,并在目标邮件的主题内容框中展示目标主题信息。通过本发明实施例的技术方案,可以实现邮件主题信息的自动生成和展示,无需人工填写,并且对同一邮件类型的邮件主题信息进行格式标准化,提高了邮件查看体验。

Patent Agency Ranking