-
公开(公告)号:CN119692349A
公开(公告)日:2025-03-25
申请号:CN202411737824.7
申请日:2024-11-29
Applicant: 长江水利委员会网络与信息中心
IPC: G06F40/295 , G06F40/242 , G06F40/247 , G06F40/211 , G06Q50/06
Abstract: 本发明提供一种取水许可管理资料命名实体识别方法及装置,属于自然语言处理技术领域,方法包括:对取水许可管理资料进行文本预处理,并采用BIO注释法对预处理后的文本进行实体标注,形成初始数据集;对初始数据集进行数据增强,以扩充样本构建取水许可领域专业数据集;利用取水许可领域专业数据集,训练取水许可管理命名实体识别模型;将待识别的取水许可管理资料输入至训练完成的取水许可管理命名实体识别模型,确定实体识别结果。本发明针对长江取水许可管理语料库稀缺的问题,提出了基于词典构建和预训练模型的新型数据增强方法;针对长江取水许可管理资料命名实体识别困难的问题,设计了面向长江取水许可管理资料的命名实体识别模型。
-
公开(公告)号:CN119167242A
公开(公告)日:2024-12-20
申请号:CN202411069638.0
申请日:2024-08-06
Applicant: 长江水利委员会网络与信息中心
IPC: G06F18/2433 , G06F18/214 , G06F18/23 , G06N3/006
Abstract: 本申请公开了一种取水监测异常数据识别方法、装置、设备及存储介质,该方法包括:对取水户日取水量历史监测数据和当日取水量待检测数据进行预处理,得到日取水量序列和日取水量变化率序列;基于所述日取水量序列和所述日取水量变化率序列进行迭代训练确定最优目标参数;基于所述最优目标参数对所述日取水量序列和所述日取水量变化率序列进行聚类识别取水异常数据。本发明中确定日取水量序列和日取水量变化率序列,对历史数据要求较低,并进一步计算出最优目标参数,不需要人工识别,避免了人工识别可能产生的漏检,实现了自动化确定最优目标参数,从而进行聚类识别取水异常数据,对异常数据的识别结果具有较高的准确性。
-
公开(公告)号:CN119088921A
公开(公告)日:2024-12-06
申请号:CN202411140592.7
申请日:2024-08-20
Applicant: 长江水利委员会网络与信息中心
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/30
Abstract: 本发明提供一种面向取水许可领域表格知识抽取的问答方法及系统,属于自然语言处理和大语言模型技术领域,所述方法包括:通过获取取水许可领域表格进行表格结构重构,得到文本格式表格,在根据文本格式表格采用提示工程方式基于大语言模型进行知识抽取,得到结构化的事实三元组数据;本发明利用提示工程将大语言模型和表格知识抽取结合,可准确抽取多种类型的表格知识。进而根据事实三元组数据,构建知识图谱数据库;获取用户检索问句,根据用户检索问句和知识图谱数据库,得到目标答案集;将目标答案集输入大语言模型输出检索结果,可以实现高效分析取水许可领域表格,进而实现快速问答。大大提高了取水许可领域表格内容的利用率,以及分析效率。
-
-