动态调节DNS服务器方法、装置及存储介质

    公开(公告)号:CN117938657A

    公开(公告)日:2024-04-26

    申请号:CN202310875825.7

    申请日:2023-07-17

    发明人: 邓彪 翟飞飞

    摘要: 本公开是关于一种动态调节DNS服务器方法、装置及存储介质。应用于电子设备中的动态调节DNS服务器方法包括:部署数据采集机制,监测DNS服务器的性能并收集数据信息;将采集到的所述数据信息,存储在集中式数据库中;分析所述数据信息,计算DNS服务器的性能指标;根据所述性能指标,计算所述DNS服务器的性能评分,其中,所述性能评分用于确定服务器的质量和可靠性;基于动态权重调节机制,根据所述性能评分动态调整DNS服务器的第一权重。

    一种基于多语种的文本合成方法和系统

    公开(公告)号:CN117935280A

    公开(公告)日:2024-04-26

    申请号:CN202311272987.8

    申请日:2023-09-28

    发明人: 周玉 邓彪 李伟超

    摘要: 一种基于多语种的文本合成方法,包括:通过收集多个语种的Unicode编码范围构建每个语种的字符编码库;按用户需求构建每个语种的单词级翻译映射库;按第一预设规则构建对应的多语种的字体库;将文本语料进行过滤,将过滤后的文件进行分词处理,并记录单词频率;根据记录的单词频率选择单词合成图片,同时通过翻译库中映射出单词的翻译,将单词及翻译写入label文件中;按第二预设规则对合成的图片进行增强,重复进行批量合成,将合成的图片用于OCR训练。本发明在现有技术不能满足需求的情况下,实现合成多语种的文本图片,并且对图片进行颜色、背景,字体,模糊等处理,极大增加图片多样性,在一定程度上增加模型训练识别准确率。

    一种基于渐进式数据增强的OCR模型训练方法及系统

    公开(公告)号:CN117935272A

    公开(公告)日:2024-04-26

    申请号:CN202311271441.0

    申请日:2023-09-28

    发明人: 周玉 邓彪 宗绪泉

    IPC分类号: G06V30/148 G06V30/19

    摘要: 本公开属于计算机视觉技术领域,具体提供了一种基于渐进式数据增强的OCR模型训练方法及系统,其中方法包括:获取OCR模型;收集多种不同的场景文本数据的数据集,并划分为训练集和测试集;根据不同场景将测试集划分成不同子测试集,在每个特定场景所对应的子测试集上的训练过程中,逐步引入增强策略;当找到适合某一场景的增强策略,则切换到另一个场景所对应的子测试集,并逐渐增加增强强度,以找到最适合第二个场景的增强策略;重复上述过程,得到最佳性能的增强组合方式来进行训练。本发明结合了数据增强和渐进式训练策略,大大提升了模型在复杂场景中的识别能力。充分覆盖多样性场景,使得模型能够更好地适应不同场景的文本。

    一种基于模态对比学习的中文古籍自动断句方法及系统

    公开(公告)号:CN117932389A

    公开(公告)日:2024-04-26

    申请号:CN202311246147.4

    申请日:2023-09-26

    发明人: 周玉 邓彪 白书航

    摘要: 本公开属于自然语言处理技术领域,具体提供了一种基于模态对比学习的中文古籍自动断句方法及系统,其中方法包括:对中文古籍图像进行OCR识别,得到该页书籍的纯文本内容;将中文古籍图像输入图像编码器,将纯文本内容输入文本编码器;对于图像序列特征和文本序列特征,计算模态对比损失和分类损失,并进行融合得到最终的训练损失;将整体训练损失进行梯度回传,更新模型参数。本公开通过利用文本与图像、文本与文本、图像与图像之间的对比约束关系,充分利用训练数据,从而提升中文古籍自动断句模型内、模态间的特征表达能力,得到优秀的断句效果。

    一种面向大语言模型的相关问题推荐方法及系统

    公开(公告)号:CN117891912A

    公开(公告)日:2024-04-16

    申请号:CN202311798264.1

    申请日:2023-12-26

    发明人: 邓彪 周玉

    摘要: 本公开属于自然语言处理技术领域,具体提供了一种面向大语言模型的相关问题推荐方法及系统,其中方法包括:对用户输入的问题进行预处理得到关键词;通过大语言模型对问题库中的问题文本进行编码,生成特征向量,得到特征码库;利用大语言模型对关键词进行编码,生成输入向量;将输入向量与特征向量进行比较得到相似度,根据相似度对所特征码库中的特征向量进行排序;根据阈值筛选出相关问题返回给用户。本公开准确性高,能够为用户推荐与需求高度相关的问题;实时性和效率较高,能够快速地为用户提供问题推荐;易于集成,可以与现有的大语言模型和其他相关技术无缝集成;提高了用户体验,帮助用户更快地找到所需的信息,提高查询效率。

    一种自动构建地图飞线可视化数据的方法及系统

    公开(公告)号:CN117555977A

    公开(公告)日:2024-02-13

    申请号:CN202311508628.8

    申请日:2023-11-14

    发明人: 周玉 邓彪 温鹏展

    摘要: 本发明涉及一种自动构建地图飞线可视化数据的方法及系统,包括如下步骤,步骤一、查询数据库中的位置标识和经纬度以及节点信息数据,并行加载位置标识和经纬度以及节点信息,步骤二、通过位置标识将经纬度设置到节点信息中,步骤三、提取节点之间的关系,步骤四、根据步骤三提取的节点关系数组,创建并行任务构建主分支节点之间的飞线信息和构建子分支之间的飞线信息,最后构建主分支节点和子分支节点之间的飞线信息,步骤五、获取飞线信息列表和节点信息列表转换为JSON格式传递给前端页面,步骤六、前端页面通过接收步骤五的数据使用ECharts在地图上显示最终效果;多任务并行处理,能高效快速的进行大量数据处理分析。

    一种个性化新闻数据推荐的方法、系统及储存介质

    公开(公告)号:CN117540087A

    公开(公告)日:2024-02-09

    申请号:CN202311508289.3

    申请日:2023-11-14

    发明人: 周玉 邓彪 尚静波

    摘要: 本发明涉及一种个性化新闻数据推荐的方法和系统,包括如下步骤:构建多个记录表、通过多个记录表,计算每个用户的特征、基于bert模型的句子向量编码计算出所有新闻内容的特征、将强关联性的新闻和热门新闻按照一定比例推送给用户、比对用户特征信息和新闻内容特征信息,根据新、老用户的不同,向不同用户推送不同新闻内容、前端接收数据进行展示、随时更新用户行为记录;本发明提供一种新闻推荐方法,能够提高用户敏感度,使其能准确的感知到周遭的信息或是趋势,用户接收到的信息更广泛,不再局限于小范围的喜好,使用户能看到除了用户特征之外的一部分热门信息,而且通过定期维护操作记录表提高了响应速度。

    一种面向文档图像翻译的有噪文本语句切分方法

    公开(公告)号:CN117217203A

    公开(公告)日:2023-12-12

    申请号:CN202310477508.X

    申请日:2023-04-27

    摘要: 本发明公开了一种面向文档图像翻译的有噪文本语句切分方法,涉及自然语言处理技术领域,包括在干净纯文本数据集的基础上模拟构建包含多种识别噪声的有噪文本数据集,获得输入数据;对所述输入数据进行编码,使用BERT预训练语言模型对待处理文本进行编码完成词嵌入,获取动态词向量:对比学习,所述对比学习包括将所述干净纯文本与多种有噪文本分别计算对比损失。本发明通过使用BERT预训练语言模型充分提取有噪文本语义特征,并通过对比学习充分学习有噪文本和干净纯文本之间的联系,充分利用了对文档图像进行OCR识别后得到的噪声文本的特点,能够更加准确的进行语句切分,为机器翻译任务提供切分更准确的自然句,提升文档图像翻译的整体性能。

    一种多文档自动摘要系统、方法及储存介质

    公开(公告)号:CN116541515A

    公开(公告)日:2023-08-04

    申请号:CN202310587956.5

    申请日:2023-05-23

    IPC分类号: G06F16/34 G06F40/205

    摘要: 本发明公开了一种多文档自动摘要系统、方法及储存介质,涉及自然语言处理技术领域,包括多文档自动摘要系统、文档自动摘要方法以及储存介质,其中多文档自动摘要系统主要包括:文档数据处理模块,文档数据处理模块用于将文档数据处理为基本的文本表示单元;数据噪声去除模块,数据噪声去除模块用于去除文档数据噪声;语言模型;摘要提取模块。本发明通过在次模函数左值中引入了位置偏置向量来表示句子在源文本中的位置所提供的重要性度量,使得能同时提取具有突出信息的句子及位于重要位置的句子,结果更准确,同时能够使用户直接得到关于同一个主题的多篇文档中最有用并且不重复的信息,从而提高了用户阅读文档的效率。

    一种依存句法结构的电子病历命名实体识别方法及系统

    公开(公告)号:CN116306643A

    公开(公告)日:2023-06-23

    申请号:CN202211705654.5

    申请日:2022-12-28

    摘要: 本发明属于电子病历命名实体识别技术领域,具体提供了一种依存句法结构的电子病历命名实体识别方法及系统,通过将文本的依存句法结构信息经过图神经网络进行编码,同时融入依存边(依存关系)预测模型的损失,通过最大化融入结构信息与未融入结构信息的模型间隔,迫使模型将其决策与融入的结构信息关联起来,使模型对结构信息敏感。本方案通过借助文本的结构信息以提高模型在中文电子病历文本上的命名实体识别性能,尤其对于表述不一的相似实体指称,通过融入的依存句法结构信息,模型能很好地结合文本的句法结构信息对实体边界进行准确判断,提高这部分实体的识别准确率。