-
公开(公告)号:CN216249241U
公开(公告)日:2022-04-08
申请号:CN202122303219.7
申请日:2021-09-23
申请人: 国网河北省电力有限公司物资分公司
IPC分类号: G06F40/194 , G06F40/284 , G06F1/20 , G06F11/30
摘要: 本实用新型提供有基于围标串标智能识别的信息录入仪器,包括防护箱和固定安装在防护箱内侧的信息录入仪器,所述防护箱的底部固定安装有抽风机。该基于围标串标智能识别的信息录入仪器,通过人工智能技术(自然语言处理技术NLP)分析电子投标文件中的非结构化信息,利用文本相似度、中心词提取、文本信息抽取等技术,计算出投标文件之间的相似度,投标文件中关键词、高频词等进行差异分析,对围标串标的可能性,做出预警判断,通过温度检测仪能够对信息录入仪器内部的温度进行检测,进而控制降温机构对送风机输送的风进行降温处理,从而有效的对仪器内部进行降温,以保证信息录入仪器能够稳定的对投标文件进行识别处理。
-
公开(公告)号:CN217982425U
公开(公告)日:2022-12-06
申请号:CN202221892574.0
申请日:2022-07-20
申请人: 安徽人人享网络科技有限公司
IPC分类号: G06V30/148 , G06F40/194 , H04N1/04
摘要: 本实用新型公开了一种合同内容校阅装置,包括扫描仪和电脑台式一体机,所述扫描仪上固定安装有摄像头,所述扫描仪内部连接有OCR文字识别系统和控制单元,所述扫描仪和所述电脑台式一体机上连接有同一个数据线,所述OCR文字识别系统电性连接有字符识别模块,所述字符识别模块电性连接有版面分析模块,所述版面分析模块电性连接有字符切割模块,所述字符切割模块电性连接有文字图像预处理模块。本实用新型设计合理,实用性好,能够对客户寄回的纸质合同的文档内容进行准确的识别提取,可能够自动对识别提取的纸张合同的文档内容与电子版原始合同进行准确的校阅对比,使用效果好,能够满足使用需求。
-
公开(公告)号:CN118363931B
公开(公告)日:2024-11-19
申请号:CN202410781539.9
申请日:2024-06-18
申请人: 智慧眼科技股份有限公司
IPC分类号: G06F16/16 , G06F40/194 , G06F40/263 , G06F16/13
-
公开(公告)号:CN118966202A
公开(公告)日:2024-11-15
申请号:CN202411003683.6
申请日:2024-07-25
IPC分类号: G06F40/258 , G06F40/194 , G06F40/279 , G06F16/33
摘要: 本发明涉及自然语言处理技术领域,公开了一种大语言模型幻觉检测方法及装置,方法包括:利用大语言模型抽取利用参考文献的标题及描述信息构建的参考内容中的实体,构建参考内容实体集;利用大语言模型抽取生成内容中的实体,构建生成内容实体集;对生成内容实体集中的每个实体,将其与参考内容实体集中的实体进行匹配度计算,得到其与参考内容实体集的匹配度;基于匹配度,判断生成内容实体集中的每一个实体是否有参考文献支持,若均有参考文献支持,则确定生成内容不存在幻觉;否则,确定生成内容可能存在幻觉。基于两个实体集进行实体的匹配度计算,能够精确评估生成内容中每个实体的事实性,显著提升内容验证的精确度和效率。
-
公开(公告)号:CN118627507B
公开(公告)日:2024-11-12
申请号:CN202411111844.3
申请日:2024-08-14
申请人: 贵州白山云科技股份有限公司 , 贵州大学
IPC分类号: G06F40/284 , G06F40/44 , G06F40/216 , G06N3/045 , G06N3/0464 , G06F40/194
摘要: 本申请提供了一种联想敏感词的检测方法与系统,利用预训练的ChineseBERT模型,通过对正常文本的学习,计算每个汉字在句子中的出现概率,检测出可能的错误汉字;结合句子的上下文信息,将错误汉字组合为疑似敏感词集合;通过音近和形近字的特征编码及孪生神经网络相似性判断模型,进行含变体字的敏感词匹配,最终得到敏感词检测结果。本申请不仅解决了依赖大量敏感数据集训练的问题,还提高了对变体字敏感词的检测能力,为内容审核和信息过滤提供了一种高效、可靠的解决方案。
-
公开(公告)号:CN118296604B
公开(公告)日:2024-11-12
申请号:CN202410727402.5
申请日:2024-06-06
申请人: 召邦信息(南京)有限公司 , 徐州医科大学
IPC分类号: G06F21/56 , G06F21/57 , G06F16/36 , G06F40/194 , G06F40/279 , G06F40/30 , G06N5/022
摘要: 本发明属于计算机安全技术领域,涉及一种基于数字孪生技术的计算机系统多层风险监测方法,通过采集计算机系统内部数据,利用共现模型方法对采集数据进行实体和关系标注,构建计算机系统内部静态状态的知识图谱;通过有限状态机建立计算机系统对外部访问的状态及响应,构建计算机系统动态状态;通过计算机系统的静态状态和动态状态,构建基于数字孪生技术的孪生系统;通过对孪生系统外部访问的风险评估,由判断规则给出外部访问响应;上述方法设置两道防线保障系统安全;提前发现潜在故障点,减少系统维护时间和成本;同时,更全面地考虑数据中的风险因素,提高模型的灵活性和准确性。
-
公开(公告)号:CN118885602A
公开(公告)日:2024-11-01
申请号:CN202410954853.2
申请日:2024-07-17
申请人: 江苏鑫合易家信息技术有限责任公司
发明人: 张超
IPC分类号: G06F16/335 , G06F40/151 , G06F40/194 , G06N20/00
摘要: 本发明公开了一种基于LLM2Vec算法的文本查重方法及系统,用于文本查重技术领域,该基于LLM2Vec算法的文本查重方法及系统包括以下步骤:使用LLM2Vec算法将文本转换为特征向量;利用余弦相似度方法计算各特征向量之间的余弦相似度;预设相似度阈值,将计算得到的余弦相似度与相似度阈值比较,并判断本文之间是否相似。本发明通过生成高质量文本向量表示的文本编码器,不仅能够捕捉文本的丰富语义信息,还能够区分不同文本之间的细微差别,这对于各种自然语言处理任务都是非常有价值的。
-
公开(公告)号:CN118446218B
公开(公告)日:2024-11-01
申请号:CN202410606985.6
申请日:2024-05-16
申请人: 西南交通大学
IPC分类号: G06F40/295 , G06F40/30 , G06F40/194 , G06N3/0464 , G06N3/094
摘要: 本发明公开了一种对抗式阅读理解嵌套命名实体识别方法,具体为:利用BERT模型对输入文本信息和标签注释进行初始嵌入,通过Star‑Transformer对文本信息执行编码操作;标签注释信息同时利用注意力机制、平均池化和余弦相似度三种方式综合分析;模型在文本信息与标签注释信息融合之后采用FGM算法计算噪声干扰并加入;计算文本中每个token作为各类实体起始或结束位置的概率,并最终输出预测的实体范围及其对应的类别;利用损失函数,衡量模型输出与真实标签之间的差异,并最小这种差异化来训练模型。本发明能够有效学习领域相关知识,提高了模型在面对含有噪声数据时的稳定性和泛化性;能够更加全面挖掘和利用标签注释中的语义信息。
-
公开(公告)号:CN118861247A
公开(公告)日:2024-10-29
申请号:CN202411028225.8
申请日:2024-07-30
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F16/332 , G06F40/194 , G06N3/08 , G06Q40/04 , G06F16/35 , G06N3/045
摘要: 本发明涉及一种金融领域问答式文本生成方法,属于自然语言处理技术领域,包括:获取用户的输入文本;在知识库中对所述输入文本进行召回检索,得到召回结果;将所述输入文本和召回结果输入第一大语言模型,输出初始回答;将所述输入文本和初始回答输入第二大语言模型,第二大语言模型基于所述输入文本提取并输出所述初始回答中的数学表达式;将所述数学表达式输入计算工具进行计算,输出计算结果;将所述初始回答和所述计算结果输入第三大语言模型,以修正所述初始回答,输出最终回答。本发明将整个生成回答文本的过程分阶段进行,保证了结果的准确性,降低了模型出现幻觉的可能。
-
公开(公告)号:CN118861207A
公开(公告)日:2024-10-29
申请号:CN202411114133.1
申请日:2024-08-14
申请人: 南京网慧科技有限公司
发明人: 屈新宇
IPC分类号: G06F16/33 , G06F16/335 , G06F18/213 , G06F18/2415 , G06F40/194
摘要: 本发明公开了基于多渠道数据的用户行为分析方法、装置及电子设备,涉及行为分析领域,所述用户行为分析方法包括以下步骤:步骤1:请求用户授权,获取身份I D,基于当前身份I D下所有适配可读类型的应用程序的登录并访问其操作日志和行为统计;步骤2:监测用户在应用程序中的检索行为,记录其搜索的关键词、停留时间和点击的搜索结果信息,进行分析,计算每个关键词的关注度;步骤3:监测用户在推荐内容中的行为,记录其查看的推荐列表、点击的推荐项和推荐内容的转化率,通过整合多渠道数据、精准计算关键词和推荐内容关注度、构建用户偏好模型,并动态调整推荐内容,提高了推荐系统的准确性和用户满意度。
-
-
-
-
-
-
-
-
-