基于围标串标智能识别的信息录入仪器

    公开(公告)号:CN216249241U

    公开(公告)日:2022-04-08

    申请号:CN202122303219.7

    申请日:2021-09-23

    摘要: 本实用新型提供有基于围标串标智能识别的信息录入仪器,包括防护箱和固定安装在防护箱内侧的信息录入仪器,所述防护箱的底部固定安装有抽风机。该基于围标串标智能识别的信息录入仪器,通过人工智能技术(自然语言处理技术NLP)分析电子投标文件中的非结构化信息,利用文本相似度、中心词提取、文本信息抽取等技术,计算出投标文件之间的相似度,投标文件中关键词、高频词等进行差异分析,对围标串标的可能性,做出预警判断,通过温度检测仪能够对信息录入仪器内部的温度进行检测,进而控制降温机构对送风机输送的风进行降温处理,从而有效的对仪器内部进行降温,以保证信息录入仪器能够稳定的对投标文件进行识别处理。

    一种合同内容校阅装置
    2.
    实用新型

    公开(公告)号:CN217982425U

    公开(公告)日:2022-12-06

    申请号:CN202221892574.0

    申请日:2022-07-20

    摘要: 本实用新型公开了一种合同内容校阅装置,包括扫描仪和电脑台式一体机,所述扫描仪上固定安装有摄像头,所述扫描仪内部连接有OCR文字识别系统和控制单元,所述扫描仪和所述电脑台式一体机上连接有同一个数据线,所述OCR文字识别系统电性连接有字符识别模块,所述字符识别模块电性连接有版面分析模块,所述版面分析模块电性连接有字符切割模块,所述字符切割模块电性连接有文字图像预处理模块。本实用新型设计合理,实用性好,能够对客户寄回的纸质合同的文档内容进行准确的识别提取,可能够自动对识别提取的纸张合同的文档内容与电子版原始合同进行准确的校阅对比,使用效果好,能够满足使用需求。

    一种大语言模型幻觉检测方法及装置

    公开(公告)号:CN118966202A

    公开(公告)日:2024-11-15

    申请号:CN202411003683.6

    申请日:2024-07-25

    摘要: 本发明涉及自然语言处理技术领域,公开了一种大语言模型幻觉检测方法及装置,方法包括:利用大语言模型抽取利用参考文献的标题及描述信息构建的参考内容中的实体,构建参考内容实体集;利用大语言模型抽取生成内容中的实体,构建生成内容实体集;对生成内容实体集中的每个实体,将其与参考内容实体集中的实体进行匹配度计算,得到其与参考内容实体集的匹配度;基于匹配度,判断生成内容实体集中的每一个实体是否有参考文献支持,若均有参考文献支持,则确定生成内容不存在幻觉;否则,确定生成内容可能存在幻觉。基于两个实体集进行实体的匹配度计算,能够精确评估生成内容中每个实体的事实性,显著提升内容验证的精确度和效率。

    一种基于数字孪生技术的计算机系统多层风险监测方法

    公开(公告)号:CN118296604B

    公开(公告)日:2024-11-12

    申请号:CN202410727402.5

    申请日:2024-06-06

    摘要: 本发明属于计算机安全技术领域,涉及一种基于数字孪生技术的计算机系统多层风险监测方法,通过采集计算机系统内部数据,利用共现模型方法对采集数据进行实体和关系标注,构建计算机系统内部静态状态的知识图谱;通过有限状态机建立计算机系统对外部访问的状态及响应,构建计算机系统动态状态;通过计算机系统的静态状态和动态状态,构建基于数字孪生技术的孪生系统;通过对孪生系统外部访问的风险评估,由判断规则给出外部访问响应;上述方法设置两道防线保障系统安全;提前发现潜在故障点,减少系统维护时间和成本;同时,更全面地考虑数据中的风险因素,提高模型的灵活性和准确性。

    一种基于LLM2Vec算法的文本查重方法及系统

    公开(公告)号:CN118885602A

    公开(公告)日:2024-11-01

    申请号:CN202410954853.2

    申请日:2024-07-17

    发明人: 张超

    摘要: 本发明公开了一种基于LLM2Vec算法的文本查重方法及系统,用于文本查重技术领域,该基于LLM2Vec算法的文本查重方法及系统包括以下步骤:使用LLM2Vec算法将文本转换为特征向量;利用余弦相似度方法计算各特征向量之间的余弦相似度;预设相似度阈值,将计算得到的余弦相似度与相似度阈值比较,并判断本文之间是否相似。本发明通过生成高质量文本向量表示的文本编码器,不仅能够捕捉文本的丰富语义信息,还能够区分不同文本之间的细微差别,这对于各种自然语言处理任务都是非常有价值的。

    一种对抗式阅读理解嵌套命名实体识别方法

    公开(公告)号:CN118446218B

    公开(公告)日:2024-11-01

    申请号:CN202410606985.6

    申请日:2024-05-16

    摘要: 本发明公开了一种对抗式阅读理解嵌套命名实体识别方法,具体为:利用BERT模型对输入文本信息和标签注释进行初始嵌入,通过Star‑Transformer对文本信息执行编码操作;标签注释信息同时利用注意力机制、平均池化和余弦相似度三种方式综合分析;模型在文本信息与标签注释信息融合之后采用FGM算法计算噪声干扰并加入;计算文本中每个token作为各类实体起始或结束位置的概率,并最终输出预测的实体范围及其对应的类别;利用损失函数,衡量模型输出与真实标签之间的差异,并最小这种差异化来训练模型。本发明能够有效学习领域相关知识,提高了模型在面对含有噪声数据时的稳定性和泛化性;能够更加全面挖掘和利用标签注释中的语义信息。

    一种金融领域问答式文本生成方法

    公开(公告)号:CN118861247A

    公开(公告)日:2024-10-29

    申请号:CN202411028225.8

    申请日:2024-07-30

    摘要: 本发明涉及一种金融领域问答式文本生成方法,属于自然语言处理技术领域,包括:获取用户的输入文本;在知识库中对所述输入文本进行召回检索,得到召回结果;将所述输入文本和召回结果输入第一大语言模型,输出初始回答;将所述输入文本和初始回答输入第二大语言模型,第二大语言模型基于所述输入文本提取并输出所述初始回答中的数学表达式;将所述数学表达式输入计算工具进行计算,输出计算结果;将所述初始回答和所述计算结果输入第三大语言模型,以修正所述初始回答,输出最终回答。本发明将整个生成回答文本的过程分阶段进行,保证了结果的准确性,降低了模型出现幻觉的可能。

    基于多渠道数据的用户行为分析方法、装置及电子设备

    公开(公告)号:CN118861207A

    公开(公告)日:2024-10-29

    申请号:CN202411114133.1

    申请日:2024-08-14

    发明人: 屈新宇

    摘要: 本发明公开了基于多渠道数据的用户行为分析方法、装置及电子设备,涉及行为分析领域,所述用户行为分析方法包括以下步骤:步骤1:请求用户授权,获取身份I D,基于当前身份I D下所有适配可读类型的应用程序的登录并访问其操作日志和行为统计;步骤2:监测用户在应用程序中的检索行为,记录其搜索的关键词、停留时间和点击的搜索结果信息,进行分析,计算每个关键词的关注度;步骤3:监测用户在推荐内容中的行为,记录其查看的推荐列表、点击的推荐项和推荐内容的转化率,通过整合多渠道数据、精准计算关键词和推荐内容关注度、构建用户偏好模型,并动态调整推荐内容,提高了推荐系统的准确性和用户满意度。