-
公开(公告)号:CN112560450B
公开(公告)日:2024-02-13
申请号:CN202011442529.0
申请日:2020-12-11
Applicant: 科大讯飞股份有限公司
IPC: G06F40/232
Abstract: 本申请公开了一种文本纠错方法及装置,该方法包括:在获取到目标领域下的待纠错文本后,先从待纠错文本中确定待纠错对象,并根据该待纠错对象、通用混淆集和专用混淆集,确定该待纠错对象的候选混淆对象;再根据该待纠错文本、该待纠错对象和该待纠错对象的候选混淆对象,生成该待纠错文本对应的纠错后文本。其中,因通用混淆集用于记录通用易混淆对象对之间的对应关系,且专用混淆集用于记录目标领域下专用易混淆对象对之间的对应关系,使得基于通用混淆集和专用混淆集确定的候选混淆对象不仅包括通用易混淆对象,还包括在目标领域下特有的专用易混淆对象,如此使得该候选混淆对
-
公开(公告)号:CN117473954A
公开(公告)日:2024-01-30
申请号:CN202311383422.7
申请日:2023-10-24
Applicant: 科大讯飞股份有限公司
IPC: G06F40/126 , G06F40/289 , G06F40/151 , G06N3/0464
Abstract: 本申请提供了一种文本生成方法、装置、设备和存储介质,涉及人工智能技术领域。主要技术方案包括:利用大语言模型(LLM)的嵌入层获取文本模态的输入数据对应的特征表示;利用非文本模态对应的编码器对非文本模态的输入数据进行编码,得到非文本模态的输入数据对应的第一特征表示,利用非文本模态对应的转化器将第一特征表示转换至LLM的嵌入层采用的特征空间,得到非文本模态的输入数据的第二特征表示;对文本模态的输入数据对应的特征表示和非文本模态的输入数据对应的第二特征表示进行融合,将融合得到的特征表示提供给LLM,由LLM利用融合得到的特征表示生成输出文本。本申请能够提高LLM在多模态输入数据上的文本生成效果。
-
公开(公告)号:CN117409919A
公开(公告)日:2024-01-16
申请号:CN202311382036.6
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种数据处理方法、装置、电子设备及存储介质,所述数据处理方法,对预训练的生成式语言模型进行基于体检报告信息的预训练以及体检报告解读任务微调训练,得到能够基于体检信息进行体检报告解读的报告解析模型。在此基础上,从体检报告中获取体检信息,然后生成至少包含体检信息和体检报告解读任务描述信息的任务提示指令,将该任务提示指令输入上述预先训练的报告解析模型,即可得到对体检报告的解析结果。上述方案实现了体检报告的自动解读,因此能够提高体检报告解读效率。
-
公开(公告)号:CN117216226A
公开(公告)日:2023-12-12
申请号:CN202311386064.5
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06N3/0455
Abstract: 本申请公开了一种知识定位方法、装置、存储介质及设备,该方法包括:首先获取待回复的目标问题文本;并利用目标问题文本,基于预设信息搜索引擎进行信息检索和信息解析,得到与目标问题文本相关的目标文本,然后利用目标文本和目标问题文本构建定位提示指令prompt,输入至预先构建的知识定位模型,得到知识定位模型输出的与目标问题文本相关的文本信息,接着,将目标问题文本以及与其相关的文本信息,输入通用生成模型,得到通用生成模型输出的针对目标问题文本的答复内容。可见,本申请是利用预先构建知识定位模型和通用生成模型的进行答复内容中每个字符的逐次生成,不仅能够提高定位结果的准确性,还可以生成更精确的问题回复。
-
公开(公告)号:CN116580818A
公开(公告)日:2023-08-11
申请号:CN202310506338.3
申请日:2023-05-05
Applicant: 科大讯飞股份有限公司
IPC: G16H20/70 , G06F16/332
Abstract: 本申请公开了一种心理疏导方法、装置、设备及可读存储介质。该方案中,用户如果需要心理疏导,可发送心理疏导请求,在获取用户的心理疏导请求之后,首先生成心理疏导提示信息,然后,基于该心理疏导提示信息,向该用户进行主动发问,引导该用户进入多轮对话任务,在每轮对话任务的执行过程中,接收用户输入,并基于用户输入进行回复,最后基于多轮对话任务中的对话内容,即可生成能够指示该用户当前存在的心理问题以及针对该用户当前存在的心理问题的疏导建议的心理疏导结果,达到对用户进行心理疏导的目的。基于该方案,用户无需依赖心理学从业人员,即可实现心理疏导。
-
公开(公告)号:CN115985522A
公开(公告)日:2023-04-18
申请号:CN202211721173.3
申请日:2022-12-30
Applicant: 科大讯飞股份有限公司
IPC: G16H80/00 , G06F40/35 , G06F16/332 , G06F40/295 , G06N3/08 , G06N3/0464
Abstract: 本申请提供了语义识别方法、装置、电子设备及存储介质,具体实现方案为:获取患者的输入信息;基于所述输入信息和所述患者的历史诊疗信息,确定所述输入信息的语义向量;利用预设的文本与文本意图的对应关系,确定所述输入信息的语义向量对应的文本意图根据本申请的技术方案,能够准确地确定出输入信息所对应的文本意图。
-
公开(公告)号:CN112559745B
公开(公告)日:2023-01-17
申请号:CN202011442564.2
申请日:2020-12-11
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种确定热点事件的方法和相关装置,该方法包括:对目标领域的多个待挖掘文本进行聚类处理,将每个类簇中心对应的待挖掘文本确定为目标待挖掘文本;计算每个目标待挖掘文本与目标领域的知识图谱中每个事件的相似度;该知识图谱是基于目标领域的历史文本预先构建的,其中一条路径表示一个包括多个扩展语句的事件;判断相似度大于等于预设相似度时,确定该相似度对应的事件为热点事件。通过聚类对目标领域的多个待挖掘文本,计算每个类簇中心对应的待挖掘文本,与基于目标领域的历史文本预先构建的知识图谱中事件的相似度,将较大相似度对应的事件作为热点事件,能够直接自动挖掘得到目标领域的多个待挖掘文本所对应的热点事件。
-
公开(公告)号:CN111428017B
公开(公告)日:2022-12-02
申请号:CN202010214567.4
申请日:2020-03-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F40/35 , G06K9/62 , G10L15/22 , G10L25/30
Abstract: 本申请公开了一种人机交互优化方法以及相关装置。其中,人机交互优化方法包括:获取人机交互系统在当前的系统配置下生成的人机交互数据;利用人机交互数据,确定人机交互系统的交互得分;以及,利用系统配置,确定人机交互系统的语义得分;基于交互得分和语义得分,执行利用人机交互数据对人机交互系统的系统配置进行优化。上述方案,能够及时且低成本地进行人机交互优化。
-
公开(公告)号:CN109800879B
公开(公告)日:2022-02-01
申请号:CN201811574181.3
申请日:2018-12-21
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种知识库构建方法和装置,该方法包括:获取待构建知识库中已有的标准问以及与所述标准问关联的第一扩展问;根据所述标准问和所述第一扩展问,从待挖掘语料库中挖掘与所述标准问和所述第一扩展问语义匹配的第二扩展问;将所述第二扩展问从所述待挖掘语料库中转移存储至所述待构建知识库中,并将所述第二扩展问及与该第二扩展问语义匹配的所述标准问相关联,其中,存储至所述待构建知识库中的所述第二扩展问记为第一扩展问。本发明在构建知识库时,不需要人工标注,实现了知识库的自动构建,并节省了人力和财力,以及提升了知识库的构建效率、缩短了知识库的构建周期。
-
公开(公告)号:CN113807218A
公开(公告)日:2021-12-17
申请号:CN202111033018.8
申请日:2021-09-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请涉及一种版面分析方法、装置、计算机设备和存储介质。方法包括:获取目标文本图像中每一文本行的空间转换特征、位置特征及图像特征;根据每一文本行的空间转换特征与位置特征,获取每一文本行的关系编码特征,将每一文本行的关系编码特征与每一文本行的图像特征进行拼接,得到每一文本行的融合特征;对每一文本行的融合特征进行解码,得到每一文本行的版面信息类型。由于同时结合了空间转换特征及图像特征对文本图像的内容进行理解,而不是单一基于一种特征,从而分析结果比较精准。另外,每一文本行在分析时均结合了图像特征及空间转换特征,在其中一项特征识别错误的情况下,另一项特征也能够作为分析依据,从而提高了版面分析的容错率。
-
-
-
-
-
-
-
-
-