-
公开(公告)号:CN115705355A
公开(公告)日:2023-02-17
申请号:CN202110936134.4
申请日:2021-08-16
Applicant: 北京神州泰岳软件股份有限公司
Inventor: 何晓艺
IPC: G06F16/33 , G06F16/332 , G06F40/284
Abstract: 本申请公开了意图识别方法及装置,该方法预先根据多个已知意图的问题文本生成特征向量,并保存到预设向量库中。当产生待处理的第一问题文本时,首先根据第一问题文本生成问题向量,从上述预设向量库中获取与问题向量匹配的多个意图向量。由于这些意图向量与问题向量的特征匹配,因此意图向量与问题向量具有完全相同或者足够相似的意图。然后利用至少两种相似度算法,计算第一问题文本与每一个意图向量对应的第二问题文本的相似度,并对得到的至少两个相似度计算结果进行加权融合,最后将加权融合结果符合预设相似条件的第二问题文本对应的意图,确定为第一问题文本的候选意图。通过从多个算法维度来评估意图识别结果,使得意图识别结果更为准确。
-
公开(公告)号:CN119783819A
公开(公告)日:2025-04-08
申请号:CN202411851025.2
申请日:2024-12-16
Applicant: 北京神州泰岳软件股份有限公司
IPC: G06N5/04 , G06N5/022 , G06N5/02 , G06F16/31 , G06F16/3329 , G06F16/334 , G06F16/383 , G06V30/413 , G06V30/414
Abstract: 本申请提供一种基于大模型的多模态智能问答系统及构建方法、装置,该方法包括:对PDF文档进行区域识别,得到表格区域图片、文字区域图片和/或图像区域图片;对Word文档进行解析,得到Word文档的段落内容,段落内容是由第一文本、表格数据和/或Word图片构成的;构建知识库;其中,知识库中包括文档切片的向量表示;文档切片是基于表格区域图片、文字区域图片和/或图像区域图片确定的,或者,文档切片是基于段落内容及其对应的章节信息确定的。可见,本申请可以对PDF文档进行版面识别,还可以对Word文档进行目录章节的识别,基于此构建知识库,可以提升多模态文本问答召回的语义完整性和连贯性,提升回答准确性。
-
公开(公告)号:CN109033085A
公开(公告)日:2018-12-18
申请号:CN201810869254.5
申请日:2018-08-02
Applicant: 北京神州泰岳软件股份有限公司
IPC: G06F17/27
Abstract: 本发明实施例公开一种中文分词系统及分词方法,该分词系统包括:分词算法单元,用于为用户提供至少两种中文分词系统所支持的分词算法;分词模型单元,用于为用户提供至少两种中文分词系统所支持的第一分词模型;处理单元,用于确定用户从分词算法单元中选择的分词算法和从分词模型单元中选择的第一分词模型的类型是否对应;在对应的情况下,利用用户选择的分词算法以及第一分词模型对中文文本进行分词;在不对应的情况下,利用用户选择的分词算法以及类型与分词算法具有对应关系的第一分词模型,对中文文本进行分词。该中文分词系统降低了使用和调优门槛,便于用户调整分词流程,适应不同应用场景下的分词需求。
-
公开(公告)号:CN119226506A
公开(公告)日:2024-12-31
申请号:CN202310786567.5
申请日:2023-06-29
Applicant: 北京神州泰岳软件股份有限公司
Inventor: 何晓艺
IPC: G06F16/35 , G06F16/332 , G06F18/24 , G06F18/214 , G06F18/22 , G06F40/211 , G06F40/289 , G06F40/30
Abstract: 本申请提供了一种热点问题的确定方法和装置,能够及时准确地确定热点问题,提升确定热点问题的效率,避免了采用人工方式确定热点问题,会造成人的工作量较大的问题的发生。该方法包括:确定会话平台系统实时获取的待处理语句;若所述待处理语句是第一个输入到所述会话平台系统的语句,根据所述待处理语句确定首个类簇;否则,计算所述待处理语句与已确定的类簇中基准语句的相似度,根据所述相似度确定所述待处理语句所属的类簇,所述基准语句为类簇中满足第一预设条件的语句;根据已确定的类簇中每一所述类簇包括的语句数量,确定热点问题。
-
公开(公告)号:CN109492109A
公开(公告)日:2019-03-19
申请号:CN201811399436.7
申请日:2018-11-22
Applicant: 北京神州泰岳软件股份有限公司
Abstract: 本申请实施例提供了一种信息热点挖掘方法及装置,其中,该方法包括:对采集的语料信息进行数据清洗和分词处理,得到样本语料;对样本语料进行依存句法分析,以从样本语料抽取预设句法成分对应的分词,作为样本语料的特征信息;将特征信息进行聚类得到多个聚类簇;确定热点聚类簇及其对应的热点类别,并将热点聚类簇中的特征信息作为对应热点类别的代表热点。由此,本申请实施例提供的技术方案,针对短语料信息包含信息量少的特点,将短语料中的特征信息进行聚类,使每个聚类簇包含大量同一类别的特征信息,从而,可以根据聚类簇中特征信息的数量等指标确定热点类别,解决了现有技术中无法从大量的短语料信息中挖掘出有价值的热点信息的问题。
-
公开(公告)号:CN308215023S
公开(公告)日:2023-09-08
申请号:CN202230718178.5
申请日:2022-10-28
Applicant: 北京神州泰岳软件股份有限公司
Designer: 何晓艺
Abstract: 1.本外观设计产品的名称:带基于可视化的编排图形用户界面的显示屏幕面板。
2.本外观设计产品的用途:用于运行程序并展示。
3.本外观设计产品的设计要点:在于屏幕中显示的图形用户界面内容。
4.最能表明设计要点的图片或照片:主视图。
5.无设计要点,省略后视图、俯视图、仰视图、左视图和右视图。
6.图形用户界面的用途:产品的图形用户界面是基于可视化编排的人机对话图形用户界面。
7.图形用户界面的人机交互方式:主视图展示的是基于可视化编排的人机对话的初始图形用户界面;图像界面中图纸的左侧操作包括“查询节点”、“对话节点”、“回复节点”和“判断节点”四个图标;图纸上方有五个图标,鼠标移动到图纸上方的图标处,会显示图标功能,在点击对话节点,再点击图纸上方的技能设置图标,进入界面变化状态图1;在界面变化状态图1中左侧呈现技能设置的页面,填入设置信息后,生成“开始节点”,点击保存,呈现界面变化状态图2;在界面变化状态图2中点击图纸上方的变量设置图标,呈现界面变化状态图3,进行编辑和操作后点击保存,回到界面变化状态图2;在主视图中,点击对话节点图标,进入界面变化状态图4;在界面变化状态图4中右侧呈现新增对话节点页面,向下滚动鼠标滚轮,进入界面变化状态图5;在界面变化状态图5中右侧呈现新增对话节点页面其余的部分,信息填入后,点击“保存设置”,生成一对话节点;在主视图中,点击查询节点图标,进入界面变化状态图6;在界面变化状态图6中右侧呈现编辑查询节点页面,向下滚动鼠标滚轮,进入界面变化状态图7;在界面变化状态图7中右侧呈现新增编辑查询节点页面其余的部分,编辑完成后点击保存设置;在主视图中,点击回复节点图标,进入界面变化状态图8;在界面变化状态图8中右侧呈现编辑回复节点页面,编辑完成后点击保存设置;按照上述节点编辑可编辑任意需求的技能编排流程,如界面变化状态图9,在界面变化状态图9中点击“保存”再点击“发布”完成技能编排流程;在界面变化状态图9中点击图纸上方的测试图标,进入界面变化状态图10;在界面变化状态图10中右侧呈现查询测试页面,可输入测试信息后,点击“发送”进行测试。
主视图可参考使用状态参考图1,界面变化状态图1‑10可参考使用状态参考图2‑11。
-
-
-
-
-