-
公开(公告)号:CN114357955B
公开(公告)日:2025-01-07
申请号:CN202111675834.9
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06F40/174 , G06F40/279 , G06F40/30 , G06F16/353 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06N3/084
Abstract: 本申请公开了一种自动填充信息的方法、装置、存储介质及设备,该方法包括:首先获取目标文档,然后将目标文档输入至预先构建的文本分类模型,识别得到目标文档对应的预设分类;接着将目标文档输入至其对应的预设分类下的语义分类模型,识别得到目标文档的语义信息,进而可以根据该语义信息,自动向目标人员推荐目标办公软件,并在目标人员触发运行目标办公软件时,自动回填相关办公信息。由于本申请是先利用文本分类模型对目标文档进行分类,再利用对应分类下的语义分类模型识别得到目标文档的语义信息,从而能够根据该语义信息自动为目标人员推荐目标办公软件并回填相关的办公信息,进而减少了目标人员的手动操作,提升了目标人员的办公效率。
-
公开(公告)号:CN114817553B
公开(公告)日:2024-12-13
申请号:CN202111396510.1
申请日:2021-11-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/295 , G06F40/30 , G06N3/02
Abstract: 本发明公开了一种知识图谱构建方法、知识图谱构建系统和计算设备,该方法包括:获取作为原始数据的文本,对所述文本进行篇章级知识抽取和句子级事件抽取,以获得知识抽取结果和事件抽取结果;以及对所述知识抽取结果和所述事件抽取结果进行知识融合,以获得知识图谱。本发明将知识图谱的概念从传统的静态知识三元组变为包含静态知识五元组以及动态事件知识在内的复合知识,使用篇章级要素抽取与要素关联,可以大大提升五元组的提取效率与召回率,使得知识结构化属性更强。
-
公开(公告)号:CN113836257B
公开(公告)日:2024-04-30
申请号:CN202111192582.4
申请日:2021-10-13
Applicant: 科大讯飞股份有限公司
IPC: G06F16/31 , G06F16/33 , G06F40/284
Abstract: 本申请提供了一种热词挖掘方法、装置、设备及存储介质,方法包括:获取目标文本中标题的表达向量,其中,目标文本包含所述标题和所述标题对应的正文;利用标题的信息确定正文中每个词对于正文表达的贡献度,并根据正文中每个词对于正文表达的贡献度确定正文的表达向量;根据标题的表达向量和正文的表达向量生成热词。本申请提供的热词挖掘方法能够及时挖掘出热词,且不涉及安全性和隐私性问题。
-
公开(公告)号:CN112507718B
公开(公告)日:2024-02-13
申请号:CN202011487631.2
申请日:2020-12-16
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/295 , G06F16/33
Abstract: 本申请提供了一种跨语种实体标注方法、装置、设备及存储介质,方法包括:获取标注出实体词的源语种文本和对应的目标语种文本,根据源语种文本和目标语种文本获取正样例集、负样例集和候选数据集,正样例集中的每个正样例表征源语种文本中的一个实体词,负样例集中的每个负样例表征源语种文本中的一个非实体词,候选数据集中的每个候选数据表征目标语种文本中的一个候选实体词,通过将候选数据集中的候选数据与正样例集和负样例集中的样例匹配,从候选数据集中的候选数据所表征的候选实体词中确定出实体词,并对确定出的实体词进行标注。本申请可从目标语种文本中标注出实体词,且标(56)对比文件Weiming Lu.Cross-Lingual EntityMatching for Heterogeneous Online Wikis.《Nature Language Processing and ChineseComputing》.2018,第887-899页.
-
公开(公告)号:CN109472030B
公开(公告)日:2023-11-24
申请号:CN201811333278.5
申请日:2018-11-09
Applicant: 科大讯飞股份有限公司
IPC: G06F40/289 , G06F40/30 , G06F16/332 , G06F16/35
Abstract: 本申请公开了一种系统回复质量的评价方法及装置,该方法包括:首先生成目标对话系统的系统评价指标,包括根据目标对话系统的每一选定回复与对应问题之间的主题相关度生成的第一评价指标、根据目标对话系统的每一选定回复与对应人工回复之间的语义相似度生成的第二评价指标、以及根据目标对话系统的每一选定回复为通用回复的可能性生成的第三评价指标中的至少一个,然后根据生成的系统评价指标,确定出目标对话系统的回复质量,可见,本申请在对目标对话系统的回复质量进行评价时,考虑了系统回复与问题之间的主题相关度、系统回复与人工回复之间的语义相似度以及系统回复为通用回复的可能性,从而能够更准确地评价目标对话系统的回复质量。
-
公开(公告)号:CN109918682B
公开(公告)日:2023-06-02
申请号:CN201910250747.5
申请日:2019-03-29
Applicant: 科大讯飞股份有限公司
IPC: G06F40/284 , G06F16/35
Abstract: 本申请公开了一种文本标注方法及装置,该方法包括:在获取到待标注的目标文本后,可以先确定出目标文本所属的特定领域,然后,利用该特定领域内的结构化数据,对目标文本中的各个词条进行语义槽标注。可见,本申请采用的标注依据是目标文本所属的特定领域的结构化数据,由于该结构化数据包含了各个字段以及每一字段下的值,且每个字段通常代表该特定领域内的语义槽,故而,可以利用该结构化数据对目标文本中的各个词条进行语义槽标注,而无需人工标注,从而降低了人工标注成本;此外,由于结构化数据的字段与字段值之间的对应关系是固定的,这使得基于该结构化数据进行语义槽标注,能够保证标注结果的一致性。
-
公开(公告)号:CN115455982A
公开(公告)日:2022-12-09
申请号:CN202210995846.8
申请日:2022-08-17
Applicant: 科大讯飞股份有限公司 , 联通在线信息科技有限公司 , 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请提出一种对话处理方法、装置、电子设备及存储介质,方法包括:至少基于当前对话文本预测得到当前对话文本对应的第一语义信息;其中,第一语义信息包括:领域信息、意图信息和语义槽信息;根据预先构建的对话知识图谱,对第一语义信息以及历史对话语义信息进行语义信息融合,得到第二语义信息,其中,历史对话语义信息为根据历史对话文本而确定的语义信息;根据第二语义信息,确定与第二语义信息对应的对话提示信息。采用本方案,对当前对话文本对应的第一语义信息以及历史对话文本对应的语义信息进行融合,可以实现对话状态追踪,准确把握各个对话之间依赖关系,从而能够确定更加准确的有益信息,因此能够提高对话管理的准确度。
-
公开(公告)号:CN111177296B
公开(公告)日:2022-12-06
申请号:CN201911400224.0
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种信息推荐方法、装置、电子设备及计算机存储介质,首先获取目标语音数据和出行数据;接着,根据所述目标语音数据确定潜在意图数据,所述潜在意图数据用于表示可能的出行意图;然后,根据所述出行数据和所述潜在意图数据确定目标意图数据;之后,根据所述目标意图数据确定推荐信息;最后,将所述推荐信息推送给目标用户。可以识别出用户出行的实际意图,并根据该意图向用户推荐符合该意图的相关信息,大大提升了推荐信息的精准度的同时也提高了用户的使用体验。
-
公开(公告)号:CN109062902B
公开(公告)日:2022-12-06
申请号:CN201810942947.2
申请日:2018-08-17
Applicant: 科大讯飞股份有限公司
IPC: G06F40/35
Abstract: 本申请公开了一种文本语义表达方法及装置,该方法包括:在获取到待表达的目标文本后,目标文本进行分词处理,以得到各个目标词语,然后对目标文本进行依存句法分析,以确定各个目标词语之间的依存关系,接着,可以根据各个目标词语之间的依存关系,对目标文本进行语义表达。可见,本申请实施例在获取到待表达的目标文本后,不再采用常见的one‑hot方式对目标文本进行语义表达,而是根据目标文本中各个目标词语之间的依存关系,对该目标文本进行语义表达,即,在对目标文本进行语义表达时考虑了文本中词语之间的语义关系,从而提高语义表达结果的准确性。
-
公开(公告)号:CN111400489B
公开(公告)日:2022-12-02
申请号:CN202010269479.4
申请日:2020-04-08
Applicant: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC: G06F16/34
Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
-
-
-
-
-
-
-
-