Patent search ap:("科大讯飞股份有限公司") AND inv:"熊世富" Page 6

51.

发明公开
摘要生成方法、装置、智能终端和计算机可读存储介质审中-实审

公开(公告)号：CN116719927A

公开(公告)日：2023-09-08

申请号：CN202310492894.X

申请日：2023-04-28

Applicant: 科大讯飞股份有限公司

Inventor： 高建清 , 王玮 , 苏文畅 , 戚婷 , 江嘉辉 , 孔常青 , 闫莉 , 徐迪迪 , 熊世富 , 潘嘉 , 刘聪 , 胡国平 , 魏思 , 王士进 , 刘权

IPC: G06F16/34 , G06F16/33 , G06F40/186 , G06F40/30 , G06F3/0482 , G06F3/04842 , G06F3/0486 , G06F3/04883

Abstract: 本申请公开了一种摘要生成方法、装置、智能终端和计算机可读存储介质，该方法包括：获取用户在待处理文本中选择的已选中文本；至少基于所述已选中文本，得到摘要文本；展示所述摘要文本。上述方案，能够提高获取摘要文本的便捷度。

52.

发明公开
多媒体内容分析方法、装置、设备及存储介质审中-实审

公开(公告)号：CN116702749A

公开(公告)日：2023-09-05

申请号：CN202310688497.X

申请日：2023-06-09

Applicant: 科大讯飞股份有限公司

Inventor： 于继栋 , 刘杰 , 熊世富 , 李兵 , 杨涵 , 林金城 , 邹灵犀 , 赵旨遒 , 金冰敏 , 孙洪山 , 汪佳 , 刘谢霞 , 胡国平 , 刘聪 , 王士进 , 魏思 , 刘权 , 马天宇 , 杨文亮

IPC: G06F40/205 , G06V30/41 , G06V20/40

Abstract: 本申请公开了一种多媒体内容分析方法、装置、设备及存储介质，本申请可以对文章、图像、视频中的任意一种内容进行分析，首先提取待分析的目标多媒体内容的标题及封面，采用图像识别算法将封面转换为封面文本信息。在此基础上，调用大语言模型，对标题及封面文本信息分别进行各设定维度的分析处理，以得到标题分析结果和封面分析结果。本申请可以充分借助大语言模型的理解、总结能力，实现对待分析的目标多媒体内容的标题、封面的分析，从各个设定维度对目标多媒体内容的标题、封面进行拆解分析，得到目标多媒体内容的标题及封面的分析结果，可以从标题、封面的角度更好的帮助用户理解、学习目标多媒体内容的特点，提升用户的创作能力。

53.

发明公开
一种信息生成方法、装置、设备、存储介质及系统审中-实审

公开(公告)号：CN116701588A

公开(公告)日：2023-09-05

申请号：CN202310688506.5

申请日：2023-06-09

Applicant: 科大讯飞股份有限公司

Inventor： 刘聪 , 于继栋 , 刘杰 , 熊世富 , 李兵 , 杨涵 , 林金城 , 邹灵犀 , 赵旨遒 , 金冰敏 , 孙洪山 , 汪佳 , 刘谢霞 , 胡国平 , 王士进 , 魏思 , 刘权 , 马天宇 , 杨文亮

IPC: G06F16/332 , G06F16/335 , G06F40/186

Abstract: 本发明提供了一种信息生成方法、装置、设备、存储介质及系统，其中，方法包括：当接收到目标用户的输入信息时，获取目标用户的用户特性信息，用户特性信息根据目标用户的资源信息库中的资源信息确定，用户特性信息能够表征目标用户的用户特性；调用预置的大语言模型，基于输入信息以及用户特性信息，生成输入信息对应的回复信息。由于本发明在生成输入信息对应的回复信息时，引入了用户特性信息，因此，最终可生成个性化的回复信息，另外，由于本发明基于具有超强的语义理解及信息生成能力的大语言模型生成输入信息对应的回复信息，因此，可生成高质量的回复信息，即，本发明针对用户输入信息能够生成个性化、高质量的回复信息，用户体验较好。

54.

发明公开
标点添加方法、服务器和客户端设备审中-实审

公开(公告)号：CN116629213A

公开(公告)日：2023-08-22

申请号：CN202310445263.2

申请日：2023-04-21

Applicant: 科大讯飞股份有限公司

Inventor： 金泽群 , 许丽 , 万根顺 , 熊世富 , 高建清 , 潘嘉 , 刘聪

IPC: G06F40/166 , G06N3/0455 , G06N3/0985 , G10L15/26

Abstract: 本发明提供一种标点添加方法、服务器和客户端设备，涉及自然语言处理技术领域，该方法包括：接收客户端设备发送的待添加标点的初始文本，并提取初始文本的文本特征；基于用户行为特征、文本特征和标点预测模型确定初始文本的标点预测结果；基于标点预测结果为初始文本添加标点，得到目标文本，并将目标文本发送给客户端设备；其中，用户行为特征用于表征用户的标点添加习惯；标点预测模型是基于不同用户的带标点样本文本和带标点样本文本对应的用户行为样本特征，对初始标点预测模型进行训练得到的。本发明提供的技术方案能够实现个性化的文本标点预测，得到与用户标点使用习惯相匹配的带标点文本，个性化程度高。

55.

发明公开
机器人流程自动化方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN116562807A

公开(公告)日：2023-08-08

申请号：CN202310506124.6

申请日：2023-05-05

Applicant: 科大讯飞股份有限公司

Inventor： 高建清 , 黄鹏 , 刘杰 , 熊世富 , 赵文珏 , 解明敏 , 钱银 , 王抄 , 胡国平 , 刘聪 , 魏思 , 王士进 , 刘权 , 于继栋 , 齐舒萱 , 汤熙

IPC: G06Q10/10 , G06F3/0483

Abstract: 本发明涉及人工智能技术领域，提供一种机器人流程自动化方法、装置、电子设备和存储介质，其中方法包括：获取需求文本；对所述需求文本进行流程拆解，得到所述需求文本所对应的业务流程，以及所述业务流程对应的功能清单，所述功能清单包括业务流程中每个步骤所需调用的机器人流程自动化RPA引擎的功能项；基于所述RPA引擎，执行所述功能清单。本发明提供的机器人流程自动化方法、装置、电子设备和存储介质，能够实现针对各种不同场景下的需求文本，自动完成针对需求文本的执行流程，无需专业的技术人员进行相应需求文本的业务流程代码开发，降低开发成本，省时省力的同时提升机器人流程自动化的效率。

56.

发明公开
语音识别方法、装置、设备及存储介质审中-实审

公开(公告)号：CN115512695A

公开(公告)日：2022-12-23

申请号：CN202211134105.7

申请日：2022-09-15

Applicant: 科大讯飞股份有限公司

Inventor： 李鹏程 , 万根顺 , 潘嘉 , 熊世富 , 高建清 , 刘聪 , 刘庆峰

IPC: G10L15/06 , G10L15/08 , G10L15/26

Abstract: 本申请公开了一种语音识别方法、装置、设备及存储介质，本申请配置的语音识别模型通过第一语音分类层基于语音编码器输出的语音编码特征预测得到初始预测文本，文本编码器对初始预测文本进行编码，将文本编码特征和语音编码特征融合，将融合编码特征输入到共享编码器中进行二次编码，并由第二语音分类层基于二次编码特征得到最终预测文本。由于语音识别模型整体上能够提取到更加丰富的融合编码特征，因此能够进一步提升识别准确度。此外，由于语音识别模型包含有文本编码器和共享编码器，因而在训练过程可以额外使用纯文本数据对文本编码器和共享编码器进行训练，纯文本数据相比于语音的标注文本其更容易大量的获取，极大降低了人工标注成本。

57.

发明公开
一种语音识别方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN115410559A

公开(公告)日：2022-11-29

申请号：CN202211110266.2

申请日：2022-09-13

Applicant: 科大讯飞股份有限公司

Inventor： 朱菊霞 , 万根顺 , 孔常青 , 熊世富 , 潘嘉 , 刘聪

IPC: G10L15/06 , G10L15/07 , G10L15/26 , G10L17/02 , G10L17/06 , G10L25/30

Abstract: 本申请提供一种语音识别方法、装置、电子设备及存储介质，其中，所述语音识别方法，包括：从待识别的发言语音中提取声纹特征；根据所述声纹特征，判断所述发言语音对应的第一发言人是否具有语音转写权限；如果所述发言语音对应的第一发言人具有语音转写权限，则对所述发言语音进行语音识别处理，得到所述第一发言人的发言文本。该方案能够灵活决策是否对发言人的发言语音进行语音识别处理，从而提高了语音识别的灵活度，有利于缓解语音识别资源紧张和识别资源浪费的问题。

58.

发明授权
一种前馈序列记忆神经网络及其构建方法和系统有权

公开(公告)号：CN106919977B

公开(公告)日：2022-05-17

申请号：CN201510998704.7

申请日：2015-12-25

Applicant: 科大讯飞股份有限公司

Inventor： 张仕良 , 熊世富 , 魏思 , 潘嘉 , 刘聪 , 胡国平 , 胡郁 , 刘庆峰

IPC: G06N3/04

Abstract: 本发明公开了一种前馈序列记忆神经网络及其构建方法和系统，该前馈序列记忆神经网络包括：至少三层的多个节点，第一层为输入层，最后一层为输出层，其它位于输入层和输出层之间的多个节点组成至少一个隐层，每一个隐层都包含一个记忆块，隐层与记忆块共同构成双向前馈序列记忆神经网络FSMN层，该记忆块用于存储每帧输入信息的历史信息和未来信息。由于该双向FSMN层包括记忆块，通过该记忆块存储每帧输入信息的历史信息和未来信息，可以利用训练数据的长时信息，并且该过程无需通过双向循环反馈，可以保证信息处理效率。

59.

发明公开
语音交互方法、装置、电子设备及存储介质审中-实审转让

公开(公告)号：CN114171004A

公开(公告)日：2022-03-11

申请号：CN202111348349.0

申请日：2021-11-15

Applicant: 科大讯飞股份有限公司

Inventor： 王庆然 , 高万军 , 孔常青 , 万根顺 , 熊世富 , 高建清 , 刘聪 , 王智国 , 胡国平 , 陈志刚

IPC: G10L15/02 , G10L15/08 , G10L15/26 , G10L17/22

Abstract: 本发明提供一种语音交互方法、装置、电子设备及存储介质，其中方法包括：确定待分类语音；基于所述待分类语音的语音特征和韵律学特征，对所述待分类语音进行意图分类，得到语音意图分类结果；基于所述语音意图分类结果，确定是否基于所述待分类语音进行语音交互。本发明提供的方法、装置、电子设备及存储介质，能够通过对待分类语音的语音特征和韵律学特征对该语音进行语音意图分类，并根据该语音意图分类结果，判断是否进行语音交互，实现了在免唤醒词唤醒的前提下，准确地判断语音的意图，进而能够准确的唤醒并进行人机交互，提升了交互形式上的友好程度，并且提升了交互效果的稳定性。

60.

发明公开
语音同传方法、装置、介质及设备审中-公开

公开(公告)号：CN119785778A

公开(公告)日：2025-04-08

申请号：CN202411905938.8

申请日：2024-12-23

Applicant: 科大讯飞股份有限公司

Inventor： 周佳城 , 陆梦寒 , 熊世富 , 高建清 , 刘聪

IPC: G10L15/18 , G10L25/87 , G10L25/45 , G10L25/03 , G10L15/02 , G10L15/16 , G06F40/58

Abstract: 本申请实施例提供了一种语音同传方法、装置、计算机可读存储介质以及电子设备，涉及人工智能技术领域。该方法包括：获取待处理音频中第i个语音片段对应的第i语音特征向量；将第i语音特征向量输入经过训练的大语言模型，以通过大语言模型对第i语音特征向量进行语义完整性分析，其中，大语言模型的输出信息用于确定关于第i个语音片段的语义单元，语义单元的语义完整性满足第一预设条件；获取当前语义单元对应的背景语义信息，其中，背景语义信息包括在先语义单元的翻译结果；根据当前语义单元的语义特征向量和背景语义信息，确定当前语义单元对应的翻译结果。本申请实施例能够提升翻译结果的准确性和连贯性，有利于提升翻译质量。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification