同义词替换表的挖掘方法及装置、电子设备、计算机可读介质

    公开(公告)号:CN111475621A

    公开(公告)日:2020-07-31

    申请号:CN202010260098.X

    申请日:2020-04-03

    Inventor: 翟周伟

    Abstract: 本公开提供了一种同义词替换表的挖掘方法,其包括:对平行语料进行同义词改写,获得平行语料对齐样本;其中,平行语料对齐样本包括第一侧语料、第二侧语料、第一侧语料中的词和第二侧语料中的词;将平行语料对齐样本转换成序列标注样本;基于序列标注样本训练模型,获得序列标注对齐模型,再利用序列标注对齐模型改写平行语料;基于序列标注对齐模型生成同义词替换表。该同义词替换表的挖掘方法抛弃了繁琐的自然语言处理规则,而且降低了维护成本,提高了同义词替换表的精度。本公开还提供了一种同义词替换表的挖掘装置、电子设备和计算机可读介质。

    对话源数据处理方法及装置、电子设备、计算机可读介质

    公开(公告)号:CN111339767A

    公开(公告)日:2020-06-26

    申请号:CN202010107942.5

    申请日:2020-02-21

    Inventor: 翟周伟

    Abstract: 本公开提供了一种对话源数据处理方法,其包括:步骤101,基于对话源数据获取有效对话源数据;步骤102,利用所述有效对话源数据获取对话样本;步骤103,基于所述对话样本构建切词模型;步骤104,将所述切词模型应用于对话系统,并依据用户行为获得新的所述对话源数据,并将新获得的所述对话源数据返回至步骤101。该对话源数据处理方法获得大规模、高精度的对话样本,并自适应地对对话系统进行提升,从而提高切词的准确率。本公开还提供了一种对话源数据处理装置、电子设备、计算机可读介质。

    对话源数据处理方法及装置、电子设备、计算机可读介质

    公开(公告)号:CN111339767B

    公开(公告)日:2023-07-21

    申请号:CN202010107942.5

    申请日:2020-02-21

    Inventor: 翟周伟

    Abstract: 本公开提供了一种对话源数据处理方法,其包括:步骤101,基于对话源数据获取有效对话源数据;步骤102,利用所述有效对话源数据获取对话样本;步骤103,基于所述对话样本构建切词模型;步骤104,将所述切词模型应用于对话系统,并依据用户行为获得新的所述对话源数据,并将新获得的所述对话源数据返回至步骤101。该对话源数据处理方法获得大规模、高精度的对话样本,并自适应地对对话系统进行提升,从而提高切词的准确率。本公开还提供了一种对话源数据处理装置、电子设备、计算机可读介质。

    一种信息处理方法及装置、电子设备、存储介质

    公开(公告)号:CN110569376B

    公开(公告)日:2022-05-31

    申请号:CN201910884595.4

    申请日:2019-09-18

    Inventor: 王涛 翟周伟

    Abstract: 本申请公开了一种信息处理方法及装置、电子设备、存储介质,涉及语义分析领域。具体实现方案为:获取到文本数据,所述文本数据表征有用于控制输出设备的控制信息;获取基于所述文本数据中所述控制信息所得到输出结果;提取所述文本数据的语义特征;将所述语义特征输入预设模型,得到所述语义特征在预设语义维度上的参数值,所述预设模型至少设置有表征预设语义维度的参数;基于所述语义特征在预设语义维度上的参数值,确定对所述输出结果的输出策略。这样,利用输出策略来规范输出结果,以确保输出结果合规。

Patent Agency Ranking