基于伪数据改进分词器以处理自然语言

    公开(公告)号:CN108124477B

    公开(公告)日:2021-06-15

    申请号:CN201680008451.7

    申请日:2016-02-01

    Inventor: 赵兵 E·张

    Abstract: 提供了用于训练分词器(词语分割器)的技术。在一种技术中,分词器切分标记串以识别单独标记或词语。语言模型基于识别的标记或词语而生成。关于诸如个人或公司的实体的词汇表被识别。词汇表可以是涉及实体的在线数据,例如新闻文章或社交网络的成员的简档页面。词汇表中的一些标记可以具有高于其它标记的权重。语言模型接受加权的词汇表作为输入并生成伪句子。替代地,正规表达式被用来生成伪句子。伪句子被用来训练分词器。

    测量并诊断城市环境中的噪音

    公开(公告)号:CN105940435A

    公开(公告)日:2016-09-14

    申请号:CN201480063989.9

    申请日:2014-09-12

    Inventor: Y·郑 E·张

    CPC classification number: G01H3/10 G06F17/30241 G08G1/0129 H04W4/02

    Abstract: 计算机系统使用提供噪音的位置、与噪音相关联的时戳、和噪音类别的数据记录来测量城市环境中的噪音。这样的数据记录相对于位置和时间两者而言是稀疏的。计算机系统还访问定义不同位置中的和不同时隙中的相关性的其它信息。这样的相关性数据可包括地理信息和历史采样数据。通过将这个相关的信息应用于关于噪音的稀疏数据记录,计算机系统可获得较大地理范围的噪音水平和噪音类别信息。这样的信息可基于所接收到的有关噪音的数据记录,通常在接收任何给定时隙的噪音数据之后的大约数分钟内,被持续提供。

    测量路网中的交通速度
    3.
    发明公开

    公开(公告)号:CN105723242A

    公开(公告)日:2016-06-29

    申请号:CN201480061559.3

    申请日:2014-08-26

    Inventor: 郑宇 E·张

    Abstract: 一种计算机系统测量路网上的交通速度。传感器随时间提供位置数据,例如路网上的车辆的采样(诸如一队车辆)的位置数据。来自车辆的采样的此位置数据关于路网中的路段和时间两者都是稀疏的。根据该位置数据,计算机系统生成样本数据,该样本数据将路段上所采样的车辆的速度关联到多个时隙中的时间点。计算机系统访问定义不同路段之间和不同时隙之间的相关的其它信息。计算机系统使用相关数据和稀疏样本数据得到对于至少当前时隙的该路网中的每个路段的至少平均测量速度。计算机系统可从平均车辆速度推断交通量,并随后计算环境数据。

    测量并诊断城市环境中的噪音的方法和系统

    公开(公告)号:CN105940435B

    公开(公告)日:2018-10-19

    申请号:CN201480063989.9

    申请日:2014-09-12

    Inventor: Y·郑 E·张

    Abstract: 计算机系统使用提供噪音的位置、与噪音相关联的时戳、和噪音类别的数据记录来测量城市环境中的噪音。这样的数据记录相对于位置和时间两者而言是稀疏的。计算机系统还访问定义不同位置中的和不同时隙中的相关性的其它信息。这样的相关性数据可包括地理信息和历史采样数据。通过将这个相关的信息应用于关于噪音的稀疏数据记录,计算机系统可获得较大地理范围的噪音水平和噪音类别信息。这样的信息可基于所接收到的有关噪音的数据记录,通常在接收任何给定时隙的噪音数据之后的大约数分钟内,被持续提供。

    测量路网中的交通速度
    6.
    发明授权

    公开(公告)号:CN105723242B

    公开(公告)日:2018-07-03

    申请号:CN201480061559.3

    申请日:2014-08-26

    Inventor: 郑宇 E·张

    Abstract: 一种计算机系统测量路网上的交通速度。传感器随时间提供位置数据,例如路网上的车辆的采样(诸如一队车辆)的位置数据。来自车辆的采样的此位置数据关于路网中的路段和时间两者都是稀疏的。根据该位置数据,计算机系统生成样本数据,该样本数据将路段上所采样的车辆的速度关联到多个时隙中的时间点。计算机系统访问定义不同路段之间和不同时隙之间的相关的其它信息。计算机系统使用相关数据和稀疏样本数据得到对于至少当前时隙的该路网中的每个路段的至少平均测量速度。计算机系统可从平均车辆速度推断交通量,并随后计算环境数据。

Patent Agency Ranking