-
公开(公告)号:CN110516213A
公开(公告)日:2019-11-29
申请号:CN201910828514.9
申请日:2019-09-03
Applicant: 哈尔滨工业大学
Abstract: 一种基于表格层次化建模的结构化数据生成文本方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决现有结构化数据生成文本只利用了数据本身单一信息,无法衡量实体数据整体情况以及同类型数据的表现差异和多表格数据之间的利用不充分问题。一、将数据集的记录用三元组表示,分别对每条记录所属的行、列维度建模得到该记录的行向量、列向量,并引入时间轴,对不同日期的同类型数据建模得到该记录的时间向量;二、融合行向量、列向量和时间向量得到该记录新的向量表示;三、对每行记录的新向量进行均值池化得到新行向量;四、每个解码时刻,对三得到的向量进行解码,得到当前时刻每条记录的权重。本发明用于表格数据生成文本方法。
-
公开(公告)号:CN110516213B
公开(公告)日:2022-04-15
申请号:CN201910828514.9
申请日:2019-09-03
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/166 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 一种基于表格层次化建模的结构化数据生成文本方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决现有结构化数据生成文本只利用了数据本身单一信息,无法衡量实体数据整体情况以及同类型数据的表现差异和多表格数据之间的利用不充分问题。一、将数据集的记录用三元组表示,分别对每条记录所属的行、列维度建模得到该记录的行向量、列向量,并引入时间轴,对不同日期的同类型数据建模得到该记录的时间向量;二、融合行向量、列向量和时间向量得到该记录新的向量表示;三、对每行记录的新向量进行均值池化得到新行向量;四、每个解码时刻,对三得到的向量进行解码,得到当前时刻每条记录的权重。本发明用于表格数据生成文本方法。
-
公开(公告)号:CN111310927B
公开(公告)日:2022-04-15
申请号:CN202010061962.3
申请日:2020-01-19
Applicant: 哈尔滨工业大学
Abstract: 一种引入推理机制的文本生成方法,本发明涉及文本生成方法。本发明的目的是为了解决现有数据生成文本中数据信息推理表格信息中隐含信息准确率低的问题。过程为:一、用#号替换表格数据信息对应的新闻报告中能推理的数字;二、得到同一实体的总体表示;三、采用解码器LSTM对得到的同一实体的总体表示进行解码,生成每个三元组的权重;解码器根据三元组权重生成具体的文字;若生成的文字是#号,触发推理按钮,生成计算序列,将计算序列得到的结果返回触发推理按钮位置,替换#号,解码器继续依次生成文字,直到文字生成了EOS结束标识,文字生成结束;得到神经网络网格推理模型。本发明用于NLP领域数据到文本领域。
-
公开(公告)号:CN110609986A
公开(公告)日:2019-12-24
申请号:CN201910940399.4
申请日:2019-09-30
Applicant: 哈尔滨工业大学
Abstract: 一种基于预训练的结构化数据生成文本的方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决在结构化数据生成文本上,现有模型对表格数据进行建模时,没有考虑数据之间的内在隐含关系,导致文本生成准确率低的问题。过程为:一、随机MASK掉若干个三元组中一个三元组中的一个数据,用@代替;根据表格中数据间具有的计算序列关系得到表征@隐去的计算序列;二、得到表格中同一行的所有记录均值池化后的行向量;三、得到预训练模型,保留预训练模型的参数;四:得到表格行向量;五:验证步骤三的预训练模型;六:得到对表格中同一行的所有记录进行均值池化后的行向量;七:得到表格中数据代表的信息。本发明用于生成文本领域。
-
公开(公告)号:CN110609986B
公开(公告)日:2022-04-05
申请号:CN201910940399.4
申请日:2019-09-30
Applicant: 哈尔滨工业大学
IPC: G06F40/126 , G06F40/18 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 一种基于预训练的结构化数据生成文本的方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决在结构化数据生成文本上,现有模型对表格数据进行建模时,没有考虑数据之间的内在隐含关系,导致文本生成准确率低的问题。过程为:一、随机MASK掉若干个三元组中一个三元组中的一个数据,用@代替;根据表格中数据间具有的计算序列关系得到表征@隐去的计算序列;二、得到表格中同一行的所有记录均值池化后的行向量;三、得到预训练模型,保留预训练模型的参数;四:得到表格行向量;五:验证步骤三的预训练模型;六:得到对表格中同一行的所有记录进行均值池化后的行向量;七:得到表格中数据代表的信息。本发明用于生成文本领域。
-
公开(公告)号:CN111310927A
公开(公告)日:2020-06-19
申请号:CN202010061962.3
申请日:2020-01-19
Applicant: 哈尔滨工业大学
Abstract: 一种引入推理机制的文本生成方法,本发明涉及文本生成方法。本发明的目的是为了解决现有数据生成文本中数据信息推理表格信息中隐含信息准确率低的问题。过程为:一、用#号替换表格数据信息对应的新闻报告中能推理的数字;二、得到同一实体的总体表示;三、采用解码器LSTM对得到的同一实体的总体表示进行解码,生成每个三元组的权重;解码器根据三元组权重生成具体的文字;若生成的文字是#号,触发推理按钮,生成计算序列,将计算序列得到的结果返回触发推理按钮位置,替换#号,解码器继续依次生成文字,直到文字生成了EOS结束标识,文字生成结束;得到神经网络网格推理模型。本发明用于NLP领域数据到文本领域。
-
-
-
-
-