中文汉语到盲文的自动转换方法

    公开(公告)号:CN1119759C

    公开(公告)日:2003-08-27

    申请号:CN01118675.5

    申请日:2001-06-08

    Applicant: 清华大学

    Abstract: 本发明属于计算机文字处理技术领域,涉及中文汉语到盲文的自动转换方法,包括:首先对非汉语符号进行预切分处理,读入一段连续的汉字串,根据词汇表分别用MM法和RMM法进行分词;比较MM和RMM分词结果是否相同,相同,记录分词结果;分词结果不相同,构造歧义字段的歧义树,搜索最优分词结果,记录分词结果;判断文本分词是否完毕,若是,按照盲文分词连写规则对分词结果进行修改,生成分词结果对应的盲文点字。使用该方法,三字以上的词很少有多音现象。具有特殊符号输入转换。可在文档中输入、转换数学符号。可以加入其它特殊字符库,转换后的盲文可以修改保存,并且能够在Windows下进行盲文打印。转换正确率在98%以上。

    汉语盲文到汉字的自动转换方法

    公开(公告)号:CN1323004A

    公开(公告)日:2001-11-21

    申请号:CN01118674.7

    申请日:2001-06-08

    Applicant: 清华大学

    Abstract: 本发明属于计算机文字处理技术领域,其特征在于,将盲文书籍扫描后识别盲文,或用键盘将盲文输入后,将盲文通过拼音的概念转换为汉字;所说的拼音与汉字转换的每一个环节,利用汉语盲文综合知识库,在带转移概率权重的拼音到汉字转换搜索图上采用viterbi搜索方法得到N个有序最佳结果,来实现由盲文到汉字的自动转换。使得系统整体转换正确率达到97%以上。

    一种数据处理方法及相关装置
    63.
    发明公开

    公开(公告)号:CN117009649A

    公开(公告)日:2023-11-07

    申请号:CN202310802390.3

    申请日:2023-06-30

    Abstract: 一种数据处理方法,可以应用于人工智能领域,方法包括:获取第一训练样本,所述第一训练样本指示所述第一用户对所述第一物品进行了第一行为、且未进行第二行为;根据所述第一属性信息、以及所述第一行为的时间和第一截止时间的时间间隔,通过第一模型,预测所述第一用户会对所述第一物品进行第二行为的概率,根据所述概率对第二模型对应的第一损失进行调整,得到调整后的损失;根据所述调整后的损失,更新所述第二模型。本申请通过第一模型来预测用户在第一行为之后会进行第二行为的概率,并基于该概率来调整标签,也就是调整损失函数,调整后的损失函数可以在理论上和理想损失函数之间不存在偏差,从而提高了训练后的推荐模型的推荐精度。

    网页搜索方法及装置、电子设备和存储介质

    公开(公告)号:CN114020158B

    公开(公告)日:2023-07-25

    申请号:CN202111423899.4

    申请日:2021-11-26

    Applicant: 清华大学

    Abstract: 本公开涉及一种网页搜索方法及装置、电子设备和存储介质,所述方法包括:获取脑电信息中的稳态视觉诱发电位,所述稳态视觉诱发电位是在用户注视视觉拼写页面中查询键盘上的按键时产生的,向服务器发送该稳态视觉诱发电位,以使服务器根据稳态视觉诱发电位确定用户输入的字符串,以及与所述字符串对应的访达页面,并响应于接收到服务器发送的访达页面,显示访达页面。本公开实施例输入字符串后可显示最可能直接满足用户信息需求的访达页面,有利于通过尽可能少的页面来满足用户的信息需求,高效快速地满足用户的信息需求,并实时检测用户的搜索反馈,动态调整搜索结果,降低用户在网络搜索时交互操作的复杂度,提高用户的搜索体验。

    反馈指标预测模型训练方法、对象推荐方法及相关设备

    公开(公告)号:CN114064748A

    公开(公告)日:2022-02-18

    申请号:CN202111254337.1

    申请日:2021-10-27

    Abstract: 本公开关于反馈指标预测模型训练方法、对象推荐方法及相关设备,其中训练方法包括:获取基于随机投放实验得到的样本对象的随机投放信息;随机投放信息表征随机投放的用户账户对样本对象的反馈;根据样本对象对应的随机投放信息,确定样本对象对应的目标反馈指标;根据样本对象在历史推荐中的第一历史反馈信息序列,确定样本对象对应的历史反馈特征;根据样本对象对应的历史反馈特征和目标反馈指标训练预设机器学习模型得到反馈指标预测模型;其中,目标反馈指标作为历史反馈特征对应的期望预测值。本公开提高了反馈指标预测模型对于物品价值预测的准确性,进而有利于提高各物品的展示机会与其真正价值的匹配性。

    网页搜索方法及装置、电子设备和存储介质

    公开(公告)号:CN114020158A

    公开(公告)日:2022-02-08

    申请号:CN202111423899.4

    申请日:2021-11-26

    Applicant: 清华大学

    Abstract: 本公开涉及一种网页搜索方法及装置、电子设备和存储介质,所述方法包括:获取脑电信息中的稳态视觉诱发电位,所述稳态视觉诱发电位是在用户注视视觉拼写页面中查询键盘上的按键时产生的,向服务器发送该稳态视觉诱发电位,以使服务器根据稳态视觉诱发电位确定用户输入的字符串,以及与所述字符串对应的访达页面,并响应于接收到服务器发送的访达页面,显示访达页面。本公开实施例输入字符串后可显示最可能直接满足用户信息需求的访达页面,有利于通过尽可能少的页面来满足用户的信息需求,高效快速地满足用户的信息需求,并实时检测用户的搜索反馈,动态调整搜索结果,降低用户在网络搜索时交互操作的复杂度,提高用户的搜索体验。

    一种检索方法、模型训练方法及相关装置

    公开(公告)号:CN113626677A

    公开(公告)日:2021-11-09

    申请号:CN202110745653.2

    申请日:2021-06-30

    Abstract: 本申请实施例公开了一种检索方法、模型训练方法及相关装置,该方法包括:根据用户输入的查询数据获取关键词信息,根据查询数据的关键词信息通过主题分布模型提取主题分布特征向量;根据多个候选数据中每个候选数据的关键词信息通过特征提取模型获取每个候选数据的特征向量;根据主题分布特征向量与每个候选数据的特征向量计算查询数据和每个候选数据的相关性数值;根据相关性数值呈现多个候选数据中的至少一个。该方法基于主题分布特征向量计算查询数据和每个候选数据的相关性数值,即考虑了主题维度,避免未考虑主题维度而导致相关性数值的准确度较低的情况,从而可以提高检索的准确度。

    结合实体描述的知识图谱表示学习方法和系统

    公开(公告)号:CN106886543B

    公开(公告)日:2020-01-17

    申请号:CN201510947068.5

    申请日:2015-12-16

    Applicant: 清华大学

    Abstract: 本发明提供了一种结合实体描述的知识图谱表示学习方法和系统,本发明中,提出基于连续词袋的模型以及基于卷积神经网络的模型两种模型构建实体基于描述的向量表示。不仅利用了实体之间的三元组关系信息,也利用了实体描述中蕴含的文本信息,使用模型学习得到的两种实体向量表示方式,能够在知识图谱补全以及实体分类等任务中得到更高的准确率;同时基于描述的向量表示通过文本信息构建实体向量,能够很好地对新实体或训练集中不存在的实体进行表示,具有良好的实用性。

    结合实体描述的知识图谱表示学习方法和系统

    公开(公告)号:CN106886543A

    公开(公告)日:2017-06-23

    申请号:CN201510947068.5

    申请日:2015-12-16

    Applicant: 清华大学

    Abstract: 本发明提供了一种结合实体描述的知识图谱表示学习方法和系统,本发明中,提出基于连续词袋的模型以及基于卷积神经网络的模型两种模型构建实体基于描述的向量表示。不仅利用了实体之间的三元组关系信息,也利用了实体描述中蕴含的文本信息,使用模型学习得到的两种实体向量表示方式,能够在知识图谱补全以及实体分类等任务中得到更高的准确率;同时基于描述的向量表示通过文本信息构建实体向量,能够很好地对新实体或训练集中不存在的实体进行表示,具有良好的实用性。

    基于块对角矩阵的推荐方法和装置

    公开(公告)号:CN103336831B

    公开(公告)日:2017-04-12

    申请号:CN201310286998.1

    申请日:2013-07-09

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于块对角矩阵的推荐方法和系统,具体公开了一种基于块对角矩阵的推荐方法,其包括:步骤S1:对用户行为日志进行预处理;步骤S2:将预处理的结果转换为迭代双边块对角矩阵;步骤S3:由所述迭代双边块对角矩阵构建对角块矩阵;以及步骤S4:利用所述对角块矩阵进行评分预测。

Patent Agency Ranking