一种可扩展标记语言路径查询翻译为结构查询的方法

    公开(公告)号:CN1560763A

    公开(公告)日:2005-01-05

    申请号:CN200410004412.9

    申请日:2004-02-19

    Applicant: 北京大学

    Abstract: 本发明公开了一种可扩展标记语言路径查询XPath翻译为高效结构查询SQL的方法,包括:首先,在pre/post/parent_pre编码之上,定义了针对XPath中不同操作符号的SQL翻译模板,将XPaht翻译成为等价的SQL语句;其次,如果存在DTD,则可以利用DTD的结构信息,来进一步提高所翻译SQL的执行效率,本发明根据DTD构建了DTD树自动机,根据XPath构建了XPath树自动机,在DTD树自动机和XPath树自动机之上定义了乘积操作,根据乘积获取了另一个SQL表达式,估算该表达式和原有表达式的执行代价,选择执行代价低的SQL表达式,结束翻译过程。本发明的技术方案中,一方面利用了pre/post/parent_pre编码,以空间复杂性换取SQL执行的高效性;另一个方面,利用了DTD进行XPath查询进行进一步优化,由此,提高所翻译SQL的执行高效性。

    一种面向智能家居对话理解的用户意图识别方法及系统

    公开(公告)号:CN116151271A

    公开(公告)日:2023-05-23

    申请号:CN202211507697.2

    申请日:2022-11-25

    Abstract: 本发明公开了一种面向智能家居对话理解的用户意图识别方法及系统。本方法为:1)获取智能家居场景下的用户语料信息并将其存储到语料信息存储模块;用户语料信息包括文本格式的源域语料数据和目标域语料数据;源域语料数据为意图标注后样本数据;2)文本预处理模块对每一条目标域语料数据进行意图标注,得到目标域的样本数据;3)特征提取模块将源域的标注数据和目标域的标注数据分别编码为语义特征向量,得到各样本数据的语义特征向量;4)意图分类模型模块利用样本数据对小样本意图分类模型进行训练和检测;5)对于一查询语音,判定输出模块将该查询语音转化为文本后输入到训练检测后的小样本意图分类模型,预测输出该查询语音的意图类别。

    一种文本语言关联关系标注方法和装置

    公开(公告)号:CN111737951B

    公开(公告)日:2022-10-14

    申请号:CN201910212664.7

    申请日:2019-03-20

    Abstract: 本发明公开一种文本语言关联关系标注方法和装置。利用文本语言各信息抽取子任务的紧密关联性,设计一种不依赖具体模型的复合标注方法,能够自然地融合多种文本语言信息抽取任务,实现多种文本语言关联任务的联合学习与一体化的训练,如支持命名实体识别与命名实体标准化的联合学习、支持命名实体识别与实体关系抽取的联合学习、支持命名实体识别与实体消歧的联合学习等。本发明提出的文本语言关联关系复合标注方法,充分地利用了文本语言信息抽取的各子任务之间的紧密关联性,实现完全的联合学习,使得各关联任务之间可以信息共享相互促进,总体提升文本语言信息抽取的准确率与召回率。

    一种基于图结构的中文新词识别方法

    公开(公告)号:CN103970733B

    公开(公告)日:2017-07-14

    申请号:CN201410143875.7

    申请日:2014-04-10

    Abstract: 本发明涉及一种基于图结构的中文新词识别方法,其步骤包括:1)根据词之间的邻接关系将文档集抽象成有权有向图;2)遍历所述有权有向图的所有点,基于共现率选出每一个点的备选新词;3)对所述备选新词进行路径拓展,找到共现率始终大于阈值的最大权值路径,从而得到完整的备选新词;4)根据信息熵对所述完整的备选新词进行过滤,得到最终的备选新词集合。本发明首次提出了将文档集抽象为图结构进行新词发现和识别的方法,将新词发现问题转化为在有向有权图上的最大权重路径寻找问题,很好地利用了图的特点,是一种时间复杂度较低、召回率和准确率都较高的新词发现和识别方法。

    一种连续血压监测方法
    67.
    发明公开

    公开(公告)号:CN105411558A

    公开(公告)日:2016-03-23

    申请号:CN201410475483.0

    申请日:2014-09-16

    Abstract: 本发明公开了一种连续血压监测方法,本方法采用压力或震动传感器在体表感应人体动脉的搏动(压力或震动),产生相应的电信号。通过对该电信号的分析计算得出血压值。本方法与现有血压计采用方法的本质区别在于:本方法是在正常状态下采集人体体表动脉的搏动信号,并对该搏动信号分析计算得到血压值。采用本方法的连续血压监测仪器无需加压气泵,能够用于长期连续血压监测。

    一种连续血压监测装置
    68.
    发明公开

    公开(公告)号:CN105411555A

    公开(公告)日:2016-03-23

    申请号:CN201410475476.0

    申请日:2014-09-16

    Abstract: 本发明公开了一种连续血压监测装置,由脉搏传感器和主机两部分组成。所述脉搏传感器为压电薄膜传感器,用于采集人体的脉搏信号。所述主机用于对所述脉搏传感器的输出信号进行处理和分析计算,得到血压值。本发明的连续血压监测装置解决了现有血压计需要加压气泵、不具有连续工作能力、容易造成使用者不舒适的问题,具有使用简单、可连续工作、可实时处理监测结果的优点,非常适合用于长期连续血压监测。

    大规模社会网络中的离群点检测方法

    公开(公告)号:CN102799616B

    公开(公告)日:2014-11-05

    申请号:CN201210200045.4

    申请日:2012-06-14

    Applicant: 北京大学

    Abstract: 本发明涉及一种大规模社会网络中的离群点检测方法,其步骤包括:提取待测社会网络数据;根据社会网络各节点的内容信息,对该社会网络的节点进行聚类,形成各社会网络社区;计算各节点的社区离群度因子;提取社区离群度因子最大的n个节点,作为该社会网络的离群点。本发明不需要事先知道数据属于何种分布,能够处理任意分布的社会网络。采用了动态相似性阈值技术,明显降低了输入参数的个数,提升了社区离群点检测的准确性,能够很方便地处理大规模数据集,有良好的应用价值。

    MapReduce计算框架中的高性能排序方法

    公开(公告)号:CN103995827A

    公开(公告)日:2014-08-20

    申请号:CN201410145069.3

    申请日:2014-04-10

    Applicant: 北京大学

    CPC classification number: G06F17/30094 G06F3/067 G06F17/30194

    Abstract: 本发明涉及一种MapReduce计算框架中的高性能排序方法。该方法在Map阶段按照partition分别构建缓冲链,移除partition本身进行排序的需要,并且对于每一个partition数据将按照块进行组织,降低了数据在内存中的拷贝以及文件IO方面的代价;在Map阶段不执行排序操作,在Reduce阶段以一个较大的缓冲池作为一次排序的基本单位,使得在排序的归并阶段总的归并路数是一个用户可调优的值。本发明通过一种混合的内存排序算法,优化了MapReduce框架中排序的两个阶段,基本消除了排序对于计算框架的性能影响,进而提升了计算框架的资源有效性,降低了集群的整体资源消耗。

Patent Agency Ranking