药品分词搜索方法及系统
摘要:
本申请涉及互联网技术领域,公开了一种药品分词搜索方法及系统,该方法包含:预先根据已有的药品数据建立药品词典,并且设定规则词典;根据药品词典对输入的搜索字符串进行多路径分词,得到多路径分词结果,其中,如果多路径分词结果的最粗粒度路径中至少有一组连续单字的单字数量在预设范围内,则根据规则词典中的特征词对搜索字符串进行分词;使用多路径分词结果进行药品搜索。本申请对医药行业的新词、未标注词的切分效率和准确率都更高,且能够减少人工标注的成本。
公开/授权文献
0/0