文本内容质量评估方法及系统
摘要:
本发明公开了一种文本内容质量评估方法及系统,通过词性标签的N‑gram构建特征工程并建立分类模型的构思来有效识别文本中的无效信息,并为整体的文本内容打分,本发明可以应用于智能数据挖掘系统中,作为预处理的一部分,去除无价值信息,最大限度地保留文本正文中有价值的信息,得到有价值的文本并服务于下游任务,还可以有效节省系统存储资源,提升用户阅读质量。
公开/授权文献
0/0