您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页一种面向中文分词的搜索算法[发明专利]

一种面向中文分词的搜索算法[发明专利]

来源:华佗小知识
专利内容由知识产权出版社提供

专利名称:一种面向中文分词的搜索算法专利类型:发明专利

发明人:金城,陶仕谦,唐士芳,吴渊,张玥杰,冯瑞,薛向阳申请号:CN201810422499.3申请日:20180505公开号:CN108846016A公开日:20181120

摘要:本发明属于文本搜索引擎技术领域,具体为一种面向中文分词的搜索算法。本发明算法主要分为两个阶段:离线构建索引阶段和在线查找阶段。在离线构建索引阶段,首先提取所有原始字符串集合的后缀串集合,然后由后缀串集合生成改进的后缀树;在在线查找阶段,首先根据基于后缀树的索引模型得到关键词的查询结果,然后量化关键词和查询结果的匹配程度,最后将查询结果按匹配程序由高到低排序后返回。本发明通过一种改进的基于后缀树的索引结构来平衡索引构建时间和占用空间,使用本发明的索引结构的搜索效率远高于对结果集暴力计算匹配度并排序的效率。

申请人:复旦大学

地址:200433 上海市杨浦区邯郸路220号

国籍:CN

代理机构:上海正旦专利代理有限公司

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务