简介
本书是猎兔搜索开发团队的软件研发和教学实践的经验汇总。 本书总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。 主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。 爬虫部分介绍了网页遍历方法和如何实现增量抓取。并介绍了从网页等各种格式的文档中提取主要内容的方法。 自然... 更多
属性
出版社
电子工业出版社
出品方
博文视点
ISBN
9787621096407
出版年
2011-5-13
装帧
平装
价格
55.00
页数
600
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%