大数据架构商业之路:从业务需求到技术方案
上QQ阅读APP看书,第一时间看更新

icon2

2.4 参考资料

  • 《开发自己的搜索引擎——Lucene+Heritrix(第2版)》

作者:邱哲,符滔滔,王学松

本书对介绍了如何使用Heritrix构建自己的爬虫系统,同时对于Lucene的索引和查询进行了阐述。

  • 《解密搜索引擎技术实战:Lucene&Java精华版(第2版)》

作者:罗刚等

本书更深入一步探讨了如何通过编程来打造一个爬虫系统,比较适合程序员老手,也包含了Lucene和Solr系统的介绍。

  • 《Flume:构建高可用、可扩展的海量日志采集系统》

作者:Hari Shreedharan

译者:马延辉,史东杰

如果需要深入了解Flume的细节,那么这本书会是一个不错的选择。作者是Flume的开发者之一,本书对Flume架构、配置和部署都有详细的阐述。