专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅
  Nutch介绍  Nutch 是个开源、Java 实现搜索引擎它提供了我们运行自己搜索引擎所需全部工具Nutch致力于让每个人能很容易, 同时花费很少就可以配置世界流Web搜索引擎. 为了完成这宏伟目标, nutch能够做到: 每个月取几十亿网页; 为这些网页维护个索引; 对索引文件进行每秒上千次搜索;提供高质量搜索结果;以最小成本运作.   测试环境:   Nutch release 0.9   Netbean5.5.1 中文版   Java 1.6   Ubuntu 7.10  步骤:  [阅读全文] [PDF]
  Nutch介绍  Nutch 是个开源、Java 实现搜索引擎它提供了我们运行自己搜索引擎所需全部工具Nutch致力于让每个人能很容易, 同时花费很少就可以配置世界流Web搜索引擎. 为了完成这宏伟目标, nutch能够做到: 每个月取几十亿网页; 为这些网页维护个索引; 对索引文件进行每秒上千次搜索;提供高质量搜索结果;以最小成本运作.   测试环境:   Nutch release 0.9   Netbean5.5.1 中文版   Java 1.6   Ubuntu 7.10  步骤:  [阅读全文] [PDF]
为什么nutch要使用这样的plugin系统? 有三个原因: 1:可扩展性 通过plugin,nutch允许任何人扩展它的功能,而我们要做的只是对给定的接口做简单的实现,举个例子:MSWordParser这个插件是用来分析wordwendang的,它就是一个对parser这个接口的实现 2:灵活性 因为每个人都可以根据自己的需求而写自己的plugin,这样plugin就会有一个很强大的资源库。这样对与应用nutch程序员来说,他可以在自己的搜索引擎上安装符合自己需求的插件,而这些插件就在nutch的plugins中。这对于正在应用nutch的开发者来说应该 [阅读全文] [PDF]
1 共3条 分1页