Nutch介绍 Nutch 是个开源、Java 实现搜索引擎它提供了我们运行自己搜索引擎所需全部工具Nutch致力于让每个人能很容易, 同时花费很少就可以配置世界流Web搜索引擎. 为了完成这宏伟目标, nutch能够做到: 每个月取几十亿网页; 为这些网页维护个索引; 对索引文件进行每秒上千次搜索;提供高质量搜索结果;以最小成本运作. 测试环境: Nutch release 0.9 Netbean5.5.1 中文版 Java 1.6 Ubuntu 7.10 步骤: [阅读全文] [PDF]
Nutch介绍 Nutch 是个开源、Java 实现搜索引擎它提供了我们运行自己搜索引擎所需全部工具Nutch致力于让每个人能很容易, 同时花费很少就可以配置世界流Web搜索引擎. 为了完成这宏伟目标, nutch能够做到: 每个月取几十亿网页; 为这些网页维护个索引; 对索引文件进行每秒上千次搜索;提供高质量搜索结果;以最小成本运作. 测试环境: Nutch release 0.9 Netbean5.5.1 中文版 Java 1.6 Ubuntu 7.10 步骤: [阅读全文] [PDF]
为什么nutch要使用这样的plugin系统? 有三个原因: 1:可扩展性 通过plugin,nutch允许任何人扩展它的功能,而我们要做的只是对给定的接口做简单的实现,举个例子:MSWordParser这个插件是用来分析wordwendang的,它就是一个对parser这个接口的实现 2:灵活性 因为每个人都可以根据自己的需求而写自己的plugin,这样plugin就会有一个很强大的资源库。这样对与应用nutch程序员来说,他可以在自己的搜索引擎上安装符合自己需求的插件,而这些插件就在nutch的plugins中。这对于正在应用nutch的开发者来说应该 [阅读全文] [PDF]
1 共3条 分1页
- 疯狂代码,大型网站架构系列之四,多对多关系的以及并发缓存的设计
- 处理机调度算法:处理机调度程序--优先权算法实现(C++编写)
- c语言谭浩强:谭浩强c语言教程——第二章程..
- 算法与程序框图:算法和程序框图3(数值性问...
- 常用算法:常用算法设计方法(一)
- phppear:Pear的PHP_Compat包
- 如何创建本地连接:创建本地的PEAR
- bom头的影响
- pdomysql:PDO_MYSQL的一些预定义常量
- PHP 5.3中新增的魔术常量__DIR__
- karrigell:Karrigell 入门
- php读取数据库:直接读取数据库信息的 3种思路方法
- pear应用:PEAR应用的AUTH_HTTP
- pear安装:PEAR教程(一)--Pear的介绍和安装
- phppear:PEAR教程( 2)--Pear的Cache介绍
- xp优化技巧:Web应用优化窍门技巧
- php留言本:PHP+TEXT留言本(一)
- php留言本:PHP+TEXT留言本( 2)
- php留言本:PHP+TEXT留言本( 3)
- php留言本:PHP+TEXT留言本( 4)