P2P普及系列的 7:DHT算法的研究

=text_show>    现有DHT算法由于采用分布式散列所以只适合于准确查找如果要支持目前Web上搜索引擎具有多关键字查找功能还要引入新思路方法主要原因在于DHT工作方式     基于DHTP2P系统采用相容散列根据精确关键词进行对象定位和发现散列总是试图保证生成散列值均匀随机分布结果两个内容相似度很高但不完全相同对象被生成了完全区别散列值存放到了完全随机两个结点上因此DHT可以提供精确匹配查询但是支持语义是非常困难

    目前在DHT基础上开展带有语义资源管理技术研究还非常少由于DHT精确关键词映射特性决定了无法和信息检索等领域研究成果结合阻碍了基于DHTP2P系统大规模应用

    P2P发现技术中最重要研究成果应该是基于small world理论非结构化发现算法和基于DHT结构化发现算法尤其是DHT及其发现技术为资源组织和查找提供了种新思路方法

    随着P2P系统实际应用发展物理网络中影响路由些原因开始影响P2P发现算法效率方面实际网络中结点的间体现出较大差异即异质性由于客户机/服务器模式在Internet和分布式领域十几年应用和大量种类电子设备普及如手提电脑、移动电话或PDA这些设备在计算能力、存储空间和电池容量上差别很大另外实际网络被路由器和交换机分割成区别自治区域体现出严密层次性

    另方面网络波动程度严重影响发现算法效率网络波动(Churn、fluctuation of network)包括结点加入、退出、失败、迁移、并发加入过程、网络分割等DHT发现算法如Chord、CAN、Koorde等都是考虑网络波动最差情况下设计和实现由于每个结点度数尽量保持最小这样需要响应成员关系变化维护可以比较小从而可以快速恢复网络波动造成影响但是每个结点仅有少量路由状态代价是发现算法高延时次查找需要联系多个结点在稳定网络中这种思路是不必要

    同时作为种资源组织和发现技术必然要支持复杂查询如关键词、内容查询等尽管信息检索和数据挖掘领域提供了大量成熟语义查询技术由于DHT精确关键词映射特性阻碍了DHT在复杂查询方面应用

Tags: 

延伸阅读

最新评论

发表评论