排序方式: 共有2条查询结果,搜索用时 890 毫秒
1
1.
针对大规模信息采集,运用Bloom Filter及其改进算法,在误差允许的条件下,通过URL散列运算可以有效地对同源网页进行去重.实践证明,通过对其参数进行合理的调整,可以达到满意的结果. 相似文献
2.
基于Bloom Filter的超大规模网页去重策略研究 总被引:1,自引:0,他引:1
丁振国吴宝贵辛友强 《现代图书情报技术》2008,24(3):45-50
针对大规模信息采集,运用Bloom Filter及其改进算法,在误差允许的条件下,通过URL散列运算可以有效地对同源网页进行去重。实践证明,通过对其参数进行合理的调整,可以达到满意的结果。 相似文献
1