admin管理员组

文章数量:1663969

基于hadoop搜索引擎实践——在线处理     这部分主要实现的是用户从前台输入查询请求,后台对这些请求进行查询和合并,最后前台显示结果信息的过程。     本系统实现使用jsp,服务器为tomcat6.0,具体页面实现这边不再讲述,主要讲述的是后台处理。当后台获取到需要查询的信息时,把这些信息进行分词,然后对每个关键词从倒排索引文件中获取各自MULTI_INFO,然后从所有关键词中的MULTI_INFO中求并具有相同DID的SINGLE_INFO,合并的方式是,Rank值相加,Position相拼接(可暂时忽略)。经过上述合并后可生成的结果集为最终的显示结果。用户观察到的过程如下图1-1,1-2
图1-1 输入查询请求
图1-2最后结果显示     具体实现代码可以查看:     离线处理程序: http://download.csdn/detail/long1657/8059593     在线处理程序: http://download.csdn/detail/long1657/8059567 参考文献: 1.刘鹏,hadoop实战,电子工业出版社,2011.9

本文标签: 在线搜索引擎Hadoop