admin管理员组

文章数量:1624782

文章目录

  • 一、需求分析
  • 二、ElasticSearch
  • 三、FSCrawle
  • 三、SearchUI
  • 五、运行测试

一、需求分析

  • 公司内部存在大量的设备维修保养office文档,设备人员在检索特定的维修保养知识的时候,需要根据目录的索引文件,在服务器上先找出有可能相关的文件列表,再一一打开进行检索,效率低下且体验性差。
  • 用户希望利用现有文档系统(编制,发布,升版等文控管理有专人负责)不变,搭建一个可以根据关键词条进行检索的文件搜索引擎,提高效率及提升体验度。
  • 本文将通过ElasticSearch(开源搜索引擎),FSCrawler(文件爬虫,将文档“上传”到 elasticsearch), SearchUI(使用elasticsearch搜索 API 的前端页面),搭建一个文件搜索引擎系统。

二、ElasticSearch

  • 我们首先从(https://www.elastic.co/cn/downloads/elasticsearch下载文件(本文以windows版本为例)。

  • 解压文件

  • 下载安装jdk并设置java环境变量

  • 进入到解压后的bin目录,双击elasticsearch.bat文件运行

  • 验证ElasticSearch是否启动成功:使用浏览器访问http://localhost:9200,看到以下页面就代表安装成功了

三、FSCrawle

  • 我们再从https://fscrawler.readthedocs.io/en/fscrawler-2.7/installation.html下载文件(本文以windows版本为例)。
  • 解压文件

本文标签: 手把手教你搜索引擎文件FSCrawlerElasticsearch