浅谈搜索引擎和传统数据库（ES,solr）|电子爱好者

admin管理员组
文章数量:1566221

作为小白一枚，一直不理解既然已经有数据库存储的数据了，为什么还要有搜索引擎这些东西，而且这些搜索引擎和数据库之间是怎样的联系或者协同工作的。最近研究了很多，慢慢的好像理解了其中意思了，所以在此分享，也有可能是我理解错了，欢迎各位大神指正。

ES(ElasticSearch)是一款分布式全文检索框架，底层基于基于Lucene实现。

Elasticsearch是提供持久存储、统计等多项功能的现代搜索引擎。

首先，ES更多是面向搜索的，而database是面向数据存储的，查询其次。

其次，SQL数据库和ES存储，需要根据数据的组成、数据库选择对应的同步插件，使得两存储之间实时同步。

举个例子，ES搜索引擎。

ES与传统数据的区别主要有：

1.结构名称不同

一个ES集群可以包含多个索引（数据库），每个索引又包含了很多类型（表），类型中包含了很多文档（行），每个文档使用 JSON 格式存储数据，包含了很多字段（列）。

关系型数据库	数据库	表	行	列
ElasticSearch	索引	类型	文档	字段

2.ES分布式搜索，传统数据库遍历式搜索

ES支持分片和复制，从而方便水平分割和扩展，复制保证了es的高可用与高吞吐。

在ES中，当你创建一个索引（数据库）的时候，你可以指定你想要的分片的数量。每个分片本身也是一个功能完善并且独立的索引（数据库），索引可以被放置到集群中的任何节点上。分片优点：

(1).允许你水平分割/扩展你的内容容量

(2).允许你在分片之上进行分布式的、并行的操作，进而提高性能/吞吐量

(3).分片的分布，它的文档怎样聚合回搜索请求，完全由Elasticsearch管理

3.ES采用倒排索引，传统数据库采用B+树索引

假设一个文档（用id标识）是有许多的单词（用value标识）组成的，每个单词可能同一个文档中重复出现很多次，也可能出现在不同的文档中。

正排索引：从文档角度看其中的单词，表示每个文档都含有哪些单词，以及每个单词出现了多少次（词频）及其出现位置（相对于文档首部的偏移量）。

倒排索引：从单词角度看文档，标识每个单词分别在那些文档中出现(文档ID)，以及在各自的文档中每个单词分别出现了多少次（词频）及其出现位置（相对于该文档首部的偏移量）。

简单理解，

正排索引：id ---> value

倒排索引：value ---> id

ES中为所有字段默认都建了倒排索引。

4.ES没有用户验证和权限控制

5.ES没有事务的概念，不支持回滚，误删不能恢复

6.ES免费，完全开源；传统数据库部分免费

因为小弟目前的开发只用到了ES，就大体说了下基本概念，不然我怕好多小伙伴和我似的，最开始跟没头的苍蝇一样，不知道怎么入手。文章也没有深入去讲，只是给各位小伙伴一些抽象的理解，来大体了解搜索引擎到底是个什么东东，也或许小弟理解有错误，还望各位大佬多多指正，你们的指正和补充建议，都是小弟我前进的方向和动力。

后续会慢慢完善ES篇。至于solr，目前还没有接触，只是以前有JAVA组同事使用来着。以后有时间再深入了解吧。

本文标签：浅谈传统搜索引擎数据库 solr

版权声明：本文标题：浅谈搜索引擎和传统数据库（ES,solr）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725973438a1051089.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

浅谈搜索引擎和传统数据库（ES,solr）

更多相关文章

屏蔽百度等所有搜索引擎蜘蛛方法（meta标签）

网络蜘蛛及搜索引擎基本原理

Google 和 bing 都无法替代的10大深网搜索引擎

搜索引擎友好性

网站如何通过配置 robots.txt 来禁止以及允许搜索引擎的搜索

nginx通过robots.txt禁止所有蜘蛛访问（禁止搜索引擎收录）

搜索引擎蜘蛛池的原理是什么，蜘蛛池搭建教程？

如何屏蔽搜索引擎抓取？

各大搜索引擎的UA最全整理

android手机授权证书,浅谈国内安卓应用市场的授权书

如何解决关于SQLSERVER数据库安装时要求重启时(无限要求)重启问题？

win10 ,Ubuntu16 双系统 安装经验总结（UEFI模式，传统模式（Legacy模式））

浅谈Android输入法（IME）架构

解决SQL 数据库删除不干净，重新下载下不下来

在虚拟机VirtualBox7.0.6+openEuler20.03TSL上安装部署openGauss3.1.1数据库快速（一键）安装指导手册

【数据库】MongoDB数据库详解

数据库优化(超级详细),转文，值得一读

数据库性能优化（二）

〖Python 数据库开发实战 - MongoDB篇②〗- Mac环境下的MongoDB数据库安装

Windows系统（win10）用MSI方式安装MySQL数据库

发表评论

推荐文章

使用讯飞语音转写API进行音频转文字

win10无线显示未连接到服务器,解决win10无线网络已连接但上不了网的方法

关于chrome浏览器更新后，谷歌插件无法给网页嵌套的iframe植入cookie的问题

C++面经之C++

域故障解决实例

热门文章

开源项目Azure-Samplescognitive-services-speech-sdk指南

电脑浏览器模拟手机浏览器访问网站的解决办法

magicbook2018+MX150+win10+显卡驱动445.87+cuda_10.0.130+cudnn_v7.6.4.38+conda4.8.3+tensorflow1.14.0

电影《绿箭侠第一季》迅雷中英双字下载地址

谷歌浏览器安装（Win、Linux、离线安装）

mysql php宝塔 root_宝塔优化之php mysqlnginx 负载

ØMQ中文翻译文档

CAD图纸一键共享，永久轻松办公!

Transformer再下一城！DeepMind新模型自动生成CAD草图，网友：建筑设计要起飞了

Redmine(window7)安装

最新文章

​mathtype7.7永久激活码密钥及2025最新序列号附安装教程​

Windows Server 2016补丁更新机制

windows server 2016版介绍与安装

Mac压缩包在Windows下解压后乱码或丢失(ZIP)

最简单的卸载ubantu系统（Windows和Linux双系统）

Windows10内置Linux(WSL)

怎样把任意exe程序注册成windows系统服务(手动注册服务)

windows 系统密码破解工具（适合各种版本windows）

Kinect for Windows sdk下载 以及安装时错误的解决方案

Windows10 mysql解决MySQL服务无法启动系统出错发生系统错误 1067

Windows11 家庭版 安装docker

window redis版本下载

自制 Windows Hello

Windows PowerShell远程连接Linux

Deepin下一键安装windows所有字体

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

win10 ,Ubuntu16 双系统安装经验总结（UEFI模式，传统模式（Legacy模式））

mathtype7.7永久激活码密钥及2025最新序列号附安装教程

Kinect for Windows sdk下载以及安装时错误的解决方案

Windows11 家庭版安装docker

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载