大数据存储：扩展Hadoop的十大要点|电子爱好者

admin管理员组
文章数量:1566979

数据局部性是指确保大数据集存储在执行分析任务的计算资源附近。对于Hadoop来说，这就意味着管理数据节点(DataNode)，而数据节点为MapReduce拥有足够好的性能提供了存储资源。
20世纪90年代，每台应用服务器往往都拥有直接连接存储(DAS)。创建存储区域网络(SAN)，是为了提供共享的存储池，以获得更大的规模和更高的效率。Hadoop逆转了这股潮流，让DAS重新流行起来。每个Hadoop集群都有自己的、横向扩展直接连接存储。它有助于Hadoop管理数据局部性，但是牺牲了共享存储的规模和效率。因此，如果你有Hadoop发行版的多个实例，就会有多个这种横向扩展的存储孤岛。

Hedvig公司的首席执行官兼创始人阿维纳什·拉克希曼(Avinash Lakshman)说：“我们遇到的最大挑战就是，兼顾数据局部性与规模和效率。”

数据局部性是指确保大数据集存储在执行分析任务的计算资源附近。对于Hadoop来说，这就意味着管理数据节点(DataNode)，而数据节点为MapReduce拥有足够好的性能提供了存储资源。它可以高效地工作，但是导致了另一个操作问题：大数据存储孤岛。本文介绍的这些要点有助于管理Hadoop环境中的大数据存储。

1. 分散式存储

集中式存储作为传统架构已有一段时间。但是大数据其实并不适合集中存储架构。Infogix的金融服务行业(FSI)战略和运营经理森希尔·拉贾曼尼坎(Senthil Rajamanickam)表示，Hadoop旨在让计算资源更接近数据，同时充分利用HDFS文件系统的大规模横向扩展功能。

然而，解决Hadoop管理自有数据的低效问题的常见方法，一向是将Hadoop数据存储在SAN上。而这带来了性能和规模方面的一系列瓶颈。现在，你的所有数据都通过集中式SAN控制器来处理，而控制器破坏了Hadoop的分布式、并行化的特性。你需要为多个数据节点管

本文标签：十大要点数据存储 Hadoop

版权声明：本文标题：大数据存储：扩展Hadoop的十大要点内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1725286879a1016838.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

大数据存储：扩展Hadoop的十大要点

更多相关文章

SAT阅读长难句学习要点

电脑主板的十大品牌你知道吗？

高性能计算机游戏,2017十大高性能游戏笔记本电脑排行

分享 | 十大应用程序安全实践方法

开源玩家福利：十大Linux免费游戏

Python的十大优点：让你爱上这种编程语言

弱网测试要点之游戏测试

大数据实战——基于Hadoop的Mapreduce编程实践案例的设计与实现

虚拟化磁盘模式、数据存储详解

十大流氓骚扰软件卸载秘籍

windows 十大必备软件

CAD画图软件测试自学,三维CAD软件功能对比测试要点

十大试玩软件赚钱app（最赚钱的试玩app排行榜）

2012年CIO最关心的十大安全问题

2008十大病毒排行：“网游窃贼”最毒

十大超级老牌黑客逐个曝光

2015年最新国内十大应用商店广告报价表

印度十大最好电影排行

hadoop完全分布式出现故障的解决方式（无法正常启动）

大数据 （016）Hadoop-MR编程 -- 【使用hadoop计算微博用户可能喜欢的关键词----编程】

发表评论

推荐文章

10部残酷惨烈的要塞攻防电影

Linux的基本学习（四）——磁盘与文件系统管理

Linux入门教程

记一次-更新win10版本到2004

windows 驱动开发使用的一些工具

热门文章

如何在win10中安装，更新和删除机器人操作系统ROS1或ROS2？（2020版）

官方ISO！Win10 2020终极版、2021最新版镜像下载

个人云电脑-推荐方案 - ParsecFastlink

python无法正常启动0xc000007b_应用程序无法正常启动0xc000007b怎么解决(最全)

C++面经之C++

cad通过钢筋大样生成钢筋明细表插件_常青藤钢筋工具系统

360amigo系统加速大师：全面电脑性能优化工具

esxi安装威联通_威联通TS-453Bmini NAS加装内存，轻松玩转虚拟机安装win10系统

python向windows服务器上传文件（夹）

永久激活win和office

最新文章

微软关闭了两种攻击途径：Office 宏、RDP 暴力破解

Office2019 安装​教程。

Office 2016安装

如何重装电脑自带的正版office2016家庭学生版

手把手教你免费配置SSL数字证书

office共享——多人编辑

用户注册发送激活邮件（上）

》文本工具：如何使用Office 2019 for Mac和 Mac App Store

【有效】201620132010 软件的安装解决方法

重装系统后，右击发现没有出现office,Excel等

Zebra BI for Excel

excel查重复_个人永久性免费Excel催化剂功能第98波零代码零距离轻松接触并拥有金融大数据...

Office2016软件安装教程

政企版 WPS Pro 专业版注册安装教程

ONLYOFFICE协作空间是什么？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

大数据（016）Hadoop-MR编程 -- 【使用hadoop计算微博用户可能喜欢的关键词----编程】

Office2019 安装教程。

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载