hbase数据导入|电子爱好者

admin管理员组
文章数量:1576258

使用命令bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=HBASE_ROW_KEY,cf:a,cf:b,cf:c <tablename> <hdfs-inputdir> 需要指出的是源文件默认以” “为分割符，如果需要换成其它分割符，在执行时加上-Dimporttsv.separator=”,”，则变成了以”,”分割
这个工具是使用map/reduce方式来进行数据导入的。map的数量取决于你<hdfs-inputdir>目录下面文件的数量。

bulkload和上面的map/reduce的在线Put方式一样

大数据量

bulkload.方式导入

执行命令： bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.bulk.output=hdfs://storefile-outputdir -Dimporttsv.columns=HBASE_ROW_KEY,cf:a,cf:b,cf:c <tablename> <hdfs-inputdir>

需要你指定一个hdfs路径。来保存你生成的HFile文件。这时候如果这些HFile所在HDFS和你的hbase集群用到的HDFS集群是同一个的话。那么你就可以执行bin/hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles <hdfs://storefileoutput> <tablename> 完成整个过程

$ bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=a,b,c <tablename> <hdfs-inputdir>
$ bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=a,b,c -Dimporttsv.bulk.output=hdfs://storefile-outputdir <tablename> <hdfs-data-inputdir>

hbase提供了这两种方式进行导入.可以看到只是一个importtsv.bulk.output参数上的差别。内部的实现确实千差万别。

上面的那个命令是在map的时候输出Put. reduce的时候直接把put提交

下面那个在map时候做的事情一样。在reduce的时候就是通过HFileOutputFormat把KeyValues输出到HFile

但是下面的方式还有一个不走就是complete.就是将之前生成的HFile文件导入到region中。分布还是比较均匀的

本文标签：数据 Hbase

版权声明：本文标题：hbase数据导入内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1727799336a1130641.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

hbase数据导入

更多相关文章

全面了解Java连接MySQL的基础知识，快速实现数据交互

如何手动导出安卓手机中的微信QQ等应用数据

STM32WB55_NUCLEO开发（10）----接收手机特定数据点亮LED

ESP8266 WIFI模块学习之路（7）——自写Android手机APP接受单片机数据

ESP8266之DHT11温湿度数据上传+手机App反向控制

Python爬取手机APP上面的数据

利用charles进行数据抓包和手机APP数据测试

Fiddler利用Xposed框架+JustTrustMe抓取手机APP数据

文本生成，文本数据增强怎么做？

ListView获取网络数据并展示优化练习

在CAD环境外新建dwg文件并读取外部dwg文件数据

基于C#的恒星科普网站+49762（免费领源码）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

高校大数据专业科研建设方案

常用数据加密及加密格式

如何保护电脑文件夹？多种方法保护数据安全

游戏数据安全----一个关于数据加密的简单代码实现

Android数据加密概述及多种加密方式 聊天记录及账户加密 提供高质量的数据保护

网络篇 - https协议中的数据是否需要二次加密

利用Python在NASA Earthdata Search 上批量下载MODIS数据

iperf3测试无线路由器数据吞吐量

发表评论

推荐文章

win10远程桌面连接ubuntu20

kali 使用后台进行手机拍照，查看定位，获取信息，(通讯录等操作)

分享推荐几款黑科技APP，不止是华为手机能用哦！

Qt-AES加密库

医学双语术语|糖尿病

热门文章

计算机基础知识及键盘熟悉实验报告,实验报告-实验一计算机的认识与指法练习.doc...

java游戏下载网址_手机java游戏下载网站

微信小程序 获取手机号 JS

电脑经常蓝屏是什么原因 各种蓝屏代码解决方法

图扑数字孪生青岛城轨，赋能智慧交通低碳发展

破解无线上网密码 无线WEP密码破解

Zhong__VeraCrypt加密软件使用

如何对NTFS文件进行压缩和加密

Windows系统查找多个文件夹里的重复文件

配置无线路由器桥接

最新文章

网络安全（加密技术、数字签名、证书）

计算机三级网络技术知识点

输入URL，客户端到服务器通信的过程

华为Smart AX MT800设置路由器教程

路由与交换课程设计

[网络]OSPF理论

了解高可用集群KEEPALIVED，这一篇就够了

计算机网络习题一

史上最详细的Linux使用手册（持续更新中）

2018年上半年信息安全工程师上午选择题及解析

复试-网络安全问答

计算机网络知识点总结--适用于期末考试

最详细的CISCO路由器配置命令及方法

深度剖析Keepalived：一个不可或缺的网络健康检查与故障转移神器

ip route配置静态路由_超详细的静态路由与配置相关知识点总结

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Android数据加密概述及多种加密方式聊天记录及账户加密提供高质量的数据保护

微信小程序获取手机号 JS

电脑经常蓝屏是什么原因各种蓝屏代码解决方法

破解无线上网密码无线WEP密码破解

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载