admin管理员组

文章数量:1613077

​hadoop作为大数据的基础框架组件,其包括hdfs,mapreduce和yarn三大组件。为了方便开发环境进行本地开发和测试,可以在windows环境搭建hadoop环境。

1. 下载文件

http://archive.apache/dist/hadoop/core/hadoop-2.7.7/
https://github/steveloughran/winutils

2. 执行解压和配置

2.1 配置文件core-site.xml
<configuration>
    <property>
	    <name>fs.defaultFS</name>
		<value>hdfs://192.168.22.56:9000</value>
	</property>
</configuration>

这里配置hdfs的端口为9000,也可以根据实际情况,配置为其它的端口。

2.2 修改配置文件hdfs-site.xml
<configuration>
    <property>
	    <name>dfs.replication</name>
		<value>1</value>
	</property>
	<property>
	    <name>dfs.namenode.http-address</name>
		<value>192.168.22.56:50070</value>
	</property>
	<property>	
        <name>dfs.namenode.name.dir</name>    
		<value>/D:/sdks/hadoop-2.7.7/data/dfs/namenode</value>
	</property>
	<property>	
        <name>dfs.datanode.data.dir</name>    
		<value>/D:/sdks/hadoop-2.7.7/data/dfs/datanode</value>    
	</property>
</configuration>

这里配置的web界面地址为50070,可以通过浏览器在该端口访问hdfs。

2.3 重命名mapred-site.xml.template为mapred-site.xml
<configuration>
    <property>
	    <name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
	<property>
	    <name>mapred.job.tracker</name>
		<value>hdfs://192.168.22.56:9001</value>
	</property>
</configuration>
2.4 修改配置文件yarn-site.xml
<configuration>
 
<!-- Site specific YARN configuration properties -->
    <property>
	    <name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
	<property>
	    <name>yarn.nodemanager.aux-services.mapreduce.shuffle.calss</name>		
		<value>org.apache.hadoop.mapred.ShuffleHandler</value>
	</property>
 
</configuration>

3. 初始化及启动

3.1 格式化namenode的hdfs
hdfs namenode –format
3.2 启动所有服务

在sbin目录下找到start-all.cmd并执行

start-all.cmd
3.3 查看运行服务
jps 
D:\sdks\jdk1.8.0_191\bin>jps
37828 QuorumPeerMain
45828 NodeManager
53748 Jps
10168 ResourceManager
42060 NameNode
56156 DataNode
3.4 查看Web页面

http://localhost:50070/

这里因为网络更换原因,截图的ip地址有所不同。

http://localhost:8088/

4. 测试和使用

4.1 创建hdfs的目录

在bin目录下,执行下面的命令。

hadoop fs –mkdir /user
hadoop fs –mkdir /user/input
4.2 上传文件
hadoop fs –put e:/test.txt /user/input

查看文件内容:

hadoop fs –cat /user/input/test.txt
4.3 执行mapreduce任务
hadoop jar D:/sdks/hadoop-2.7.7/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /user/input/ /user/output
4.4 查看执行结果

本文标签: WindowsHadoop