欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

hadoop 单机安装配置教程

程序员文章站 2023-12-01 19:24:16
单机安装主要用于程序逻辑调试。安装步骤基本通分布式安装,包括环境变量,主要hadoop配置文件,ssh配置等。主要的区别在于配置文件:slaves配置需要修改,另外如果分布...
单机安装主要用于程序逻辑调试。安装步骤基本通分布式安装,包括环境变量,主要hadoop配置文件,ssh配置等。主要的区别在于配置文件:slaves配置需要修改,另外如果分布式安装中dfs.replication大于1,需要修改为1,因为只有1个datanode.
分布式安装请参考:
http://acooly.iteye.com/blog/1179828
单机安装中,使用一台机器,即做namenode和jobtracker也是datanode和tasktracker,当然也是secondarynamenode。
主要配置文件core-site.xml,hdfs-site.xml,mapred-site.xml,masters完全同分布树安装配置,如果分布式安装配置方案中hdfs-site.xml的副本数量定义大于1,则修改为1.
复制代码 代码如下:

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

主要不同在于slaves的配置,分布式安装中是多个其他机器作为datanode,单机模式本机是datanode,所以修改slaves配置文件为本机的域名。如:本机机器名为hadoop11,则:
[hadoop@hadoop11 ~]$ cat hadoop/conf/slaves
hadoop11
完成配置后,启动:
复制代码 代码如下:

$ start-all.sh
$ jps
15556 jps
15111 jobtracker
15258 tasktracker
15014 secondarynamenode
14861 datanode
14712 namenode

运行demo
$ echo word1 word2 word2 word3 word3 word3 > words
$ cat words
word1 word2 word2 word3 word3 word3
$ hadoop dfsadmin -safemode leave
$ hadoop fs -copyfromlocal words /single/input/words
$ hadoop fs -cat /single/input/words
12/02/17 19:47:44 info security.groups: group mapping impl=org.apache.hadoop.security.shellbasedunixgroupsmapping; cachetimeout=300000
word1 word2 word2 word3 word3 word3
$ hadoop jar hadoop-0.21.0/hadoop-mapred-examples-0.21.0.jar wordcount /single/input /single/output
......
$ hadoop fs -ls /single/output
......
-rw-r--r-- 1 hadoop supergroup 0 2012-02-17 19:50 /single/output/_success
-rw-r--r-- 1 hadoop supergroup 24 2012-02-17 19:50 /single/output/part-r-00000
$ hadoop fs -cat /single/output/part-r-00000
......
word1 1
word2 2
word3 3