欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Hadoop-2.5.2在Win10上的伪分布式单节点配置

程序员文章站 2022-05-31 10:30:31
...

<div class="iteye-blog-content-contain" style="font-size: 14px">

Hadoop-2.5.2可以在win10系统上直接运行,而不需要Cygwin。下面来介绍配置过程:

一、下载Hadoop-2.5.2

http://hadoop.apache.org/releases.html网址中可以找到Hadoop的相关版本点击进行下载

 

二、解压下载后的文件

(如hadoop-2.5.2.tar.gz到指定的目录,例如我的在

D:\hadoop\hadoop-2.5.2下。

 

三、配置相关文件

 1配置hadoop-env.cmd文件(该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop中)

用一种编辑器软件打开并在最后加上如下几句:

 

set HADOOP_PREFIX=D:\hadoop\hadoop-2.5.2
set HADOOP_CONF_DIR=%HADOOP_PREFIX%\etc\hadoop
set YARN_CONF_DIR=%HADOOP_CONF_DIR%
set PATH=%PATH%;%HADOOP_PREFIX%\bin

 

2配置core-site.xml文件(该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop中)

 

<configuration>
   <property>
     <name>hadoop.tmp.dir</name>
     <value>/hadoop/sysdata/tmp</value>
   </property>
   <property>
     <name>fs.default.name</name>
     <value>hdfs://0.0.0.0:19000</value>
   </property>
</configuration>

  

3配置hdfs-site.xml文件(该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop

用一种编辑器软件打开并在内部编辑如下语句:​

<configuration>
    <property>
         <name>dfs.replication</name>
         <value>1</value>
    </property>
    <property>
       <name>dfs.namenode.name.dir</name>
       <value>/hadoop/sysdata/hdfs/name</value>
    </property>
    <property>
       <name>dfs.datanode.data.dir</name>
       <value>/hadoop/sysdata/hdfs/data</value>
    </property>
</configuration>

  

4配置mapred-site.xml文件(该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop下)

用一种编辑器软件打开并在内部编辑如下语句:

<configuration>
   <property>
      <name>mapreduce.job.user.name</name>
      <value>%Administrator%</value>
   </property>
 
   <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
  
   <property>
      <name>yarn.apps.stagingDir</name>
      <value>/user/%Administrator%/staging</value>
   </property>
 
   <property>
      <name>mapreduce.jobtracker.address</name>
      <value>local</value>
   </property>
</configuration>

  

5配置yarn-site.xml文件(该文件在e:/hadoop/deploy/etc/hadoop下)

用一种编辑器软件打开并在内部编辑如下内容:

<configuration>
 
<property>
   <name>yarn.server.resourcemanager.address</name>
   <value>0.0.0.0:8020</value>
</property>
 
<property>
   <name>yarn.server.resourcemanager.application.expiry.interval</name>
   <value>60000</value>
</property>
 
<property>
   <name>yarn.server.nodemanager.address</name>
   <value>0.0.0.0:45454</value>
</property>
 
<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>
 
<property>
   <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
   <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
 
<property>
   <name>yarn.server.nodemanager.remote-app-log-dir</name>
   <value>/app-logs</value>
</property>
 
<property>
   <name>yarn.nodemanager.log-dirs</name>
   <value>/dep/logs/userlogs</value>
</property>
 
<property>
   <name>yarn.server.nodemanager.remote-app-log-dir</name>
   <value>/app-logs</value>
</property>
 
<property>
   <name>yarn.server.mapreduce-appmanager.attempt-listener.bindAddress</name>
   <value>0.0.0.0</value>
</property>
 
<property>
   <name>yarn.server.mapreduce-appmanager.client-service.bindAddress</name>
   <value>0.0.0.0</value>
</property>
 
<property>
   <name>yarn.log-aggregation.retain-seconds</name>
   <value>-1</value>
</property>
 
<property>
   <name>yarn.application.classpath</name>
   <value>%HADOOP_CONF_DIR,HADOOP_COMMON_HOME%/share/hadoop/common/*,
   %HADOOP_COMMON_HOME%/share/hadoop/common/lib/*,
   %HADOOP_COMMON_HOME%/share/hadoop/hdfs/*,
   %HADOOP_COMMON_HOME%/share/hadoop/hdfs/lib/*,
   %HADOOP_COMMON_HOME%/share/hadoop/mapreduce/*,
   %HADOOP_COMMON_HOME%/share/hadoop/mapreduce/lib/*,
   %HADOOP_COMMON_HOME%/share/hadoop/yarn/*,
   %HADOOP_COMMON_HOME%/share/hadoop/yarn/lib/*</value>
</property>
 
</configuration>

  

至此,所有的配置文件都以完成,下面要进行环境变量的初始化和相关的验证

四、环境变量的初始化及相关启动

1打开cmd命令窗口,先切换到D:盘下。用cd D:\hadoop\hadoop-2.5.2\etc\hadoop目录下,执行hadoop-env.cmd命令即可初始化环境变量了。


Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
 
 

2格式化namenode,执行%HADOOP_PREFIX%\bin\hdfs namenode -format命令即可格式化namenode


Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
  

3启动 hdfs 进程,执行 %HADOOP_PREFIX%\sbin\start-dfs.cmd命令,这时会弹出两个命令窗口,在主窗口内用命令jps即可观察到现在启动的一些节点如下图所示:


Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
 

可能会出现错误:如hadoop_io_nativeio_NativeIO$Windows_access0(Ljava-lang-String;I)Z

解决方法:见http://blog.csdn.net/congcong68/article/details/42043093

4启动yarn进程,执行%HADOOP_PREFIX%\sbin\start-yarn.cmd命令,这时又会弹出两个命令窗口,在主窗口内用命令jps即可观察到现在启动的一些节点如下图所示:

 
Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
 

至此,Hadoopwin7系统下已经配置成功。

 

</div>

 

  • Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
  • 大小: 51.7 KB
  • Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
  • 大小: 204.2 KB
  • Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
  • 大小: 196.9 KB
  • Hadoop-2.5.2在Win10上的伪分布式单节点配置
            
    
    博客分类: hadoop hadoop2java 
  • 大小: 141 KB
相关标签: hadoop2 java