• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

虚拟机上安装hadoop

武飞扬头像
强哥的小迷妹《》
帮助3

一、下载VMware虚拟机,并在虚拟机上安装centos7系统

具体的安装过程可见:VMware下安装centos6.7的步骤 - 还能和老板谈感情吗 - 博客园

接下来给虚拟机进行NAT设置:详情可见我上传的文件《VMware中CentOS 设置固定IP同时连接内外网

二、hadoop环境的搭建

下载jdk 和 hadoop 放到 ~/software目录下 然后解压到 ~/app目录下

tar -zxvf 压缩包名字 -C ~/app/

配置环境变量

  1.  
    vi ~/.bashrc
  2.  
    export JAVA_HOME=/home/hadoop/app/jdk1.8.0_91
  3.  
    export PATH=$JAVA_HOME/bin:$PATH
  4.  
    export HADOOP_HOME=/home/hadoop/app/hadoop......
  5.  
    export PATH=$HADOOP_HOME/bin:$PATH
  6.  
     
  7.  
    #保存退出后
  8.  
    source ~/.bashrc

进入到解压后的hadoop目录 修改配置文件

  • 配置文件作用

    • core-site.xml 指定hdfs的访问方式

    • hdfs-site.xml 指定namenode 和 datanode 的数据存储位置

    • mapred-site.xml 配置mapreduce

    • yarn-site.xml 配置yarn

  • 修改hadoop-env.sh

  1.  
    cd etc/hadoop
  2.  
    vi hadoop-env.sh
  3.  
    #找到下面内容添加java home
  4.  
    export_JAVA_HOME=/home/hadoop/app/jdk1.8.0_91
  • 修改 core-site.xml 在 <configuration>节点中添加

  1.  
    <property>
  2.  
    <name>fs.default.name</name>
  3.  
    <value>hdfs://hadoop000:8020</value>
  4.  
    </property>
  • 修改hdfs-site.xml 在 configuration节点中添加

    1.  
      <property>
    2.  
      <name>dfs.namenode.name.dir</name>
    3.  
      <value>/home/hadoop/app/tmp/dfs/name</value>
    4.  
      </property>
    5.  
      <property>
    6.  
      <name>dfs.datanode.data.dir</name>
    7.  
      <value>/home/hadoop/app/tmp/dfs/data</value>
    8.  
      </property>
    9.  
      <property>
    10.  
      <name>dfs.replication</name>
    11.  
      <value>1</value>
    12.  
      </property>
  • 修改 mapred-site.xml

  • 默认没有这个 从模板文件复制

    cp mapred-site.xml.template mapred-site.xml

    在mapred-site.xml 的configuration 节点中添加

    1.  
      <property>
    2.  
      <name>mapreduce.framework.name</name>
    3.  
      <value>yarn</value>
    4.  
      </property>
  • 修改yarn-site.xml configuration 节点中添加

    1.  
      <property>
    2.  
      <name>yarn.nodemanager.aux-services</name>
    3.  
      <value>mapreduce_shuffle</value>
    4.  
      </property>

    来到hadoop的bin目录

    cd ./hadoop namenode -format (这个命令只运行一次)

    启动hdfs 进入到 sbin

  • ./start-dfs.sh
  • 启动启动yarn 在sbin中

几个要注意的地方:

  1. 如果你是hadoop运行模式是伪分布式,那么namenode和datanode是在同一个机器中,那么需要修改hadoop目录下的 etc/slaves文件。学新通hadoop000设置成你的主机名,剩下的注释即可。
  2. 如果在操作hdfs是,显示 name node is safe,使用hdfs dfsadmin -safemode leave即可关闭安全模式。

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhfhebbh
系列文章
更多 icon
同类精品
更多 icon
继续加载