在阿里云上搭建Hadoop集群

在阿里云上搭建Hadoop集群并实现外网访问

阿里云机器配置

  1. 本测试集群采用的机器为阿里云 单核4G 40G云盘 的共享型机器,搭载的系统镜像为Centos7.5,通过内网IP连接,并使用外网来访问集群的Web页面。

    confOfMachine

  2. JDK为:jdk-8u212-linux-x64.tar.gz Hadoop为:hadoop-3.1.3.tar.gz

集群规划

  1. 使用三台机器进行Hadoop集群的搭建

  2. 主要为HDFS中NameNode,SecondaryNameNode,Yarn中ResourceManager,NodeManager节点分配,另外需要历史服务器和日志聚集功能的配置

  3. Hadoop001: NameNode,DataNode,HistoryServer,NodeManager

    Hadoop002: ResourceManager, DataNode, NodeManager

    Hadoop003: SecondaryNameNode, DataNode, NodeManager

    集群规划

网络设置

  1. 在阿里云的控制台开放相应的端口,如NameNode上9870端口和Yarn上8088端口,另外,设置了三台机器在内网的随意访问

    网络安全组设置

  2. 关闭虚拟机防火墙

    systemctl stop firewall
    systemctl disable firewall
    
  3. hostname和hosts的设置

    • hostname分别为Hadoop001,Hadoop002,Hadoop003
    • hosts映射,如下。注意,不要修改红线处的名称,如果修改可能会出现connection refused错误

    hostname
    hosts

  4. 免SSH登陆设置

    • 密钥的生成

      #-t 后为加密方式
      ssh-keygen -t rsa
      
    • 公钥的拷贝

      #hadoop002处为目标IP地址
      ssh-copy-id hadoop002
      
    • 需要注意的是此操作需要在三台机器上都执行,从而使机器间免密登陆

JDK和Hadoop的安装

  1. 可以使用yum直接安装,也可以使用sftp上传

  2. 本人的目录结构如下

    目录结构

    且权限归xingcang用户,以便后续使用xingcang作为实际操作用户

    目录权限

  3. 环境变量的设置

    • 在/etc/profile中,可以发现其会加载/etc/profile.d目录下的文件,因此可以在此目录下建立特有的环境变量配置信息

      部分profile

    • 在/etc/profile.d目录下新建my_env.sh文件,并添加java和hadoop的环境变量信息

      env_sh的配置

    • 使配置文件生效

      source /etc/profile
      
    • 检查jdk和hadoop安装是否正常
      检查java和hadoop是否正常

Hadoop搭建

一些工具命令及脚本

  • 安装一些便捷实用的命令

    yum install -y epel-release
    yum install -y psmisc nc net-tools rsync vim lrzsz ntp libzstd openssl-static tree iotop git
    
  • 配置用户的root权限

    vim /etc/sudoers
    

    用户root权限

  • 分发脚本xsync

    此脚本在rsync的基础上编写,需要设置免密登陆

    #scp的使用
    scp -r $pdir/$fname $user@hadoop$host:$pdir/$fname
    #rsync的使用
    rsync -av $pdir/$fname $user@hadoop$host:$pdir/$fname
    
    #!/bin/bash
    # number of args
    if [ $# -lt 1 ]
    then
            echo NOT Enough Arguement!
            exit;
    fi
    
    #loop for hosts
    for host in hadoop001 hadoop002 hadoop003
    do
            echo =============$host=============
            # send file one by one
            for file in $@
            do
                    #file exists or not
                    if [ -e $file ]
                    then
                            #get parent dir
                            pdir=$(cd -P $(dirname $file); pwd)
                            # get file name
                            fname=$(basename $file)
                            ssh $host "mkdir -p $pdir"
                            rsync -av $pdir/$fname $host:$pdir
                    else
                            echo $file does not exists!
                    fi
            done
    done
    
  • 注意点:

    将此脚本在home/bin和/root/bin目录下,可以使用xingcang来分发xingcang权限的文件,使用root分发root权限的文件

核心文件的配置

  1. 搭建集群时需要配置4个核心文件,皆在$HADOOP_HOME/etc/hadoop目录下

    • core.site.xml文件的配置

      <?xml version="1.0" encoding="UTF-8"?>
      <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
      
      <configuration>
      	<!-- 指定NameNode的地址 -->
          <property>
              <name>fs.defaultFS</name>
              <value>hdfs://hadoop001:9820</value>
      </property
最低0.47元/天 解锁文章
等故事长大
关注 关注
  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
阿里云Hadoop的安装
weixin_49539546的博客
03-15 2954
1.创建新用户 useradd heipilei 2.heipilei用户下创建所需文件夹 mkdir sourcecode software app log lib data tmp shell 3.将下载好的hadoop java 文件上传到 software下 software 目录下 rz 4.将hadoop java 解压到 用户app下 tar -xzvf hadoop-3.1.3.tar.gz -C ../app/ tar -xzvf jdk-8u212-linux-x64.t
阿里云centos7 四台部署hadoop集群
qq_16681279的博客
05-07 1833
前言 : Hadoop 发展前景 : (1)分布式文件系统 HDFS (GFS) 。 (2)数据的计算 : 分布式计算。 1 MapReduce , 搜索排名 2 大任务 拆分成小任务 3 Map 阶段 进行任务拆分,Reduce 阶段进行数据计算汇总 。 (3)bigTable — Hbase (nosql), 行键 、列族。 启动 :start-all.sh H...
Hadoop HA部署(阿里云
热门推荐
Student_xx的博客
01-21 1万+
1.阿里云添加实例(3台) 点击控制台 进入云服务器ECS 点击创建实例 选择按量付费,区域以及资源大小,完成之后点击下一步 默认点下一步 点击下一步,其它的参照下图配置 默认点下一步 检查箭头所指几项,创建实例 2.前置环境配置 在web界面中的运维管理里边开放相关(也可以是所有)端口 关闭防火墙 3台全做 [root@ruozedata001 ~]# systemctl stop firewalld [root@ruozedata001 ~]# [root@ruozedata001 ~
阿里云服务器上搭建hadoop环境
catinlbb的博客
11-29 4044
文章目录1. 登入云端服务器2. 安装JDK5. 配置SSH免密登录6. 启动Hadoop   购买了阿里云服务器,这里搭建hadoop环境的过程都是按照官网的提供的步骤。这里对我自己按照这个步骤的一个安装过程做一个记录。 1. 登入云端服务器 要找到服务器的公网ip,然后用ssh登入就可以了。我这里遇到了一个问题就是,在windows下,用secureCRT登入的时候,总是报“密钥交换”相关的错误,仔细看了一下,是secureCRT没有服务器所支持的密钥交换的算法。 我重新安装了一个secureCRT之后
2024年大数据最全阿里云安装Hadoop全家桶(1),2024年最新别再说你不会
最新发布
2401_84182936的博客
05-13 852
测试。
Hadoop之——基于3台服务器搭建Hadoop3.x集群(实测完整版)
冰河的专栏
07-14 8448
转载请注明出处:https://blog.csdn.net/l1028386804/article/details/93892479 一、 服务器规划 二、Hadoop集群环境的准备 搭建Hadoop集群环境之前,需要为搭建Hadoop集群环境做一些相关的准备工作,以达到正确安装Hadoop集群的目的。 1.添加hadoop用户身份 以root身份登录每台虚拟机服务器,在每台服务器...
阿里云服务器上利用 Docker 搭建 Hadoop 集群
01-07
Docker 安装与配置 安装 Docker(摘自 Docker 官方文档) 设置 Docker Repository 更新软件索引$ sudo apt-get update 安装一些必要的包 $ sudo apt-get install \ ... ca-certificates \ curl \ ...
阿里云大数据Hadoop集群搭建全网最新教程
04-20
有需要linux的在评论区说一下
利用docker搭建Hadoop集群.zip
11-19
阿里云ubuntu16.04基于docker搭建hadoop详细操作步骤......里面都是详细的脚本文件,对照着我的博客做应该是没有问题的.
使用docker部署hadoop集群的详细教程
01-09
最近要在公司里搭建一个hadoop测试集群,于是采用docker来快速部署hadoop集群。 0. 写在前面 网上也已经有很多教程了,但是其中都有不少坑,在此记录一下自己安装的过程。 目标:使用docker搭建一个一主两从三台机器...
还在为搭建集群的期末作业发愁吗?最简单的搭建hadoop+spark+hive大数据集群搭建文档.docx
02-18
最简单的Hadoop+Spark大数据集群搭建方法,看这一篇就够啦,给出一个完全分布式hadoop+spark集群搭建完整文档,从环境准备(包括机器名,ip映射步骤,ssh免密,Java等)开始,包括zookeeper,hadoop,hive,spark,...
阿里云Centos7.3上 Hadoop-2.7.6集群搭建(ok!!!)
zhangvalue的博客
06-30 2070
采取的是两台阿里云服务器搭建集群1、首先进行的是ssh免密码登录的操作具体操作在上篇笔记中找 里面有2、配置Java环境具体操作上篇笔记中详细记录3、下载Hadoop2.7.2,并进行安装配置环境我是创建文件放在opt/soft文件夹下面,直接打开该文件夹,进行下载wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.6/had...
一台阿里云2台腾讯云服务器搭建Hadoop集群
gakki_smile的博客
08-15 9604
1.准备工作:jdk安装(个人选择的1.8版本) 2.ssh免密登陆: 关闭放火墙(可以将要开放的端口加入防火墙的开发端口中,学习用就直接关闭防火墙了): 1)关闭firewall: systemctl stop firewalld.service #停止firewall systemctl disable firewalld.service #禁止firewall开机启动 firewa
阿里云服务器搭建Hadoop集群
Alanyungz的博客
04-16 1475
这里写目录标题一、环境介绍二、修改hosts、hostname文件三、ssh互信四、安装java(只需在master操作,配置后再发送到slave机器)五、安装并配置Hadoop六、阿里云踩过的坑 一、环境介绍 服务器:一台阿里云服务器master,一台腾讯云服务器slave 操作系统:centOS7 Hadoophadoop-2.7.7.tar.gz Java:jdk-8u172-linux-...
Hadoop实战(1)_阿里云搭建Hadoop2.x的伪分布式环境
分享数据科学家的自我修养
10-14 2808
环境:阿里云服务器 CentOS 7 x86_64安装介质:jdk-7u75-linux-i586.tar.gz,hadoop-2.4.1.tar.gz安装jdktar -zxvf jdk-7u75-linux-i586.tar.gz配置环境变量:# vi .bash_profileJAVA_HOME=/root/training/jdk1.7.0_75 export JAVA_HOMEPATH=$
阿里云搭建hadoop集群服务器,内网、外网访问问题(详解。。。)
weixin_33906657的博客
12-06 1900
  这个问题花费了我将近两天的时间,经过多次试错和尝试,现在想分享给大家来解决此问题避免大家入坑,以前都是在局域网上搭建hadoop集群,并且是局域网访问的,没遇见此问题。 因为阿里云搭建hadoop集群,需要配置映射集群经过内网访问,也就是局域网的ip地址。   如果配置为公网IP地址,就会出现集群启动不了,namenode和secondarynamenode启动不了,如果将主机的映射...
Hadoop初次体验:各种坑以及解决办法
lmy86263的博客
09-10 2847
因为工作和以后课题方向的原因,开始涉及大数据的方向,在大数据的领域,Hadoop无论如何是绕不过去的话题,于是进入这个方向也是着手从Hadoop开始,但是从Hadoop开始,并不代表我们一定要采用它的解决方案,因为现在Hadoop自身各个组件的解耦做得已经才能够当好了,所以说我们可以把某一个组件单独拿出来使用,或者和别的框架相结合,比如单单使用HDFS,但是因为采用的计算模型可能和我们实际的业务并不相同,所以说HDF
阿里云里与hadoop相关的产品
03-29
4. E-MapReduce:阿里云提供的一款大数据计算平台,可以帮助用户快速搭建Hadoop、Spark等计算框架集群,并提供多种算法库和数据可视化工具,方便用户进行数据探索和分析。 5. DataV:阿里云大数据可视化平台,...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 在阿里云上搭建Hadoop集群 685
  • 使用Idea连接阿里云搭建的Hadoop集群 567

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 使用Idea连接阿里云搭建的Hadoop集群
2020年2篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

哆哆女性网xfplay无码专区亚洲姓氏罗宝宝起名字韩姓男孩起名诗经楚辞唐诗宋词起名时尚理发店起名汤粉店的起名柴氏起名七界战仙星光咖啡馆与死神之蝶mysticthumbs起名缺木缺水调查公司起名起名广字辈男孩姓名英文名 起名描写黄河的诗句纨绔仙医那里宝宝起名好未时起名毛上文起名多少钱免费公司起名测分民宿起名字生猪宝宝起名宜用世界上最小的花起名一一武神名字xxxmovies飞刀又见飞刀电视剧机战x中国起名实用大全起女小名洋气好听的淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化