大数据平台搭建(一):虚拟机环境配置

article/2025/10/9 19:17:55

前言

     最近看了些hadoop相关的资料,然后想自己从零开始搭建一个大数据平台。

大数据平台架构

    1.概念性的东西还是不想多啰嗦,先上一张网上找的平台架构图,上图的目的是为了大家对整个平台架构有个宏观的认识,这个很重要,如果盲目的零碎的去研究效果很差。

这里写图片描述

    2.目标当然是整合图中所有框架和组件,但是时间可能有限,机器也有限(本机搭建)。所以,我的计划是先从最主要的hadoop入手,然后再慢慢扩展。

虚拟机环境搭建

1.VMware下载

     此处略过n个字。

2.centos7下载安装

    1.我下载的是最小的镜像版本

这里写图片描述

    2.用阿里云的吧

这里写图片描述

    3.下一步,选择镜像,自己起个虚拟机名字,默认步骤走就行,因为我已经安装完了,就不演示了,安装过程需要设置管理员密码、时区等,配置完后下一步直到安装完成即可。

这里写图片描述
这里写图片描述

3.虚拟机网络设置

    1.为什么要用NAT模式?可以设置静态IP,可以上网,可以作为windows客户端的服务器。
    2.主要设置NAT模式对应的网络,一般是VMnet8。

注意:IP一定要在同一个网段,且地址不能冲突!!!
这里写图片描述

     点这里也可以

这里写图片描述

    3.修改VMnet8的windows IP为192.168.8.88。

这里写图片描述

    4.虚拟机网络适配器

这里写图片描述

    5.测试网络
      linux ping 百度没问题

这里写图片描述

     windows下ping linux服务器也没问题

这里写图片描述

4.centos服务器的网络配置文件修改

    1.vim /etc/sysconfig/network-scripts/ifcfg-ens33

注意:ONBOOT设置为yes,因为centos7默认网卡是关闭的
这里写图片描述

    2.修改主机名和ip映射,这个要重启服务器
     vim etc/hostname #hadoop201
     vim etc/hosts #192.168.8.201 hadoop201

至此,已完成NAT模式下Linux服务器中 指定静态IP 和 上网 的目的,有网之后利用yum可以安装任意插件了,比如vim, lrzsz,ntp(同步网络时间),openssh-server,openssh-clients等。


5.安装JDK8,配置环境变量

    1.vim /etc/profile

这里写图片描述

     2.验证

这里写图片描述

6.关闭防火墙,同步网络时间

    systemctl stop firewalld.service #停止firewall
    systemctl disable firewalld.service #禁止firewall开机启动
    firewall-cmd --state #查看默认防火墙状态
    ntpdate pool.ntp.org #同步网络时间
    hwclock -w #将当前时间和日期写入BIOS,避免重启后失效

注意:生成环境上,肯定是要创建hadoop用户,我们这里不再增加创建用户的模块,为了简单好理解。如果是初学者,建议用root用户搞。

至此,单个节点的centos服务器的基本配置就全部完成了,以后如果再缺少插件,请用yum自行安装吧。


7.克隆集群节点(我们还需要4个节点)

    1.201这个服务器我们已经安装好了,那么就要为集群准备其他几个节点,直接克隆201即可。右键管理–>克隆–>其他都下一步,下面这里选择完整克隆

这里写图片描述

    2.克隆完成后,检查各节点配置并修改,包括网卡、主机名及映射等信息。5个节点的hosts文件全部改为如下:

这里写图片描述

8.设置ssh免密登陆

    1. cd ~ 根目录下生成rsa 非对称加密密钥 ssh-keygen -t rsa, ls -la查看如果没有.ssh文件请mkdir。
    2.五个节点执行ssh-copy-id hadoop201 把各自的公钥发送到hadoop201的授权文件 authorized_keys中;
    3.然后把hadoop201 的authorized_keys文件拷贝到其他节点,完成5个节点的相互授权,查看hadoop201的授权文件中是否都包含了所有节点的公钥

这里写图片描述

    4.将.ssh文件拷贝到其他节点
    scp -r .ssh/authorized_keys hadoop@hadoop202:~/.ssh/
    scp -r .ssh/authorized_keys hadoop@hadoop203:~/.ssh/
    scp -r .ssh/authorized_keys hadoop@hadoop204:~/.ssh/
     scp -r .ssh/authorized_keys hadoop@hadoop205:~/.ssh/
    5.设置权限,所有节点执行:chmod 700 .ssh
    6.测试ssh免密登陆

    这里写图片描述


总结:

     本文主要讲了虚拟机的配置和centos服务器的配置,为下一步集群搭建做好了准备。正常情况下这些工作应该由运维的同事来做,由于我在自己本机搭建,所以就写一下这个过程来方便大家理解。下一章节将开始集群搭建。

大数据平台搭建(二):hadoop HA 集群搭建


http://chatgpt.dhexx.cn/article/pR8DwHEj.shtml

相关文章

怎么搭建大数据平台,这个大数据平台方案值得学习

在大数据的时代,不仅仅是个人,企业的发展也离不开大数据。对于企业来说,一方面用户越来越多从线下转移到线上,用户的特点属性需要通过网络获取,企业需要依靠大数据把握市场变化并了解客户,从而提供满足市场…

大数据平台搭建,cdh选型配置

天天干后端,又干前端,本行大数据,差点生疏了,哦吼~正当我发愁之际。 领导安排任务了,下个月去某控上市公司。他们需要从0 开始做大数据平台,主要工作内容如下, 平台搭建,数据迁移&…

大数据平台CDH搭建

一、数仓之Cloudera Manager 1、CM简介 1.1、简介 Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具。 1.2、架构 1)Cloudera Repository:软件由Cloudera管理分布存储库。(有点类似Maven的中心仓库&…

大数据平台搭建目录

欢迎各位学习和借鉴搭配大数据系统 1.备注 省略了一些文件的创建,请自行创建 2.配置到大数据系统的所有配套文件 案例中所使用的版本,解决了版本适配问题 百度网盘链接:https://pan.baidu.com/s/1B5sx61Ori4U8fshHE3bJaA 提取码:6666 一.安装Lunx&…

高可用的分布式Hadoop大数据平台搭建,超详细,附代码。

目录 前言1: 前言2: 一,基础环境 1,三台Centos7.5,一台master,两台slave1和slave2 2,IP配置 ​ 3,改主机名 4,配三台主机映射 5,三台主机时钟同步 6&a…

CDH大数据平台搭建之集群规划

CDH大数据平台搭建之集群规划 前言一、集群规模二、集群规划总结 前言 话说无规矩不成方圆,搭建CDH大数据平台之前需要的工作很多,首先,你需要计算公司每日的数据量,来确定需要多少服务器,确定好服务器之后&#xff0…

大数据平台搭建及集群规划

CDH大数据平台搭建之集群规划_码上_成功的博客-CSDN博客_cdh集群规划 大数据Hadoop分布式集群部署(详细版)_arnoldmp的博客-CSDN博客_分布式集群部署 大数据平台的硬件规划、网络调优、架构设计、节点规划 【全网独家】大数据集群节点与硬件规划_大数…

知名大厂大数据平台搭建案例分享

“ 今天我们来看一下淘宝、美团和滴滴的大数据平台” 01 淘宝大数据平台 淘宝可能是中国互联网业界较早搭建了自己大数据平台的公司,下图是淘宝早期的 Hadoop 大数据平台,比较典型。 淘宝的大数据平台基本也是分成三个部分,上面是数据源与数据…

CDH大数据平台搭建之HADOOP分布式集群搭建

CDH大数据平台搭建之HADOOP安装 一、什么是HADOOP?二、如何下载1.官网下载2.网盘下载 三、搭建集群1.虚拟机准备2.安装JDK3.安装ZOOKEEPER4.集群规划5.安装HADOOP6.修改配置文件1、进入配置文件目录:2、修改env文件3、修改core-site.xml文件4、修改hdfs-site.xml文…

大数据平台搭建实训报告(思路而已)

目录 1.环境准备 1.1实验目的 1.2实践操作 2.部署HDFS 2.1实验步骤 2.2实践操作 3.实验三 HDFS shell操作 3.1实验目的 3.2实践操作 3.2.1练习对HDFS文件创建、查看、删除、复制、粘贴等文件操作 3.2.2练习本地文件与HDFS文件的上传与下载 3.2.3练习HDFS文件权限修…

CDH大数据平台搭建

Hadoop是apache旗下的一套开源软件平台, 主要对海量数据进行分布式处理。 本次部署,计划使用5台服务器,服务器磁盘规划如下: 分区挂载完成以后,使用root用户执行对目录/data授权。每台服务器都执行此命令。 chmod 777 -R /data …

Hadoop大数据平台搭建(一)

虚拟机准备(本节针对于初学者) vmawre、xshell、centos7镜像及搭建包自提地址已放在评论区。 目录 虚拟机准备(本节针对于初学者) 1、节点规划 2、虚拟机安装 3、启动虚拟机配置网关 总结 1、节点规划 2、虚拟机安装 这里的系统和…

大数据平台搭建详细流程(一)框架简介与平台准备

一、框架简介与平台准备 1.1、框架 1.2、硬件 CPU:四核、内存:4G、磁盘:50G hadoop102、hadoop103、hadoop104 1.3、操作系统 操作系统:Centos7(最小系统) 1.4、基础环境 1.4.1、网络配置 hadoop10…

Hadoop大数据平台搭建(超详细步骤)

相关软件下载链接: Xshell:家庭/学校免费 - NetSarang Website Xftp:家庭/学校免费 - NetSarang Website Xshell与Xftp官网:XSHELL - NetSarang Website Jdk:百度网盘 请输入提取码 提取码:jdhp Hado…

大数据实战平台环境搭建

大数据实战平台环境搭建 一、创建 Hadoop 用户二、更新apt和安装Vim编辑器三、安装 SSH 和配置 SSH 无密码登录四、安装 Java五、安装单机 Hadoop六、Hadoop 伪分布式安装七、HDFS常用命令八、HDFS实验之通过JAVA-API访问HDFS 一、创建 Hadoop 用户 1、创建 Hadoop 用户&#…

大数据基础平台搭建-(一)基础环境准备

大数据基础平台搭建-(一)基础环境准备 大数据平台系列文章: 1、大数据基础平台搭建-(一)基础环境准备 2、大数据基础平台搭建-(二)Hadoop集群搭建 3、大数据基础平台搭建-(三&#x…

QList添加自定义结构体

QList中使用自定义结构体后,构建错误信息如下: 看内容是说需要重载,遂进行重载,如下: 重新构建,不再提示错误。

4.6 案例10 使用QList处理数据集

本案例对应的源代码目录&#xff1a;src/chapter04/ks04_06。 本节介绍Qt的数据处理类QList。如果要使用QList&#xff0c;需要包含其头文件<QList>。本案例也设计了三种编程场景对QList的使用进行介绍。 &#xff08;1&#xff09;向QList中添加成员并遍历。 &#x…

Qt· 常用容器之QList

目录 1、QList介绍 2、构造函数 3、插入函数 4、删除和移动类函数 5、访问和查询函数 6、替换、移动和交换函数 7、运算符函数 8、迭代器函数 9、容器类型转换函数 其他内容 1、QList介绍 在开始讲解 QList 之前&#xff0c;我们先明确一下 Qt 数据容器能存储什么&a…

QT QList<T>介绍与应用、详解、使用说明、官方手册翻译

文章目录 1. 简介2. 使用示例3. 官方手册4. Member Function Documentation 1. 简介 QList<T>是目前最常用的容器类 。它存储了给定类型的值的一个列表&#xff0c;而这些值可以通过索引访问。在内部&#xff0c;QList使用数组来实现&#xff0c;一确保进行快速的基于索…