【大数据实验2】hadoop配置、测试和实例

article/2025/6/22 22:31:09

hadoop配置、测试和实例

  • 0 环境
  • 1 配置网络
  • 2 卸载和安装JDK
  • 4 配置hadoop
    • 4.1 前提
    • 4.2 修改配置文件
    • 4.3 配置环境
    • 4.4 初始化HDFS
    • 4.5 启动hadoop
    • 4.6 登录
  • 5 测试hadoop
  • 6 hadoop实例:统计单词频数
    • 6.1 编程实现
      • 6.1.1 安装eclipse
      • 6.1.2 JAVA编程
      • 6.1.3 上传文件
      • 6.1.4 运行程序
    • 6.2 hadoop自带工具
  • 7 删除文件
  • 8 散记

有转别人的,会标明

0 环境

  • jdk1.8.0_221
  • hadoop-2.7.7
  • centos 7.7(NAT模式)

jdk1.8.0_191+hadoop-3.3.0不行

1 配置网络

NAT模式
参考我家zoxiii写的网络配置步骤👉传送门

vim /etc/sysconfig/network-scripts/ifcfg-ens33

虚拟网络IP

BOOTPROTO="static"IPADDR=192.168.10.110
GATEWAY=192.168.10.2
NETMASK=255.255.255.0
DNS1=192.168.10.2
DNS2=114.114.114.114
  • 修改hostname和hosts
vi /etc/hostname
vi /etc/hosts
  • 重启网络
service network restart
  • 查看hostname
hostname
hostname -i

2 卸载和安装JDK

JDK下载 提取码:0818

  • 查询
rpm -qa | grep java -i
  • 删除
rpm -e --nodeps 查询到的java
  • 安装
cd /root
mkdir /usr/local/src/jdk
cp jdk-8u221-linux-x64.tar.gz /usr/local/src/jdk/
rm -f jdk-8u221-linux-x64.tar.gz
cd /usr/local/src/jdk
tar -zxvf jdk-8u221-linux-x64.tar.gz
rm -f jdk-8u221-linux-x64.tar.gz
vim /etc/profile
export JAVA_HOME=/usr/local/src/jdk/jdk1.8.0_221
export PATH=$PATH:$JAVA_HOME/bin
  • 环境立即生效
source /etc/profile
  • 查看
java -version

4 配置hadoop

4.1 前提

hadoop下载 提取码:0818

  • 安装
cd /root
mkdir /usr/local/src/hadoop
cp hadoop-2.7.7.tar.gz /usr/local/src/hadoop/
rm -f hadoop-2.7.7.tar.gz
cd /usr/local/src/hadoop
tar -zxvf hadoop-2.7.7.tar.gz
rm -f hadoop-2.7.7.tar.gz
  • 创建文件夹
cd /usr/local/src/hadoop/hadoop-2.7.7
mkdir hdfs
mkdir tmp
cd hdfs
mkdir data
mkdir name

4.2 修改配置文件

传送门

4.3 配置环境

vim /etc/profile
export JAVA_HOME=/usr/local/src/jdk/jdk1.8.0_221
export HADOOP_HOME=/usr/local/src/hadoop/hadoop-2.7.7
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

在这里插入图片描述

source /etc/profile
  • 查看hadoop版本
hadoop version

版本

4.4 初始化HDFS

  • 初始化HDFS
hdfs namenode -format

4.5 启动hadoop

  • 启动Hadoop
cd /usr/local/src/hadoop/hadoop-2.7.7/sbin
./start-dfs.sh
./start-yarn.sh
  • 查看进程
jps

6个进程!!!
jps

  • 关闭防火墙
firewall-cmd --state
systemctl stop firewalld.service

4.6 登录

192.168.10.110:50070	#hdfs
192.168.10.110:8088		#yarn

5 测试hadoop

传送门

6 hadoop实例:统计单词频数

6.1 编程实现

6.1.1 安装eclipse

eclipse下载 提取码:0818

mkdir /usr/local/src/eclipse
cd /root
cp eclipse-jee-kepler-SR2-linux-gtk-x86_64.tar.gz /usr/local/src/eclipse/
rm -f eclipse-jee-kepler-SR2-linux-gtk-x86_64.tar.gz
cd /usr/local/src/eclipse
tar -zxvf eclipse-jee-kepler-SR2-linux-gtk-x86_64.tar.gz
cd eclipse
# 然后运行eclipse
./eclipse

6.1.2 JAVA编程

参考大佬写的👉传送门

  1. 创建JAVA工程并导入Hadoop所需jar包
    传送门
  2. JAVA类
    传送门
  3. 导出jar包
    传送门

6.1.3 上传文件

  • 上传文件wordTest.txt
hadoop fs -put wordTest.txt hdfs://localhost:9000/wordTest.txt
  • 查看文件
hadoop fs -ls /

查看

6.1.4 运行程序

  • 运行WordCount.jar,将结果上传到/WCResult
time hadoop jar WordCount.jar [包名.]WordCount /wordTest.txt /WCResult
# hadoop前加上time可获得时间

结果
结果

  • 查看结果
hadoop fs -ls /WCResult/
hadoop fs -cat /WCResult/part-r-00000

结果

6.2 hadoop自带工具

  • 查看之前已上传的文件
hadoop fs -ls /
hadoop fs -cat /wordTest.txt
  • 找所需jar包
cd $HADOOP_HOME/share/hadoop/mapreduce
ls
  • 运用找到的jar包
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /wordTest.txt /WCResultAuto

auto
auto

  • 查看结果
hadoop fs -ls /WCResultAuto/
hadoop fs -cat /WCResultAuto/part-r-00000

查看
auto

7 删除文件

hadoop fs -rm -r /要删除的文件

8 散记

  • hadoop命令如果找不到,试一试:
./bin/hadoop
  • 每次都要关闭防火墙,并启动Hadoop

http://chatgpt.dhexx.cn/article/YdQFsZdP.shtml

相关文章

大数据1

cd sysconfig(目录名) 进目录 ll(listlist) 查看所有的目录 cat 看目录里的内容打开文件 ~当前目录的用户主体目录 cd / 根路径 pwd 当前路径 vi 修改文件 敲I 才可以编辑 然后更改BOOTPROTO"STATIC" IPADDRIP地址19…

大数据2 Hadoop

Hadoop是Apache软件基金会下的顶级开源项目,用以提供: • 分布式数据存储 • 分布式数据计算 • 分布式资源调度 为一体的整体解决方案。 Apache Hadoop是典型的分布式软件框架,可以部署在1台乃至成千上万台服务器节点上协同工作。 个人或企…

数分-理论-大数据2-Hadoop

数分-理论-大数据2-Hadoop (数据分析系列) 文章目录 数分-理论-大数据2-Hadoop1知识点2具体内容2.1发展2.2简介2.3项目架构2.4安装应用 参考 1知识点 发展简介项目架构安装应用 2具体内容 2.1发展 Lucene:文本搜索的函数库,全文检索引擎Nutch&…

大数据2

机器学习和数据挖掘的区别 数据挖掘是一个比较大的概念,由许多学科综合而成,其包括机器学习、统计学习、数据库、领域知识及模式识别等领域。数据挖掘与机器学习可以看成是一种相交关系,两者都是依靠规律分析来预测数据趋势的,但不…

大数据行业部署实战2:环境大数据统计

实验二、环境大数据(必须基于实验一验证通过的环境) 一、实验目的二、实验要求三、实验原理四、实验步骤1、 分析数据文件2、 将数据文件上传至HDFS3 、编写月平均气温统计程序4 、查看月平均气温统计结果5、 编写每日空气质量统计程序6、 查看每日空气…

大数据(2)--Hadoop

目录标题 1.初识大数据1.1 大数据相关技术1.2 日志流量分析系统1.2.1 项目设计1.2.2 日志的捕获1.2.3 离线分析1.2.4 实时分析 1.3 系统搭建 2.Hadoop2.1 Hadoop概述2.1.1 历史2.1.2 作用 2.2 Hadoop的安装2.2.1 Hadoop版本介绍2.2.2 Hadoop 的安装有三种方式2.2.3 Hadoop伪分布…

《大数据时代》书评及书摘

三天的零碎时间把这本书读完了,内容本身其实很简单,也谈不上特别精彩,五分制的话我只能打三分。 我的理解,数据一生应该是包含了三个阶段:收集,分析,最后是预测。我们总能根据现有的数据&#x…

Python 与SQL sever数据库 图形化智能停车场管理系统

这个是我的一次课程设计,写了236行代码,都是最简单的函数和图形化界面。特别简单。首先你应该确保你的SQL数据库可以在Pycham中连接成功。不会SQL连接的的可以去其他博客写看一看。在Pycham中需要安装 Tkinter win32com.client 第三方库。 序言界面截…

asp毕业设计——基于asp+sqlserver的WEB车辆管理系统设计与实现(毕业论文+程序源码)——车辆管理系统

基于aspsqlserver的WEB车辆管理系统设计与实现(毕业论文程序源码) 大家好,今天给大家介绍基于aspsqlserver的WEB车辆管理系统设计与实现,文章末尾附有本毕业设计的论文和源码下载地址哦。需要下载开题报告PPT模板及论文答辩PPT模…

基于Java+控制台实现车辆信息管理系统

基于Java控制台实现车辆信息管理系统 一、系统介绍二、功能展示1.主要功能2.查看所有车辆信息3.车辆信息添加4.车辆信息查询5.车辆信息删除 三、系统实现1.car.java 四、其它1.其他系统实现 五、源码下载 一、系统介绍 该系统实现了简单的增删查改、采用面对对象(O…

qt 汽车管理系统

界面设计 运行后界面 数据库表: connection.h文件 #ifndef CONNECTION_H #define CONNECTION_H #include<Qtsql> #include<QDebug> #include<qdom.h> #include<QDebug> #include <QSqlQuery> static bool createConnection() { // "O…

计算机毕业设计-基于SSM的汽车维修管理系统

项目背景 随着计算机技术的高速发展&#xff0c;现代计算机系统已经从以计算为中心向以信息化处理为中心的方向发展。而汽车维修&#xff0c;不仅需要在硬件上为现代社会的人们提供一个汽车维修的平台&#xff0c;获取汽车知识的环境&#xff0c;更要在软件上为车辆提供汽车维…

ASP.NET+C#+Sql Server 1125数据库 汽车租赁系统的设计与实现+讲解视频

绪论 随着汽车行业的快速发展&#xff0c;汽车租赁行业交易的数量也随之增加&#xff0c;自2000年起&#xff0c;我国汽车租赁交易量开始进入一个快速发展的状态&#xff0c;也是汽车行业市场经济发展的重要一部分&#xff0c;近几年&#xff0c;越来越多汽车租赁公司进军当前…

Java项目:springBoot+Vue汽车销售管理系统

作者主页&#xff1a;夜未央5788 简介&#xff1a;Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 本项目基于spring boot以及Vue开发&#xff0c;为前后端分离的项目。针对汽车销售提供客户信息、车辆信息、订单信息、销售人员管理、财务报表等功能…

基于JSP的物流公司信息管理系统设计与实现

目 录 第一章 绪论 1 1.1 研究背景 1 1.2课题研究意义 1 1.3 国内外的研究状况 2 第二章 相关技术分析 3 2.1技术简介 3 2.2 工作原理 3 2.3体系结构 3 2.4编程语言的特点 3 2.5 数据库 4 第三章 需求分析 5 3.1 可行性分析 5 3.1.1 经济可行性 5 3.1.2 技术可行性 5 3.1.3 运…

C#毕业设计——基于C#+asp.net+sqlserver的汽车销售管理系统设计与实现(毕业论文+程序源码)——汽车销售管理系统

基于C#asp.netsqlserver的汽车销售管理系统设计与实现&#xff08;毕业论文程序源码&#xff09; 大家好&#xff0c;今天给大家介绍基于C#asp.netsqlserver的汽车销售管理系统设计与实现&#xff0c;文章末尾附有本毕业设计的论文和源码下载地址哦。需要下载开题报告PPT模板及…

汽车销售管理系统

文章目录 汽车销售管理系统**背景****环境****项目结构**项目详情**数据库****DBConn.java****Login.java****Data.java****CircleProgressBar.java**运行截图 汽车销售管理系统 背景 Java基础课程设计 环境 数据库&#xff1a;MySQL8.0开发环境&#xff1a;JDK1.8开发工具…

Java+SSM+Jsp+Mysql实现Web汽车信息管理系统

目录 一、系统介绍 1.开发环境 2.技术选型 3.系统功能 4.数据库文件 5.工程截图 二、系统展示 1.登录系统 2.系统首页 3.用户管理-添加用户 4.用户管理-查询用户 5.用户管理-修改用户 6.客户管理-添加客户 7.客户管理-查询客户 8.客户管理-修改客户 9.汽车管理-…

基于Java+Swing+Mysql实现汽车信息管理系统(含实训报告)

TOC 一、系统介绍 系统实现汽车入库&#xff0c;汽车出库&#xff0c;汽车查询&#xff0c;汽车信息修改和管理员登录等功能 二、功能展示 1.登陆 2.车辆信息 3.车辆入库 4.车辆出库 5.车辆查询 6、车辆信息修改 三、数据库 /*Navicat Premium Data TransferSource Serv…

汽车租赁管理系统的设计与实现(JSP+SqlServer在线租车网站)

目录 第一章 系统概述 1 1.1背景 1 1.2发展现状 1 第二章 需求分析 2 2.1 功能需求 2 2.2 数据需求 3 第三章 系统设计 5 3.1系统结构 5 3.2 数据库设计 5 3.2.1 ER图 6 3.2.2 逻辑结构 6 3.2.3 数据库物理结构 7 3.2.4 数据库实现 9 3.3用户控制系统 9 3.4模块设计 10 3.4.1 汽…