Hadoop安装教程 Mac版

article/2025/10/7 13:32:19

Hadoop安装教程 Mac版

一、JDK环境安装

1. 下载JDK1.8

Oracle官网下载JDK1.8版本
按照系统提示安装

2. 配置JDK环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_281.jdk/Contents/Home
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar 

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

二、Hadoop安装

1. 设置ssh免密码登录

因为Hadoop是分布式平台,需要多个机器之间协作,设置ssh免密码登录可以减少每次登陆主机输入密码的繁琐流程。

1) 在Mac的系统偏好设置–>共享中打开远程登录:
2) 在terminal中输入 ssh-keygen -t rsa ,生成rsa公钥,接下来一路按回车键或者输入y就行了:
3) 在terminal中输入 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys ,将公钥的内容写入到authorized_keys文件中。
4) 在terminal中输入 ssh localhost ,不需要密码也能登录,说明设置成功。

2. Hadoop下载与配置

1) 下载Hadoop

方法一:brew install hadoop
方法二:Hadoop官网下载
方法三:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)
Note:推荐使用方法三,并将Hadoop文件解压到 /Library/Hadoop 文件夹下,以达到和笔者配置相同的效果。

2) 配置Hadoop环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

HADOOP_HOME=/Library/Hadoop/hadoop-3.2.2
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

3) 修改Hadoop配置文件

打开 /Library/Hadoop/hadoop-3.2.2/etc/hadoop 文件夹:

a. 配置 core-site.xml 文件

<configuration><property><name>fs.defaultFS</name><value>hdfs://0.0.0.0:9000</value></property><!-- 指定hadoop运行时产生文件的存储路径 --><property><name>hadoop.tmp.dir</name><!-- 配置到hadoop目录下temp文件夹 --><value>/Library/Hadoop/hadoop-3.2.2/tmp</value></property>
</configuration>

b. 配置 hdfs-site.xml 文件

<configuration><property><!--指定hdfs保存数据副本的数量,包括自己,默认为3--><!--伪分布式模式,此值必须为1--><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><!-- name node 存放 name table 的目录 --><value>file:/Library/Hadoop/hadoop-3.2.2/tmp/hdfs/name</value></property><property><name>dfs.datanode.data.dir</name><!-- data node 存放数据 block 的目录 --><value>file:/Library/Hadoop/hadoop-3.2.2/tmp/hdfs/data</value></property><property><name>dfs.namenode.secondary.http-address</name><value>localhost:9001</value></property><property><name>dfs.webhdfs.enabled</name><value>true</value></property>
</configuration>

c. 配置 mapred-site.xml 文件

<configuration><property><!--指定mapreduce运行在yarn上--><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

d. 配置 yarn-site.xml 文件

<configuration><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property><property><!--NodeManager获取数据的方式--><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.application.classpath</name><value>/Library/Hadoop/hadoop-3.2.2/etc/hadoop:/Library/Hadoop/hadoop-3.2.2/share/hadoop/common/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/common/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/hdfs:/Library/Hadoop/hadoop-3.2.2/share/hadoop/hdfs/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/hdfs/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/yarn:/Library/Hadoop/hadoop-3.2.2/share/hadoop/yarn/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/yarn/*</value></property>
</configuration>

3. 启动Hadoop

1) 初始化

在terminal输入 hdfs namenode -format
(只初次启动需要)

2) 启动Hadoop集群

在terminal输入 start-all.sh (或者分别输入 start-dfs.shstart-yarn.sh
使用 jps (JavaVirtualMachineProcessStatus) 命令查看Hadoop是否已启动,运行的java进程中应包含以下几种:

4050 Jps
3956 NodeManager
3653 SecondaryNameNode
3414 NameNode
3852 ResourceManager
3518 DataNode

3) 查看NameNode和Yarn

访问 http://localhost:9870/dfshealth.html#tab-overviewnamenode
访问 http://localhost:8088/cluster
yarn

4) 运行Hadoop自带的wordcount程序

a. 新建一个 word.txt 文件并输入几个单词
b. 在hdfs文件系统上创建input文件夹 hdfs dfs -mkdir /input
c. 将word.txt放入input文件夹 hdfs dfs -put words.txt /input
d. 查看是否已放入文件 hdfs dfs -ls /input
e. 运行wordcount程序 hadoop jar /Library/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar wordcount /input /output
(Note:输出目录必须是一个不存在的目录,输出结果无法存放在已有目录中)
f. 查看程序输出 hdfs dfs -ls /output
g. 打开输出文件 hdfs dfs -cat /output/part-r-00000

5) 关闭Hadoop集群

在terminal输入 stop-all.sh

三、Spark安装

1. 安装Scala

1) 下载Scala

方法一:Scala官网下载
方法二:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)
将Scala文件解压,并移动到 /usr/local/scala 文件夹下

cd ~/Downloads/
tar -zxvf scala-2.12.13.tgz
mv scala-2.12.13 /usr/local/scala

2) 配置Scala环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

SCALA_HOME=/usr/local/scala
export PATH=$PATH:$SCALA_HOME/bin

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

2. 安装Spark

1) 下载Spark

方法一:brew install apache-spark
方法二:Spark官网下载
方法三:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)
Note:推荐使用方法三,并将Spark文件解压到 /Library/Hadoop 文件夹下,以达到和笔者配置相同的效果。

2) 配置Spark环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

SPARK_HOME=/Library/Hadoop/spark-3.1.1-bin-hadoop3.2
export PATH=$PATH:$SPARK_HOME/bin

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

3) 修改Spark配置文件

3. 启动Spark

首先启动Hadoop集群 start-all.sh

1) 启动master

在terminal输入 cd $SPARK_HOME 进入Spark文件夹
./sbin/start-master.sh

访问 http://localhost:8080,获取master的URL信息。
master

2) 启动slave

复制上图红框圈出的URL,替换下面命令的URL部分(spark://—)
./sbin/start-worker.sh spark://—

3) 同时启动master和slave

使用以下命令可以同时启动master和slave
./sbin/start-all.sh
使用 jps 命令查看Spark是否已启动,运行的java进程中应包含以下几种:

3956 NodeManager
3653 SecondaryNameNode
3414 NameNode
7881 Jps
7819 Master
3852 ResourceManager
3518 DataNode
7871 Worker

4) 关闭Spark

./sbin/stop-all.sh


http://chatgpt.dhexx.cn/article/HQYSG0tZ.shtml

相关文章

CentOS 6虚拟机Hadoop安装教程

前言 本人初学hadoop&#xff0c;在安装配置环境时发现网上大部分博客的教程都不太完善&#xff0c;所以我结合了这些博客内容和老师的讲解写了下面这一份教程&#xff0c;这些操作都是本人经过尝试确认过没有问题的操作&#xff08;如果有问题的话希望大家能够指出 &#xff…

Hadoop安装教程_单机/伪分布式配置_Hadoop 2.7.7(2.7.7)/CentOS Linux release 7.4.1708

作为大数据研发工程师基础技能&#xff0c;当开始着手 Hadoop课程教学时&#xff0c;安装 Hadoop 往往会成为新手的一道门槛。尽管安装其实很简单&#xff0c;书上有写到&#xff0c;官方网站也有 Hadoop 安装配置教程&#xff0c;但由于对 Linux 环境不熟悉&#xff0c;书上跟…

超详细Hadoop安装教程(单机版、伪分布式)

超详细Hadoop安装教程&#xff08;单机版、伪分布式&#xff09; 1.Hadoop分布式系统基础架构介绍1.1.Hadoop核心 2.Hadoop安装教程2.1.环境准备2.2.配置用户ssh 免密登录2.3.JAVA环境的安装和配置2.4.Hadoop安装2.5.单机版Hadoop配置2.6.伪分布式Hadoop配置2.7Hadoop初始化 1.…

Hadoop安装教程_单机/伪分布式配置

目录 测试环境创建hadoop用户更新apt安装SSH、配置SSH无密码登陆配置Java环境安装 Hadoop3.1.3Hadoop部署方式介绍Hadoop单机配置(非分布式)Hadoop伪分布式配置运行Hadoop伪分布式实例 测试环境 Linux系统版本&#xff1a;ubuntukylin-20.04-pro Hadoop版本&#xff1a;hadoop…

Hadoop安装教程方式

本次教程首先介绍的是根据个人经验来安装hadoop环境&#xff0c;其次是林子雨老师Hadoop安装教程方式&#xff0c;大家可以自行选择其中一种方式来进行安装。另外&#xff0c;还附送根据个人经验进行虚拟机磁盘扩容&#xff0c;可以说是痛苦经历吧&#xff01; 个人安装hadoop…

Hadoop安装教程

1:先解决桌面向虚拟机黏贴问题。(在windos环境中下载好hadoop安装包) sudo apt-get autoremove open-vm-tools sudo apt-get update sudo apt-get install open-vm-tools-desktop reboot 2:下载openssh-server sudo apt-get install openssh-server 3:登陆ssh ssh local…

Hadoop安装教程(单机/伪分布式配置)

Hadoop安装文件&#xff0c;可以到Hadoop官网下载&#xff0c;也可以点击这里从百度云盘下载&#xff08;提取码&#xff1a;99bg&#xff09;&#xff0c;进入该百度云盘链接后&#xff0c;找到Hadoop安装文件hadoop-2.7.1.tar.gz&#xff08;本教程也可以用于安装Hadoop 2.7.…

手机突发bug?这几种Android 手机自动化测试工具,关键时刻轻松搞定你的手机!

主要分享软件测试的学习资源&#xff0c;帮助想转行、进阶、小白成为高级测试工程师…1、Monkey是Android SDK自带的测试工具&#xff0c;在测试过程中会向系统发送伪随机的用户事件流&#xff0c;如按键输入、触摸屏输入、手势输入等等&#xff09;&#xff0c;实现对正在开发…

安卓自动化测试框架

安卓APP测试框架总结&#xff1a; 基于Instrumentation的测试框架&#xff0c;比如Espresso&#xff0c;Robotium&#xff0c;Selendroid等&#xff0c;都不能支持跨APP使用。 如自动化测试中有跨APP操作&#xff0c;我们可以结合UiAutomator实现。支持BDD&#xff08;行为驱动…

自动化测试工具-Airtest

目录 一、Airtest介绍与安装二、Airtest基于图像识别自动控制手机App流程三、Airtest基于Poco的UI组件自动化控制App流程四、Airtest实现手机群控操作 一、Airtest介绍与安装 主要介绍区别&#xff0c;以及各种详细的教程可以看这篇文章&#xff0c;和selenium、appium都是用来…

手把手教你使用手机自动化测试工具Airtest

安卓手机自动化操作框架--Airtest 项目官网&#xff1a;http://airtest.netease.com/ 前言 Airtest是网易基于信息识别出品的一个自动化操作框架&#xff0c;可以模拟人工机械操作&#xff0c;对于日常中一些机械录入手机系统的信息完全可以使用Airtest来代替&#xff0c;实现录…

APP自动化测试

大框架参考&#xff1a;appium新手入门&#xff08;第2步Android和sdk安装与配置需要百度&#xff09; 前提&#xff0c;已经安装好了JDK&#xff0c;Maven 一、安装Android SDK 1、下载地址 http://tools.android-studio.org/index.php/sdk 2、设置Android环境变量 3、安…

android 自动化测试

Android 谈谈自动化测试 Android自动化测试原来可以这么简单 几款Android 应用自动化测试工具 Android自动化测试探索&#xff08;一&#xff09;adb详细介绍 - 周希 - 博客园 移动测试基础 Android&#xff1a;自动化兼容性测试 Android 上一次编写&#xff0c;随处测试 a…

手机自动化测试

随着手机被越来越多人使用&#xff0c;移动自动化也是趋势所在。 测试的时间是至关重要的&#xff0c;尤其是移动测试&#xff0c;软件测试生命周期中的手工测试的时间已经影响到了手机抢占最佳市场先机。因此自动化是不可避免的需求。 什么是手机自动化测试? 要回答这个问题&…

App 自动化测试

一、5分钟上手自动化测试——AirtestPoco快速上手 - Airtest Project DocsAirtest Project Docshttps://airtest.doc.io.netease.com/tutorial/1_quick_start_guide/自动化测试工具-Airtest_十一姐的博客-CSDN博客_airtest工具目录一、Airtest介绍与安装二、Airtest基于图像识别…

android 自动化测试工具

Auto.js https://github.com/hyb1996/Auto.js/tree/master/app/src/main/assets/sample 布局范围分析 https://blog.csdn.net/zy0412326/article/details/105140707 免费版auto.js apk 下载 https://zhuanlan.zhihu.com/p/90065914?from_voters_pagetrue&ivk_sa10243…

Github每日精选(第65期):手机自动化测试工具maestro

Maestro 现在手机ui的测试工具已经很多了&#xff0c;为什么还要多一款Maestro 呢&#xff1f;我们来看看Maestro 的介绍。 Maestro 是为您的移动应用程序自动化 UI 测试的最简单方法。 github的地址在这里。 Maestro 建立在其前辈&#xff08;Appium、Espresso、UIAutomat…

手机自动化测试工具实现

手机自动化测试工具实现 一、PC 端监控工具实现 1、手机自动化可解决的问题 ( 1 ) 压力测试&#xff1a;一些连续不断的操作&#xff0c;比如反复切换歌曲播放及联网操作等 ( 2 ) 极限临界测试&#xff1a;一些极限条件的构造&#xff08;创建多个列表&#xff09;及输入字…

五款Android 应用的自动化测试工具

如今自动化测试已经应用到每天的测试中。这不足为奇&#xff0c;因为自动化测试在测试过程中节约了时间&#xff0c;还能避免包括人为因素造成的测试错误和遗漏。 自动化测试工具选择很多。一些是开源的&#xff0c;一些非常贵。一些自动化工具是几年前出的,一些才在市场上出来…

Android 应用有哪些自动化测试工具

目录 简述&#xff1a; 1、Monkey 测试 2、 MonkeyRunner 测试 3、Robotium测试 4、Ronaorex测试 5、Appium测试 6、UI Automator 测试 7、TestBird 测试 简述&#xff1a; 本文介绍几款流行的 Android应用自动化测试工具。希望对你有帮助&#xff0c; Monkey测试&…