Windows下的Spark环境配置（含IDEA创建工程--《Spark大数据技术与应用》第九章-菜品推荐项目）

article/2025/9/15 10:06:59

文章目录

前言
一、下载资源
二、本地配置步骤
- 1.解压
- 2.引入本地环境
- 3.启动HADOOP文件
- 4.进行Spark测试
三、IDEA引入Spark项目
- 1.idea按照scala插件
- 2.新建scala项目
- 3.配置项目
- 4.新建scala类

前言

本文适用于《Spark大数据技术与应用》第九章-菜品推荐项目环境配置：`

跟着做就行…
资源都在网盘里面，纯粹的无脑配置…

提示：以下是本篇文章正文内容，所用资源版本过低，用于课本实验，且已有Java环境

一、下载资源

scala：2.12.8
spark：1.6.2
hadoop：2.6.4
hadoop启动文件exe

JAVA
如果按照我的方法在仍然不能使用的话，那大概率就是你的JAVA环境有问题，那么你就用我的JAVA文件找一篇JAVA配置的文章把JAVA环境换成我的

链接：https://pan.baidu.com/s/1dVLt3q_D3AQuwRZ0Q2TVvg 提取码：rfwb

![在这里插入图片描述](https://img-blog.csdnimg.cn/c50b6d9837284c6fba1396df9e819b88.png

二、本地配置步骤

1.解压

记住：解压到根目录下或者父目录不带空格还不如直接这样直接搞到D盘下面（反正你水完课设再也不用了）

在这里插入图片描述

2.引入本地环境

1.打开高级环境配置并且找到“环境变量”
在这里插入图片描述
2.进入之后在系统变量里面找到path

3.将Spark，Hadoop，scala三个文件的bin文件路径引入path里面

注意：Hadoop文件的bin和sbin都要引入

在这里插入图片描述

4.系统编辑新建名为HADOOP_HOME的变量
在这里插入图片描述

3.启动HADOOP文件

首先你要检查你的C盘
有没有tmp文件，tmp文件下面有没有hive文件，没有你要手动创建
在这里插入图片描述
将winutils.exe文件复制到hadoop的bin目录下面

打开cmd
输入
前面半句是你自己的winutils.exe路径，后半句是C盘hive的路径，不要无脑复制

D:\hadoop-2.6.4\bin\winutils.exe chmod 777 C:\tmp\hive

在这里插入图片描述

4.进行Spark测试

打开cmd
输入

spark-shell

出现这两句话即为成功
在这里插入图片描述

注：一般问题

1.出现CMD出现Spark字母，但是出现如下

在这里插入图片描述
说明是Hadoop的配置问题。重新看我的过程

2.连字母都出现不了而且scala和spark配置没有问题
说明是JAVA环境问题

三、IDEA引入Spark项目

1.idea按照scala插件

在
File->Plugins->搜索scala->然后下载按照->重启idea
在这里插入图片描述

2.新建scala项目

点这个创建
在这里插入图片描述
java用本地的

3.配置项目

在File->Projct structure->Libraies
点击左上角加号
在这里插入图片描述
点击java引入包
![在这里插入图片描述](https://img-blog.csdnimg.cn/6ce1cb8352e64d6abf4fc64cba818dbe.png
找到你下载的Spark文件下面的lib文件点击引入

在这里插入图片描述

再次点击加号，点击scala
点击下方browse按钮

找到本地scala的文件引入

成功

4.新建scala类

![在这里插入图片描述](https://img-blog.csdnimg.cn/26419f59712f47209eb68edf9db201d8.png
点击Object，输入类名

完成

http://chatgpt.dhexx.cn/article/NmHDn03K.shtml

相关文章

Spark开发：Spark大数据开发编程示例

Spark开发：Spark大数据开发编程示例

大数据开发人员，根据企业大数据处理的需求，进行大数据平台系统的搭建，比如说Hadoop，比如说Spark，而不同的大数据处理框架，采取不同的编程语言和编程模型，这就需要技术开发人员要掌握相关的技术。…

阅读更多...

《Spark大数据技术与应用》肖芳张良均著——课后习题

《Spark大数据技术与应用》肖芳张良均著——课后习题

目录教材知识汇总课后习题第一章 Spark概述Spark的特点Spark生态圈Spark应用场景第二章 Scala基础匿名函数SetMapmapflatMapgroupBy课后习题第三章 Spark编程教材52页任务3.2及之后的任务重点复习sortBy排序collect查询distinct去重zip实训题实训1实训2选择题编程题第四章…

阅读更多...

Spark大数据技术与应用第一章Spark简介与运行原理

Spark大数据技术与应用第一章Spark简介与运行原理

Spark大数据技术与应用第一章Spark简介与运行原理 1.Spark是2009年由马泰扎哈里亚在美国加州大学伯克利分校的AMPLab实验室开发的子项目，经过开源后捐赠给Aspache软件基金会，成为了Apache Spark。由Scala语言实现的专门为大规模数据处理而设计的快速通用…

阅读更多...

大数据之Spark:Spark 基础

大数据之Spark:Spark 基础

目录 1、Spark 发展史2、Spark 为什么会流行3、Spark 特点4、Spark 运行模式 1、Spark 发展史 2009 年诞生于美国加州大学伯克利分校 AMP 实验室； 2014 年 2 月，Spark 成为 Apache 的顶级项目； Spark 成功构建起了一体化、多元化的大数据处…

阅读更多...

大数据之spark详解

大数据之spark详解

目录什么是spark： 功能历史上和hadoop的区别： spark的五大核心模块： ➢ Spark Core 什么是spark： 简单一点Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。属于mapreduce的加强版本，结合了其优点…

阅读更多...

09.大数据技术之Spark

09.大数据技术之Spark

文章目录一、Spark概述1、概述2、Spark特点二、Spark角色介绍及运行模式1、集群角色2、运行模式三、Spark集群安装1.Local模式1.下载文件2.解压缩3、修改配置文件4.配置环境变量5.启动服务6.启动客户端 2.Standalone模式1.停止服务2.修改配置文件spark-env.sh3.修改配置文件…

阅读更多...

大数据框架之Spark详解

大数据框架之Spark详解

目录 1 Spark概述1.1 Spark是什么？1.2 Spark内置模块1.3 Spark 特点 2 RDD概述2.1 什么是RDD？2.2 RDD的属性2.3 RDD特点2.4 弹性体现在哪？2.5 分区2.6 分区2.7 依赖2.8 缓存2.9 CheckPoint 1 Spark概述 1.1 Spark是什么？ Spark是…

阅读更多...

大数据学习之 Spark 概述

大数据学习之 Spark 概述

文章目录一、Spark简介Spark与Hadoop的区别部署模式二、 Spark架构1.Driver2.Executor3.Master & Worker4.Cluster manager5.ApplicationMaster补充点：Stage执行过程三、Shuffle机制shuffle介绍Shuffle的影响导致Shuffle的操作四、RDD（弹性分布式…

阅读更多...

大数据技术---Spark

大数据技术---Spark

一、Spark简介 1、Spark概述 Spark：由美国加州伯克利大学的AMP实验室于2009年开发，基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序。三大分布式计算系统开源项目：Hadoop、Spark、Storm。 Spark的…

阅读更多...

KB、MB、GB等和KiB、MiB、GiB等的区别

KB、MB、GB等和KiB、MiB、GiB等的区别

今天装系统RHEL7.7，在分区时发现单位变成MiB、GiB了，有点奇怪就查了查。区别： KB、MB、GB等单位以10为底数的指数 KiB、MiB、GiB等单位是以2为底数的指数如：1KB10^31000, 1MB10^610000001000KB,1GB10^910000000001000MB,而 …

阅读更多...

asset size limit: The following asset(s) exceed the recommended size limit (244 KiB).

asset size limit: The following asset(s) exceed the recommended size limit (244 KiB).

webpack打包提示文件体积过大导致： The following asset(s) exceed the recommended size limit (244 KiB). This can impact web performance. entrypoint size limit: The following entrypoint(s) combined asset size exceeds the recommended limit (244 Ki…

阅读更多...

当git clone遇到client_loop:send disconnect: Connection reset by peer00 Kib/s

当git clone遇到client_loop:send disconnect: Connection reset by peer00 Kib/s

当git clone遇到client_loop:send disconnect: Connection reset by peer00 Kib/s 1. 问题描述2.问题解决3.原因分析 1. 问题描述刚换了新电脑，重新配置了下git仓库的ssh后，迫不及待想 git clone 先项目。发现遇到个问题： 在执行 git clone…

阅读更多...

Kibana

Kibana

Kibana是一个开源的分析和可视化平台，设计用于和Elasticsearch一起工作。你用Kibana来搜索，查看，并和存储在Elasticsearch索引中的数据进行交互。你可以轻松地执行高级数据分析，并且以各种图标、表格和地图的形式可视化数据。…

阅读更多...

WARNING in asset size limit: The following asset(s) exceed the recommended size limit (244 KiB)

WARNING in asset size limit: The following asset(s) exceed the recommended size limit (244 KiB)

Taro打包h5体积限制警告： WARNING in asset size limit: The following asset(s) exceed the recommended size limit (244 KiB). 可以使用webpack-bundle-analyzer插件对打包体积进行分析，参考代码： webpackChain (chain) {chain.plug…

阅读更多...

【名词解释】KiB和KB，MiB和MB，GiB和GB 等的区别以及1M带宽到底是多少？

【名词解释】KiB和KB，MiB和MB，GiB和GB 等的区别以及1M带宽到底是多少？

目录 1. KiB和KB，MiB和MB，GiB和GB 2. 宽带速度 3. 单位换算 1. KiB和KB，MiB和MB，GiB和GB KiB和KB，MiB和MB，GiB和GB 等的区别: 1KB(kilobyte)10^31000byte, 1KiB(kibibyte)2^101024byte …

阅读更多...

b、B、KB、Kib、MB、MiB、GB、GiB、TB、TiB的区别

b、B、KB、Kib、MB、MiB、GB、GiB、TB、TiB的区别

1024这个数字，想必计算机行业从业人员应该不会陌生，甚至10月24日还被当做程序员日，如果你问一个程序员1GB等于多少MB,他大概率会不假思索回答:1024。没错，对于稍微对计算机或者网络有了解的人，一般都认为1024是数据容…

阅读更多...

KB和KiB的区别是什么?

KB和KiB的区别是什么?

KB和KiB的区别是什么? 文章目录 KB和KiB的区别是什么?前言MB与MiB的区别：KB和KiB的区别为什么买到的硬盘容量总是会少一些？ 前言今天整理资料时发现使用windows自带的资源管理器查看文件夹大小时计算很缓慢, 机智的我想到了使用dir命令来查看哈哈~…

阅读更多...

KiB是什么单位

KiB是什么单位

kiB1024byte kb1000byte

阅读更多...

linux必备软件合集

linux必备软件合集

Ubuntu常用软件合集我用的使Ubuntu-Kylin14.04,原因呢主要是觉得使本土化的，自带了日历、输入法、优客助手等易于上手的应用。也省的每次安装完原生的系统再麻烦的安装,但是这些软件并不仅仅局限于ubuntu14.04 美化篇刚装上ubuntu，看起来很朴素&…

阅读更多...

软件测试周刊（第82期）：其实所有纠结做选择的人心里早就有了答案，咨询只是想得到内心所倾向的选择。

软件测试周刊（第82期）：其实所有纠结做选择的人心里早就有了答案，咨询只是想得到内心所倾向的选择。

欢迎来到第 82 期！这里记录过去一周我们看到的软件测试及周边的行业动态，周五发布。本期看点：B站是如何建设移动真机测试集群的？百人测试团队的测试效能体系应该如何建设？闲鱼交易链路自动化回归测试是怎么做的&#…

阅读更多...

推荐文章