Spark入门到精通:第三节 Spark Intellij IDEA开发环境搭建

作者:周志湖 网名:摇摆少年梦 微信号:zhouzhihubeyond

本节主要内容Intellij IDEA 14.1.4开发环境配置Spark应用程序开发1. Intellij IDEA 14.1.4开发环境配置

Intellij IDEA 功能十分强大,能够开发JAVA、Scala等相关应用程序,在依赖管理 智能提示等方面做到了极致,大家可以到:下载,目前有两种:Ultimate Edition Free 30-day trial;Community Edition FREE。Ultimate版本是商业软件,需要付费,Community 版为免费版,足够平时日常开发需要。最新的版是 Intellij IDEA 14.1.4,但Intellij IDEA 没有自带scala开发插件,需要手功安装,但本人测试的时候发现,直接在Intellij IDEA中装很难装成功(个中原因大家懂得),为此本人将带有Scala插件的Intellij IDEA已经打包好了,大家直接下载就可以进行Scala及后期的Spark应用程序开发,下载地址:链接: 密码:rcsy 当然,上面提供的是Linux环境下的Intellij IDEA。

下载完成后,解压到/hadoopLearning目录,得到

将其设置到环境变量 vim /etc/profile,添加红色下划线内容

然后执行

root

启动Intellij IDEA,如下图所示(本机上已经创建过scala工程项目)

(1)创建Scala项目

File->new->Project,如下图

选择Scala

然后next

其中Project SDK指定安装的JDK,Scala SDK指定安装的Scala(这里使用的是IDEA自带的scala SDK),这里将项目名称命令为SparkWordCount,然后finish

在IDEA中开发应用程序时,常常需要通过一定的文件目录组织进行源码编写,例如源文件目录、测试源文件目录,下面演示在Intellij IDEA的src目录下创建main/scala源文件目录。 直接按F4或右鍵点击工程文件

再选择open module setting,打开项目配置,点击src目录,然后右键创建main/scala文件夹,再点击scala文件夹为sources,如下图所示

### (2)导入Spark 1.5.0依赖包 直接F4打开Project Structure,然后选择libraries

点击上图中的+添加外部依赖包,选择”java”,然后再选择spark-assembly-1.5.0-hadoop2.4.0.jar

成功后如下图

至此Spark开发环境配置完成

2. Spark应用程序开发(1) 本地方式执行Spark WordCount程序

在src/main/scala源文件目录中创建一个SparkWordCount 应用程序对象,编辑内容如下:

import org._import org.apache.spark.{SparkConf, SparkContext}object SparkWordCount{ def main(args: Array[String]) {//输入文件既可以是本地linux系统文件,也可以是其它来源文件,例如HDFSif (args.length == 0) {System.err.println(“Usage: SparkWordCount <inputfile>”)System.exit(1)}//以本地线程方式运行,可以指定线程个数,//如.setMaster(“local[2]”),两个线程执行//下面给出的是单线程执行val conf = new SparkConf().setAppName(“SparkWordCount”).setMaster(“local”)val sc = new SparkContext(conf)//wordcount操作,计算文件中包含Spark的行数val count=sc.textFile(args(0)).filter(line => line.contains(“Spark”)).count()//打印结果println(“count=”+count)sc.stop() }}

编译代码,直接Build->Make Project

然后编程运行参数,Run->Edit Configurations

Main Class输入:SparkWordCount Program arguments输入:/hadoopLearning/spark-1.5.0-bin-hadoop2.4/README.md 如下图:

完成后直接Run->Run或Alt+Shift+F10运行程序,执行结果如下图:

(2) Spark集群上执行Spark WordCount程序将SparkWordCount打包成Jar文件却只能这样。只有对爱的人,我们才会斤斤计较,锱铢必较。

Spark入门到精通:第三节 Spark Intellij IDEA开发环境搭建

相关文章:

你感兴趣的文章:

标签云: