1、安装jdk
2、下载scala-ide。官网:http://scala-ide.org
3、安装maven
4、在eclipse中,配置maven的安装了路径。偏好设置--->maven--->installpath
5、修改maven的镜像文件,即setting.txt中的mirror。具体修改为如下:
<mirrors> <mirror> <id>alimaven</id> <name>aliyun maven</name> <url>http://maven.aliyun.com/nexus/content/groups/public/</url> <mirrorOf>central</mirrorOf> </mirror> <!-- mirror | Specifies a repository mirror site to use instead of a given repository. The repository that | this mirror serves has an ID that matches the mirrorOf element of this mirror. IDs are used | for inheritance and direct lookup purposes, and must be unique across the set of mirrors. | <mirror> <id>mirrorId</id> <mirrorOf>repositoryId</mirrorOf> <name>Human Readable Name for this Mirror.</name> <url>http://my.repository.com/repo/path</url> </mirror> --> </mirrors>
6、修改pom.xml文件中的内容:
(1)需要修改scala的版本
(2)需要添加spark依赖包
此时,保存就会从上面设置的镜像当中下载对应的jar包。若没有设置镜像的话,由于国外的有些包需要FQ,并且每次修改需要记载很长的时间。导致无法运行或者运行失败。
7、修改工程属性中对应的scala compiler版本。
到此基本上配置已经结束,如果通过执行:mvn clean package ;然后通过spark-submit提交运行的话,应该是不会抱错。但是本地运行的话,还是会报错,具体错误如下:
Caused by: java.lang.UnsatisfiedLinkError: no snappyjava in java.library.path
这个错误,通过Google和百度,找到一个帖子解决了这个办法:对应的网址:http://blog.csdn.net/stark_summer/article/details/47361603
通俗讲来,解决办法是:
8、解决7的问题。
(1)进入maven下载源的目录下:
cd /Users/jeffery/.m2/repository/org/xerial/snappy/snappy-java/1.0.4.1
(2)解压snappy-java-1.0.4.1.jar文件
unzip snappy-java-1.0.4.1.jar
(3)进入目录:org/xerial/snappy/native/Mac/x86_64/
cd org/xerial/snappy/native/Mac/x86_64/
(4)复制文件:
cp libsnappyjava.jnilib libsnappyjava.dylib
(5)返回到解压前的目录下,并进行压缩
先备份。 cp snappy-java-1.0.4.1.jar snappy-java-1.0.4.1.jar.old
后压缩成圆文件名:jar cf snappy-java-1.0.4.1.jar org
ok了。