大三寒假生活指导

1.FTP在主机和虚拟机之间传文件。

这里需要注意的是,Linux系统对文件访问权限有着严格的规定,如果目录和文件的访问权限没有授权给某个用户,那么,该用户是无法访问这些目录和文件的。所以,当使用FileZilla连接Linux虚拟机时,如果采用用户名hadoop连接,那么,就只能把文件上传到Ubuntu系统中hadoop用户的主目录,也就是“/home/hadoop”目录,是无法对其他目录进行操作的,企图把文件传输到其他目录下就会失败。如果要顺利传输到其他目录,就必须登录Ubuntu系统,使用root权限把某个目录的权限赋予给hadoop用户(后面的Linux系统基本命令会涉及到为用户授权的方法)。

2.spark-shell命令及其常用的参数如下:

./bin/spark-shell --master <master-url>

Spark的运行模式取决于传递给SparkContext的Master URL的值。Master URL可以是以下任一种形式:

* local 使用一个Worker线程本地化运行SPARK(完全不并行)

* local[*] 使用逻辑CPU个数数量的线程来本地化运行Spark

* local[K] 使用K个Worker线程本地化运行Spark(理想情况下,K应该根据运行机器的CPU核数设定)

* spark://HOST:PORT 连接到指定的Spark standalone master。默认端口是7077.

* yarn-client 以客户端模式连接YARN集群。集群的位置可以在HADOOP_CONF_DIR 环境变量中找到。

* yarn-cluster 以集群模式连接YARN集群。集群的位置可以在HADOOP_CONF_DIR 环境变量中找到。

* mesos://HOST:PORT 连接到指定的Mesos集群。默认接口是5050。

可以通过下面命令启动spark-shell环境:

bin/spark-shell

该命令省略了参数,这时,系统默认是“bin/spark-shell –master local[*]”,也就是说,是采用本地模式运行,并且使用本地所有的CPU核心。

使用命令“:quit”退出Spark Shell

也可以直接使用“Ctrl+D”组合键,退出Spark Shell。

遇到的问题:

  1. sbt安装报错

产生这个错误需要把jar包里的sbt/sbt.boot.properties文件中将 [repositories] 处修改为如下内容(即增加了一条 oschina 镜像,并且将原有的 https 镜像都改为相应的 http 版)

将sbt安装在/usr/local/sbt中。

$sudo mkdir /usr/local/sbt
$sudo chown -R hadoop /usr/local/sbt #username is hadoop.
$cd /usr/local/sbt
$mkdir sbtlaunch #store sbt-launch.jar

1.下载sbt-launch.jar,并存放至/usr/local/sbt/sbtlaunch
$cd /usr/local/sbt/sbtlaunch
$wget https://repo.typesafe.com/typesafe/ivy-releases/org.scala-sbt/sbt-launch/0.13.9/sbt-launch.jar -O ./sbt-launch.jar #download sbt-launch.jar
$unzip -q ./sbt-launch.jar #解压

2.需要修改其中的./sbt/sbt.boot.properties文件,将[repositories]处修改为如下内容:
即增加一条aliyun-nexus的镜像。
$cd /usr/local/sbt/sbtlaunch
$vim ./sbt/sbt.boot.properties

修改为如下
[repositories]
local
aliyun-nexus: http://maven.aliyun.com/nexus/content/groups/public/
jcenter: http://jcenter.bintray.com/
typesafe-ivy-releases: http://repo.typesafe.com/typesafe/ivy-releases/, [organization]/[module]/[revision]/[type]s/[artifact](-[classifier]).[ext], bootOnly
maven-central
所有https改成http

3.删除原来的sbt-launch.文件,然后重新打包

$rm ./sbt-launch.jar #delete the old jar
$jar -cfM ./sbt-launch.jar . #create new jar

4.在/usr/local/sbt目录下创建sbt脚本文件并赋予可执行权限,来执行sbt-launch.jar
$cd /usr/lcoal/sbt
$vim ./sbt

5.添加如下内容:
SBT_OPTS="-Xms512M -Xmx1536M -Xss1M -XX:+CMSClassUnloadingEnabled -XX:MaxPermSize=256M"
java $SBT_OPTS -jar `dirname`/sbt-launch.jar "[email protected]" #dirname为路径名

my dirname : /usr/local/sbt/sbtlaunch

6.保存后,为./sbt增加可执行权限

$chmod u+x ./sbt

7.检验sbt是否可用

$./sbt sbt-version

如果出现failed就在执行$./sbt sbt-version

原文地址:https://www.cnblogs.com/quyangzhangsiyuan/p/12184824.html

时间: 2024-08-02 01:42:24

大三寒假生活指导的相关文章

大三寒假生活4

感觉今天也没整出什么大的进展,在学习eclipse编写spark程序过程中,虚拟机中因为eclipse版本号的问题安装不上spark和scala插件,鼓捣了半天也没有进展,在虚拟机中下载对应的版本因为网速过于慢最终也放弃了.最终从windows中下载了对应的eclipse版本,通过ftp传到了虚拟机中.在下载的过程中,打算通过windows中的eclipse远程连接虚拟机,但在安装插件的过程中报出了错误,搜了半天也没解决,明天继续解决. 在上述过程下载等过程中,学习了scala语言的一些知识.尽

大三寒假生活3

今天完成了spark实验二,花费的时间太多,没由大到预期的计划.另外打包过程中下载时候遇到链接打不开404是不影响下载的,完成打包的学习. 下边是今天的实验. 2, 模拟图形绘制 对于一个图形绘制程序,用下面的层次对各种实体进行抽象.定义一个 Drawable 的特质,其包括一个 draw 方法,默认实现为输出对象的字符串表示.定义一个 Point 类表示点,其混入了 Drawable 特质,并包含一个 shift 方法,用于移动点.所有图形实体的抽象类为Shape,其构造函数包括一个 Poin

大三寒假生活5

今天继续学习了scala的相关知识. 经过一下午的时间,把windows中eclipse的maven和scala插件成功安装上了,但是Linux中的eclipse却安装不上,经过查询,初步判断是eclipse的版本太低,导致maven插件安装失败.于是对Linux中的eclipse进行了更新,但一下午过去了还没有更新完,明天继续搞. eclipse如果不是scala ide for eclipse需要安装maven插件和scala插件 跟着林子雨老师的教程做的,却发现maven插件安装不上,经过

大三寒假生活13

今天完成了实验五第三问,实验六也进行了一点.明天继续进行实验六. 编程实现利用 DataFrame 读写 MySQL 的数据 (1) 在 MySQL 数据库中新建数据库 sparktest,再建表 employee,包含下列两行数据: 表 1 employee 表原有数据 (2) 配置Spark通过JDBC连接数据库MySQL,编程实现利用DataFrame插入下列数据到MySQL, 最后打印出 age 的最大值和 age 的总和. 表 2 employee 表新增数据 import java.

大三寒假生活7

今天你完成实验四前两个实验.但是!!!在跟eclipse的scala插件做斗争的时候,把hadoop的插件给搞没了,按着林子雨老师的教程走了一遍还是不行,不知不觉又搞了一下午,还是没解决.明天把实验四完成,做一些实验五,希望明天可以把eclipse的问题解决. 1.spark-shell 交互式编程 请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt,该数据集包含 了某大学计算机系的成绩,数据格式如下所示: Tom,DataBase,80 Tom,Algorit

大三寒假生活20

今天完成了信访的可视化.安装上了pycharm.也遇到了很多的问题. 1.在ubuntu下开放3306端口,并对外开放,实现从本地连接ubuntu中的mysql. 原文地址:https://blog.csdn.net/freezingxu/article/details/77088506 2.pycharm的破解方法 原文地址:https://blog.csdn.net/gpf1320253667/article/details/95871234 原文地址:https://www.cnblogs

大三寒假03

python安装完成. pc安装配置完成. 原文地址:https://www.cnblogs.com/gonT-iL-evoL-I/p/12232337.html

懵懂、充实、忙碌、我走完了大三

大三下学期的我,一直在实习,趁着期末考试,请了3个星期的假回来复习.顺便整理下我大学三年的经历. 明天就是部落新上任的日子,也是部落这学期交流会的最后一次,看了那么多大三的反思,还有求职经验,想想,我也应该来反思下我的大三. 大一: 大一那时候刚进来什么都不懂,暑假选专业的时候,是进了一个同乡会咨询,在里面遇到了一个同乡会的师兄,然后问了好多关于如何去选专业,选学校的问题. 当时也可以报广工,广商,只不过是文科专业,不喜欢也就罢了,.现在想想,大学其实就是经过一场高考,在青春的时刻,遇到一群人,

生活随笔-我大三了

毕业那年,我们答应老师,到大学来不颓废,还和高中时那样认真.大一那年,我们拎着行李来到一个陌生的城市上学.那时候稚嫩,没什么想法,学习还等着老师来督促,结果坏了自己.大二那年,开始有些着急,开始觉得未来很迷漫,害怕自己和一些学长一样毕不了业,开始认真学习,开始拿奖学金.大二的暑假,出去实习了,发现自己走错了路,学IT的没有技术,书读得再好也没有用.今年我大三了,不想兼职,不想玩社团,甚至不想谈恋爱,只想提高自己的技术水平,能进一家自己想进的公司.现在我做着技术大牛大一干的事情,开始认真学习前端技