PyCharm 远程连接linux中Python 运行pyspark

PySpark in PyCharm on a remote server

1、确保remote端Python、spark安装正确

2、remote端安装、设置

vi /etc/profile
添加一行:PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip
source /etc/profile

# 安装pip 和 py4j

下载pip-7.1.2.tar
tar -xvf pip-7.1.2.tar
cd pip-7.1.2
python setup.py install
pip install py4j

# 避免ssh时tty检测

cd /etc
chmod 640 sudoers
vi /etc/sudoers
#Default requiretty

3、本地Pycharm设置

File > Settings > Project Interpreter:

Project Interpreter > Add remote(前提:remote端python安装成功):

注意,这里的Python路径为python interpreter path,如果python安装在其它路径,要把路径改过来

Run > Edit Configuration (前提:虚拟机中共享本地目录成功):

此处我配置映射是在Tools中进行的

Tools > Dployment > Configuration

4、测试

import os
import sys
os.environ[‘SPARK_HOME‘] = ‘/root/spark-1.4.0-bin-hadoop2.6‘
sys.path.append("/root/spark-1.4.0-bin-hadoop2.6/python")

try:
    from pyspark import SparkContext
    from pyspark import SparkConf

    print ("Successfully imported Spark Modules")

except ImportError as e:
    print ("Can not import Spark Modules", e)
    sys.exit(1)
Result:

ssh://[email protected]:22/usr/bin/python -u /home/hadoop/TestFile/pysparkProgram/Mainprogram.pySuccessfully imported Spark Modules

Process finished with exit code 0

或者:

import sys
sys.path.append("/root/programs/spark-1.4.0-bin-hadoop2.6/python")

try:
    import numpy as np
    import scipy.sparse as sps
    from pyspark.mllib.linalg import Vectors

    dv1 = np.array([1.0, 0.0, 3.0])
    dv2 = [1.0, 0.0, 3.0]
    sv1 = Vectors.sparse(3, [0, 2], [1.0, 3.0])
    sv2 = sps.csc_matrix((np.array([1.0, 3.0]), np.array([0, 2]), np.array([0, 2])), shape=(3, 1))

    print(sv2)

except ImportError as e:
    print("Can not import Spark Modules", e)
    sys.exit(1)
Result

ssh://[email protected]:22/usr/bin/python -u /home/hadoop/TestFile/pysparkProgram/Mainprogram.py  (0, 0)    1.0
  (2, 0)    3.0

Process finished with exit code 0

参考:
https://edumine.wordpress.com/2015/08/14/pyspark-in-pycharm/
http://renien.github.io/blog/accessing-pyspark-pycharm/
http://www.tuicool.com/articles/MJnYJb

参照:

http://blog.csdn.net/u011196209/article/details/9934721

时间: 2024-08-09 01:52:33

PyCharm 远程连接linux中Python 运行pyspark的相关文章

转 windows下安装pycharm并连接Linux的python环境

https://www.cnblogs.com/junxun/p/8287998.html 1. 下载安装Pycharm专业版 具体方法略.Pycharm5激活方法参考http://www.cnblogs.com/snsdzjlz320/p/7110186.html 2. 添加配置连接远程服务器 2.1  打开 PyCharm,依次点开 File  → Settings → Project scripts → Project Interpreter  选择“Add Remote” 2.2  点击

pycharm远程连接linux服务器环境

此目的就是 在windows下使用pycharm写代码,运行时在远程linux服务器环境下运行 点击设置的按钮,选择show all 点击+号 选中SSH Interpreter,填写服务器地址,用户名 点击next,填写密码 点击next,填写linux服务器的python路径和项目在linux服务器的存储路径 点击finish,可以看到设置的内容 在本地编写项目,保存时也会同步到远程linux服务器,也可以从远程linux服务器下载项目文件到本地 原文地址:https://www.cnblo

linux 下 python 运行 pyspark

from pyspark import SparkContext Traceback (most recent call last): File "<stdin>", line 1, in <module> 要先安装 findspark 包 然后执行   pip install findsparp 再进入python shell 导入包 import findspark findspark.init()   原文地址:https://www.cnblogs.co

VNCViewer Windows下远程连接Linux桌面

最近项目需求,需要将写的工程部署到centos6.5服务器上,但是出现了各种错误,就想着在linux下再调试代码.但是之前都是通过ssh链接远程服务器的,在ssh中肯定不能打开eclipse等集成开发工具,因此我们要在远程服务器上安装桌面及vncserver,然后在windows中用vncViewer连接. 一:服务器端(Centos6.5) 1:安装桌面: # yum groupinstall "GNOME Desktop Environment"(CentOS 5.x安装GNOME

widows本地-xshell实现远程连接linux服务器图形界面

本地环境远程连接linux图形界面,常用的实现工具有,VNC.Puty.Xshell等,这里我们用的xshell manager: Xmanager简介:Xmanager是一个运行于 Windows平台上的高性能的X Server软件.它能把远端Unix/Linux的桌面无缝地带到你的Windows上,甚至电脑是在内网或防火墙后,也能通过SSH协议安全的运行远端的X应用程序. 特点包括: 可通过Xcongfig工具设置多个Xmanager设置: 支持多用户的Windows终端环境: 支持多个IP

虚拟机VMware网络类型&amp;&amp;SSH远程连接Linux

前言: Linux专题是16年11月开始写,说来惭愧,已经5个月没学Linux,至今感觉连入门还没达到.暑假实习有投运维开发岗位,无奈对Linux不熟悉,校招简历也被刷了.so, 我打算先花1个月内的时间入下门.前几天还专门去当当网买了一本<跟老男孩学Linux运维-Web集群实战>.lenrning begin!! 一.虚拟机网络类型 为虚拟机选择网络类型是极其关键的.VMware虚拟机常见的网络类型有Bridged(桥接).NAT.Host-only(仅主机)3种.在创建Linux虚拟机时

window远程连接linux

一.字符界面连接Linux    1.直接使用window自带的telnet. 2.但现在Linux一般都不启用telnet,而是启用ssh.这样的话,window就要安装客户端来访问Linux了.这类工具很多.openssh.cecureCRT等等.试用了一下,发现putty相当出色.    putty无须安装.到http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html下载,就可运行使用. 二.window图形界面远程连接L

1.9 使用PuTTY远程连接Linux 1.10 使用xshell连接Linux 1.11 PuTTY密钥认证 1.12 xshell密钥认证

1.9 使用PuTTY远程连接Linux 先下载putty 地址百度搜,进官网下载https://www.chiark.greenend.org.uk/~sgtatham/putty/latest.html 先查看自己的ip 安装完成后 双击putty 填自己的ip 和名字 windows 窗口这里设置成2000 可以在窗口下上下翻 最多2000行 选择字体 字体改下 选择中文的要选择utf-8 点open 点击是 即可 1.10 使用xshell连接Linux 使用xshell 连接linux

学习笔记(一)——安装与远程连接Linux操作系统

1.安装Linux操作系统: 使用软件: VMware Workstation 11.0, CentOS 6.6.具体步骤:    (1)进入VMware,选择"创建新的虚拟机",如图1所示: 图-1 创建新的虚拟机 (2)按说明点击下一步就好,一般我们选择默认情况,就不再截图了.注意几点,一是先创建虚拟机,稍后安装操作系统.二是在分配内存时最好不小于1024M,以便需要时可以启动图形界面.三是使用 NAT 还是桥接进行网络连接.如果实体机通过拨号上网,选择 NAT ,如果实体机通过无