有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!

PyCharm是一种Python IDE,其带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具。此外,该IDE提供了一些高级功能,以用于Django框架下的专业Web开发。

嗨,您好!您是否尝试过在PyCharm 2019.2中集成Jupyter Notebooks?赶快来尝试一下吧!在这篇博文中,我们将使用PyCharm及其Jupyter Notebook集成来探索一些数据。首先,我们需要所述数据。每当我需要一个新的数据集来玩时,我通常会前往Kaggle,我肯定会找到一些有趣的主题。这一次,一个名为“ 披萨餐馆和他们卖的比萨饼 ”的数据集引起了我的注意。谁不喜欢披萨?让我们分析一下这些披萨店,并尝试从中学到一两件事。

由于这些数据不是我现有任何PyCharm项目的一部分,我将创建一个新项目。

确保使用PyCharm专业版,Community Edition不包括Jupyter笔记本集成。


提示:在浏览器中使用Jupyter Notebooks时,我倾向于为实验创建多个临时笔记本。为每个项目创建一个PyCharm项目是相当繁琐的,所以相反,你可以有一个项目用于这样的实验。

我喜欢我的东西井然有序,所以一旦项目被创建,我将添加一些结构 - 我将移动下载的数据集的数据目录,以及笔记本的另一个目录。

一旦我创建了我的第一个pizza.ipynb笔记本,PyCharm建议安装Jupyter包并在右上角提供一个链接来做到这一点。


一旦安装了Jupyter软件包,我们就准备好了!

90%的数据科学家在他们的Jupyter笔记本中做的第一件事是打字import pandas as pd。此时,PyCharm会建议在这个venv中安装pandas,只需单击即可完成:


一旦我们安装了pandas,我们就可以将csv中的数据读入pandas DataFrame:

df = pd.read_csv("../data/Datafiniti_Pizza_Restaurants_and_the_Pizza_They_Sell_May19.csv")
要执行此单元格,请按Shift + Enter,或单击单元格旁边的装订线中的绿色箭头图标。

当您第一次运行单元格时,PyCharm将启动一个本地Jupyter服务器来执行其中的代码 - 您无需从终端手动执行此操作。

首先,我们将了解该数据集的基本内容 - 它有多少行?列是什么?数据是什么样的?


我怀疑这些数据仅包含美国餐馆的信息。要确认这一点,让我们计算国家/地区列中的值:


是的,这个数据集中唯一出现的国家是美国,因此country完全删除该列是安全的。同样的,menus.currencypriceRangeCurrency那些价值也是一样的 - 美元。我也会放弃,menuPageURL因为它不会给分析增加太多价值,key因为它会复制其他列(国家,州,城市等)的信息。

我将在这里做的另一个清理是重命名province列,states因为它在这个上下文中更有意义,为了更好的可读性,我将用状态的全名替换状态首字母缩略词。


一旦我们完成清理数据,我们如何绘制它?作为人类,我们更善于在视觉上呈现信息。

首先,让我们看看我们在这个数据集中最常见的披萨类型。鉴于主题,将它视为带有matplotlib的馅饼是合适的


现在还不是我们的馅饼图。为了让它显示,我需要%matplotlib inline为IPython 添加魔术命令,当我在它时,我将添加另一个魔术命令让IPython知道为视网膜屏幕适当地渲染图。

我可以将这些行添加到同一个单元格并再次运行它,但我更喜欢在笔记本的最开始定义这种类型的魔术命令。

要导航到笔记本的最开头,您可以使用 Cmd+[ (Ctrl+Alt+Left on Windows)。插入新单元格就像键入一样简单#%%(如果您更喜欢在当前单元格上方插入单元格的快捷方式,Option+Shift+Aon mac, or Alt+Shift+A on Windows)。现在我需要做的就是添加魔术命令并运行下面的所有单元格:


由馅饼图可知,现在我们知道最常见的披萨类型是芝士披萨,紧随其后的是白披萨。


餐馆怎么样?我们在数据集中有他们的地理位置,因此我们可以很容易地看到他们所在的位置。

每个餐厅都有一个唯一的ID,并且数据集中可以有多个条目,每个条目代表该餐厅菜单中的披萨。因此,为了绘制餐厅而不是比萨饼,我们需要按餐馆ID对条目进行分组。


现在我们可以在地图上绘制它们。对于地理绘图,我喜欢用情节。确保获取它的最新版本(4.0.0),以便在PyCharm中很好地渲染图形输出。


人们可以想到我们可以尝试用这个数据集来回答的一些问题,例如,哪个城市拥有最多/最便宜的Veggie Pizza?或者最常见的比萨餐厅连锁店是什么?如果您想玩这个数据集并回答这些或其他问题,您可以搜集数据并运行您自己的分析。请记住,如果你想用PyCharm试试,请确保你使用的是PyCharm 2019.2专业版。

原文地址:https://blog.51cto.com/14499080/2444654

时间: 2024-07-29 21:59:01

有趣的教程:在PyCharm2019.2版本中集成Jupyter Notebooks!的相关文章

细说shiro之五:在spring框架中集成shiro

官网:https://shiro.apache.org/ 1. 下载在Maven项目中的依赖配置如下: <!-- shiro配置 --> <dependency> <groupId>org.apache.shiro</groupId> <artifactId>shiro-core</artifactId> <version>${version.shiro}</version> </dependency&g

Android基础入门教程——8.1.2 Android中的13种Drawable小结 Part 2

Android基础入门教程--8.1.2 Android中的13种Drawable小结 Part 2 标签(空格分隔): Android基础入门教程 本节引言: 本节我们继续来学习Android中的Drawable资源,上一节我们学习了: ColorDrawable:NinePatchDrawable: ShapeDrawable:GradientDrawable!这四个Drawable~ 而本节我们继续来学习接下来的五个Drawable,他们分别是: BitmapDrawable:Insert

OpenGL2.0及以上版本中gl,glut,glew,glfw,mesa等部件的关系

OpenGL2.0及以上版本中gl,glut,glew,glfw,mesa等部件的关系 一.OpenGL OpenGL函数库相关的API有核心库(gl),实用库(glu),辅助库(aux).实用工具库(glut),窗口库(glx.agl.wgl)和扩展函数库等. gl是核心,glu是对gl的部分封装.glx.agl.wgl 是针对不同窗口系统的函数.glut是为跨平台的OpenGL程序的工具包,比aux功能强大(aux很大程度上已经被glut库取代.).扩展函数库是硬件厂商为实现硬件更新利用Op

小猪的数据结构辅助教程——2.2 线性表中的单链表

小猪的数据结构辅助教程--2.2 线性表中的单链表 标签(空格分隔): 数据结构 本节学习路线图与学习要点 学习要点: 1.理解顺序表以及单链表各自的有点以及缺点! 2.熟悉单链表的形式,对于头指针,头结点,尾结点,数据域和指针域这些名词要知道是什么! 3.熟悉单链表的结点结构 4.区分头指针与头结点! 5.熟悉创建单链表的两种方式:头插法和尾插法 6.了解单链表12个基本操作的逻辑 7.有趣的算法题:查找单链表的中间结点~ 1.单链表的引入(顺序表与单链表的PK) 2.单链表的结构图以及一些名

Android基础入门教程——8.1.3 Android中的13种Drawable小结 Part 3

Android基础入门教程--8.1.3 Android中的13种Drawable小结 Part 3 标签(空格分隔): Android基础入门教程 本节引言: 本节我们来把剩下的四种Drawable也学完,他们分别是: LayerDrawable,TransitionDrawable,LevelListDrawable和StateListDrawable, 依旧贴下13种Drawable的导图: 1.LayerDrawable 层图形对象,包含一个Drawable数组,然后按照数组对应的顺序来

IE对象最后一个属性后不要加逗号,否则在IE7及以下版本中会报错

某函数返回一个对象,如果在最后一个属性后加逗号,IE7及以下版本中会报错 正确代码: return{ top:rect.top-top, bottom:rect.bottom-top, left:rect.left-left, right:rect.right-left } 错误代码(IE8以上都不会报错) return{ top:rect.top-top, bottom:rect.bottom-top, left:rect.left-left, right:rect.right-left, }

Android基础入门教程——8.1.1 Android中的13种Drawable小结 Part 1

Android基础入门教程--8.1.1 Android中的13种Drawable小结 Part 1 标签(空格分隔): Android基础入门教程 本节引言: 从本节开始我们来学习Android中绘图与动画中的一些基础知识,为我们进阶部分的自定义 打下基础!而第一节我们来扣下Android中的Drawable!Android中给我们提供了多达13种的 Drawable,本节我们就来一个个撸一遍! Drawable资源使用注意事项 Drawable分为两种: 一种是我们普通的图片资源,在Andr

debug、 release两个版本中正确运行的一些经验

在Qt编程中,默认的是debug版本,在编译器中可以正常的使用,但是单独运行.exe可执行文件时却发现系统提示缺少文件.其实就是缺少必要的.dll动态库文件.根据提示添加需要的.dll动态库文件即可.另外,这些动态库文件就在Qt的安装目录中,找到复制进去就行了. 并且,debug需要添加的动态库文件名字一般就是XXXd.dll文件,比如Qt5Cored.dll文件.但是在release版本中,需要添加的文件根debug版本中的是一样的,但是名字有一点区别.比如在debug版本中添加的是Qt5Co

关于python3.4版本中的zip函数

特别注意: 在window,显示变量 print(x);而在linux中 print x 例如,有两个列表: >>>a = [1,2,3] >>>b = [4,5,6] 使用zip()函数来可以把列表合并,并创建一个元组对的列表. >>>zip(a,b) [(1, 4), (2, 5), (3, 6)] #注意在Python3.4版本中,显示 >>> zip(a,b)<zip object at 0x01FB2E90> 如