「数据挖掘入门系列」Python快速入门

Python环境搭建

本次入门系列将使用Python作为开发语言。要使用Python语言,我们先来搭建Python开发平台。我们将基于Python 2.7版本、以及Python的开发发行版本Anaconda版本来开发。

Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。

下载地址:

https://www.anaconda.com/distribution/,注意要下载2.7版本

下载好Anaconda安装包后,即可安装,安装好后,我们可以来测试下Python环境是否已经搭建好。

Python语言入门

本小节将简单介绍Python语言,此处不会涉及过多的Python语言细节。例如:面向对象之类。此处主要介绍后续学习数据挖掘过程中会使用到的语法。

Hello Python

此案例将在控制台上打印 Hello, Python。

1、创建一个文本文件,并命名为hello_python.py

2、编写以下内容

# 打印字符串
print ‘hello, python‘

3、在命令行中执行命令 python hello_python.py

多重赋值

Python中支持多重赋值

# -*- coding: utf-8 -*
# 多重赋值
zhangsan, lisi, wangwu = u‘张三‘, u‘李四‘, u‘王五‘
print zhangsan, lisi, wangwu

注意:

  • 在python中要使用中文,需要在文件头上加入 # -*- coding: utf-8 –*
  • 字符串应该使用 u开头

条件判断

python条件判断可以使用 if …. elif … else,但逻辑条件使用 and、or。Python一般不使用花括号,而使用缩进对齐来作为区分。参考以下代码:

‘‘‘
案例三:
定义变量 username 和 password
1. 如果 username 为 abc,且password为 123, 打印 正确
2. 如果 username 不为 abc,打印用户名错误
3. 如果 password 不为 123,打印密码错误
‘‘‘
username = ‘abc‘
password = ‘123‘

if username == ‘abc‘ and password == ‘123‘:
    print u‘正确‘
else:
    if username != ‘abc‘:
        print u‘用户名错误‘
    else:
        print u‘密码错误‘

for循环

# 打印 1-10之间的数字
for i in range(1, 11):
    print i

函数

在Python可以使用def或者lambda表达式来定义函数:

# 定义一个函数计算两个数字的和
def add(a, b):
    return a + b

# 调用函数
print add(1, 1)

print ‘==‘ * 10

# 使用 lambda表达式定义函数
add_lambda = lambda x,y: x + y
print add_lambda(1, 1)

集合

以下代码演示列表、元组、字典的使用

# 定义列表
list1 = [1,2,3,4,5]
# 定义元组
tuple1 = (1,2,3,4)
# 定义字典
dict1 = {‘zhangsan‘:20, ‘lisi‘: 30}

print list1
print tuple1
print dict1

注意:元组的元素是不可以被修改的。

可以使用 []来访问集合的元素

函数式编程

Python支持函数式编程,编写起来也很方便

# 函数式编程
# 1. 初始化一个集合,包含数字从1-10
list2 = range(1, 11)
# 2. 对每一个数字 +1
list3 = map(lambda n:n+1, list2)
print list3
# 3. 过滤集合中所有能够整除2的数字
list4 = filter(lambda n: n%2==0, list2)
print list4

使用库函数

Python中需要使用到外部的函数,可以使用import关键字来导入库函数

# 导入库
import math

print math.pi
print math.sin(1)

# 给math库取一个别名
import math as m

print m.pi

添加第三方库

要使用Python进行数据挖掘开发,需要提前安装第三方库。Python中有非常丰富的第三方库。使用以下方式可以非常简便地安装第三方库。

使用pip安装。以下将演示使用pip来安装各类数据分析工具。

Numpy

Numpy实现了真正的数组功能。很多高级的库都依赖该库。我们可以使用pip来安装它。

pip install numpy

原文地址:https://www.cnblogs.com/ilovezihan/p/12240711.html

时间: 2024-10-21 08:11:04

「数据挖掘入门系列」Python快速入门的相关文章

WPF快速入门系列(8)——MVVM快速入门

一.引言 在前面介绍了WPF一些核心的内容,其中包括WPF布局.依赖属性.路由事件.绑定.命令.资源样式和模板.然而,在WPF还衍生出了一种很好的编程框架,即WVVM,在Web端开发有MVC,在WPF客户端开发中有MVVM,其中VM就相当于MVC中C(Control).在Web端,微软开发了Asp.net MVC这样的MVC框架,同样在WPF领域,微软也开发了Prism这样的MVVM框架.Prism项目地址是:http://compositewpf.codeplex.com/SourceCont

给深度学习入门者的Python快速教程

基础篇 numpy和Matplotlib篇 本篇部分代码的下载地址: https://github.com/frombeijingwithlove/dlcv_for_beginners/tree/master/chap5 5.3 Python的科学计算包 – Numpy numpy(Numerical Python extensions)是一个第三方的Python包,用于科学计算.这个库的前身是1995年就开始开发的一个用于数组运算的库.经过了长时间的发展,基本上成了绝大部分Python科学计算

C++ Primer Study Note 系列[1]-chapter1快速入门

I want to study it all the time , and now I am ready to study this book in the next mouth. Time : 2014/07/02 先看一个程序体验一下: #include <iostream> int main() {     /*This is a test example*/     std::cout << "Enter two numbers:" << s

Gradle学习系列之一——Gradle快速入门

Gradle学习系列之一--Gradle快速入门 这是一个关于Gradle的学习系列,其中包含以下文章: Gradle快速入门 创建Task的多种方法 读懂Gradle语法 增量式构建 自定义Property 使用java Plugin 依赖管理 构建多个Project 自定义Task类型 自定义Plugin 请通过以下方式下载本系列文章的Github示例代码: git clone https://github.com/davenkin/gradle-learning.git 和Maven一样,

【机器学习】Python 快速入门笔记

Python 快速入门笔记 Xu An   2018-3-7  1.Python print #在Python3.X中使用print()进行输出,而2.x中使用()会报错 print("hello world")  print('I\'m apple')  #如果全部使用单引号,则需要在前面加上转义字符\+引号 print('apple'+'pear') print('apple'+str(4)) #将数字转换为字符串并打印 print(int("1")+2)#将字

Python快速入门02-0529

数据类型转换: 显示 隐式 dir(__builtin__)可以查看内建的函数 callable()可用于测试函数是否可以调用 字典:kv集合 {"a":31,"b":545} 每个模块都有一个名为__name__的内建变量,此变量值会根据调用时 如果模块被导入,__name__的值是模块的名字 如果模块被直接执行,__name__的值是"__main__" class:通常在自定义类型是使用 type:内置变量 instance:实例化 类:数

Maven入门指南 :Maven 快速入门及简单使用

Maven入门指南 :Maven 快速入门及简单使用 前言 Maven是一个Java语言编写的开源项目管理工具,是Apache软件基金会的顶级项目.主要用于项目构建,依赖管理,项目信息管理. maven项目在编译.测试.打包里,会需要从maven的中央仓库(即:maven组织公布在互联网上的一个站点,里面已经收录了目前绝大多数主流的jar包)下载jar包等文件, 如果使用代理服务器上网,需要配置代理服务器. 理解"仓库" 首次运行完mvn -version后,会在用户目录下创建一个.m

「数据挖掘入门系列」挖掘建模之分类与预测&ndash;逻辑回归

拿电商行业举例,经常会遇到以下问题: 如果基于商品的历史销售情况,以及节假日.气候.竞争对手等影响因素,对商品的销量进行趋势预测? 如何预测未来一段时间哪些客户会流失,哪些客户可能会成为VIP用户? 如果预测一种新商品的销售量,以及哪种类型的客户会比较喜欢? 除此之外,运营部门需要通过数据分析来了解具有某些特征的客户的消费习惯,管理人员希望了解下一个月的销售收入等,这些都是分类与预测的日志. 分类和预测是预测问题的两种主要类型. 分类主要是预测分类标号(离散值) 预测主要是建立连续值函数模型 挖

python快速入门——进入数据挖掘你该有的基础知识

这篇文章是用来总结python中重要的语法,通过这些了解你可以快速了解一段python代码的含义 Python 的基础语法来带你快速入门 Python 语言.如果你想对 Python 有全面的了解请关注本博客Python的文章,这篇文章也可以当作复习,自己查漏补缺,读者可以在留言区分享自己的 Python 学习和使用心得. 首先聊一下Python的意义 要学好数据分析,一定要掌握 Python 吗?我想,要想学好数据分析,你最好掌握 Python 语言.为什么这么说呢? 首先,在一份关于开发语言