Python SciPy Sparse模块学习笔记

1. sparse模块的官方document地址：http://docs.scipy.org/doc/scipy/reference/sparse.html

2. sparse matrix的存储形式有很多种，见此帖子http://blog.csdn.net/anshan1984/article/details/8580952

不同的存储形式在sparse模块中对应如下：

bsr_matrix(arg1[, shape, dtype, copy, blocksize]) Block Sparse Row matrix

coo_matrix(arg1[, shape, dtype, copy]) A sparse matrix in COOrdinate format.

csc_matrix(arg1[, shape, dtype, copy]) Compressed Sparse Column matrix

csr_matrix(arg1[, shape, dtype, copy]) Compressed Sparse Row matrix

dia_matrix(arg1[, shape, dtype, copy]) Sparse matrix with DIAgonal storage

dok_matrix(arg1[, shape, dtype, copy]) Dictionary Of Keys based sparse matrix.

lil_matrix(arg1[, shape, dtype, copy]) Row-based linked list sparse matrix

3. 要将普通的非稀疏矩阵变为相应存储形式的稀疏矩阵只要如下：（以coo_matrix为例）

A = coo_matrix([[1,2],[3,4]])

或者按照相应存储形式的要求，喂给参数，构建矩阵，以coo为例：

>>> row = np.array([0,0,1,3,1,0,0])

>>> col = np.array([0,2,1,3,1,0,0])

>>> data = np.array([1,1,1,1,1,1,1])

>>> coo_matrix((data, (row,col)), shape=(4,4)).todense()

matrix([[3, 0, 1, 0],

[0, 2, 0, 0],

[0, 0, 0, 0],

[0, 0, 0, 1]])

4. hstack和vstack函数可以将稀疏矩阵横向或者纵向合并，比如：

>>> from scipy.sparse import coo_matrix, vstack

>>> A = coo_matrix([[1,2],[3,4]])

>>> B = coo_matrix([[5,6]])

>>> vstack( [A,B] ).todense()

matrix([[1, 2],

[3, 4],

[5, 6]])

但是经过测试，如果A和B的数据形式不一样，不能合并。比如A存储的是字符串，B是数字，那么不能合并。也就是说一个矩阵中的数据格式必须是相同的。

5. diags函数可以建立稀疏的对角矩阵

6. 对于大多数（似乎只处了coo之外）稀疏矩阵的存储格式，都可以进行slice操作，比如对于csc，csr。也可以进行arithmetic
operations，矩阵的加减乘除，速度很快。

取矩阵的指定列数，比如取矩阵的第1,3,8列：matrix[:,[0,2,7]]

7.sparce矩阵的读取。可以像常规矩阵一样通过下标读取。也可以通过getrow(i)，gecol(i)读取特定的列或者特定的行，以及nonzero()读取非零元素的位置。

时间： 2025-01-11 14:41:42

Python SciPy Sparse模块学习笔记的相关文章

python基础教程_学习笔记12：充电时刻——模块

充电时刻--模块 python的标准安装包括一组模块,称为标准库. 模块 >>> import math >>> math.sin(0) 0.0 模块是程序任何python程序都可以作为模块导入. $ cat hello.py #!/usr/bin/python print "Hello,signjing!" $ ./hello.py Hello,signjing! 假设将python程序保存在/home/ggz2/magiccube/mysh/p

python基础教程_学习笔记23：图形用户界面

图形用户界面丰富的平台在编写Python GUI程序前,需要决定使用哪个GUI平台. 简单来说,平台是图形组件的一个特定集合,可以通过叫做GUI工具包的给定Python模块进行访问. 工具包描述 Tkinter 使用Tk平台.很容易得到.半标准. wxpython 基于wxWindows.跨平台越来越流行. PythonWin 只能在Windows上使用.使用了本机的Windows GUI功能. JavaSwing 只能用于Jython.使用本机的Java GUI. PyGTK 使用GTK

python基础教程_学习笔记9：抽象

抽象懒惰即美德. 抽象和结构抽象可以节省大量工作,实际上它的作用还要更大,它是使得计算机程序可以让人读懂的关键. 创建函数函数可以调用(可能包含参数,也就是放在圆括号中的值),它执行某种行为并且返回一个值.一般来说,内建的callable函数可以用来判断函数是否可调用: >>> import math >>> y=1 >>> x=math.sqrt >>> callable(x) True >>> callab

python基础教程_学习笔记6：字典

字典映射(mapping),一种可通过名字引用值得数据结构. 字典是python中唯一内建的映射类型. 字典中的值没有特殊的顺序,但都存储在一个特定的键(key)里.键可以是数字.字符串甚至是元组. 字典的使用某些情况下,字典比列表更加适用,比如: 表征游戏棋盘的状态,每个键都是由坐标值组成的元组: 存储文件修改数,用文件名作为键: 数字电话/地址簿: 假如有一个人名列表如下: >>>names=['Alice','Beth','Cecil','Dee-Dee','Earl'] 如果

python基础教程_学习笔记5：字符串

字符串基本字符串操作字符串也是序列,因此序列的基本操作(索引.分片.连接.乘法.长度.求最大值和最小值.成员资格)对字符串同样适用: 索引 >>> 'a_string'[0] 'a' 长度 >>> len('a_string') 8 求最大值 >>> max('a_string') 't' 求最小值 >>> min('a_string') '_' 乘法 >>> 'a_string'*2 'a_stringa_st

python基础教程_学习笔记26：好玩的编程

好玩的编程程序设计的柔术当大家坐下来并计划应该如何组织程序的时候,对于这个具体的程序,还没有任何的经验.在实现功能的时候,会逐渐地学到对原始设计有用的新知识.不应该无视一路走来所吸取的教训,而应该将它们用于软件的重新设计(或重构)中. 灵活性的实现包括许多方面,下面是其中两个: 原型设计:python最棒的功能之一就是可以快速地编写程序.编写原型程序是更充分地了解问题的一种很好的方法. 配置:灵活性有很多种存在形式.配置的目的就是让程序某部分的改变更简单,对于你和用户来说都是这样. 第三点是

python基础教程_学习笔记16：标准库：一些最爱——random

标准库:一些最爱 random random模块包括返回随机数的函数,可以用于模拟或者用于任何产生随机输出的程序. 事实上,所产生的数字都是伪随机数,它们以一个可预测的系统作为基础,除非是为了强加密的目标,否则这些随机数还是足够随机的.如果真的需要随机性,可以使用os模块的urandom函数. 重要函数函数描述 random() 返回0<=n<1之间的随机实数n,其中0<n<=1 getrandbits(n) 以长整型形式返回n个随机位(二进制数) uniform(a,b) 返

python基础教程_学习笔记17：标准库：一些最爱——time

标准库:一些最爱 time time模块所包含的函数能够实现以下功能: 获取当前时间.操作系统时间和日期.从字符串读取时间以及格式化时间为字符串. 日期可以用实数(从"新纪元"的1月1日0点开始计算到现在的秒数,新纪元是一个与平台相关的年份,对unix来说是1970年),或者是包含有9个整数的元组. 日期元组的字段含义如元组: (2008,1,21,12,2,56,0,21,0) 表示2008年1月21日12时2分56秒,星期一,且是当年的第21天(无夏令时). 索引字段值 0

python基础教程_学习笔记14：标准库：一些最爱——re

标准库:一些最爱 re re模块包含对正则表达式的支持,因为曾经系统学习过正则表达式,所以基础内容略过,直接看python对于正则表达式的支持. 正则表达式的学习,见<Mastering Regular Expressions>(精通正则表达式) re模块的内容最重要的一些函数函数描述 compile(pattern[,flags]) 根据包含正则表达式的字符串创建模式对象 search(pattern,string[,flags]) 在字符串中寻找模式 match(pattern,st