帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cluster,clusterdata)(1)

层次聚类



Produce nested sets of clusters

函数

 cluster  根据凝聚层次聚类树构造凝聚聚类
 clusterdata  根据样本数据构造凝聚聚类
 cophenet  cophenet相关系数
 inconsistent  inconsistent系数
 linkage  凝聚层次聚类树
 pdist  两两对象间距离的平均值
 sequentialfs  贯序特征选择
 squareform  化为距离矩阵格式

cluster



根据凝聚层次聚类树构造凝聚聚类

语法

  T = cluster(Z,‘cutoff‘,c)

  T = cluster(Z,‘cutoff‘,c,‘depth‘,d)

  T = cluster(Z,‘cutoff‘,c,‘criterion‘,criterion)

  T = cluster(Z,‘maxclust‘,n)

描述

T = cluster(Z,‘cutoff‘,c)从凝聚层次聚类树Z构造聚类,其中,Z由linkage函数生成。Z是一个m-1行3列的矩阵,其中m是原始数据中的观测值个数。c是将Z切成聚类的阈值。如果一个节点及它的所有子节点都有小于c的inconsistent值,那么就形成一个聚类。节点上或其下的所有叶子节点被归并成一个聚类。t是一个包含每个观测值分配的m维向量。

如果c是一个向量,T为一个聚类分配矩阵。其中,每一个cutoff值在矩阵中对应一列聚类分配。

T = cluster(Z,‘cutoff‘,c,‘depth‘,d)通过查找每个节点下d层求inconsistent值。默认层数为2。

T = cluster(Z,‘cutoff‘,c,‘criterion‘,criterion)利用制定的标准形成聚类,其中,criterion为‘inconsistent‘(默认)或‘distance‘。‘distance‘标准用合并成为一个节点的两个子节点间的距离来度量节点的高度。如果一个节点上及其下的所有叶子节点的高度小于c,则它们合并成一个聚类。

T = cluster(Z,‘maxclust‘,n)利用‘distance‘标准构造一个n聚类的最大值。cluster找到一个最小的高度,在这个高度上水平切割树有n个或更小的聚类数。

如果n是一个向量,T是一个矩阵,且每一个极大值对应矩阵中的一列。

例子

将安德森鸢尾花卉数据集与物种种类相比较

  load fisheriris

  d = pdist(meas);

  Z = linkage(d);

  c = cluster(Z,‘maxclust‘,3:5);

  crosstab(c(:,1),species)

  ans =

    0     0     2

    0    50    48

   50     0     0

  crosstab(c(:,2),species)

  ans =

    0     0     1

  0    50    47

   0     0     2

   50     0     0

  crosstab(c(:,3),species)

  ans =

    0     4     0

    0    46    47

    0     0     1

     0     0     2

   50     0     0

clusterdata



数据的凝聚聚类

语法

  T = clusterdata(X,cutoff)

  T = clusterdata(X,Name,Value)

描述

T = clusterdata(X,cutoff)

T = clusterdata(X,Name,Value)有着一个或多个名称,值参数对另外特殊选项设置的聚类。

输入参数

X             行数大于等于2的矩阵。每一行代表一个观测值,每一列代表一个类别或维度。
cuttoff 当0<cutoff<2时,clusterdata形成聚类,使得所有的inconsistent值都大于cutoff。当cutoff是一个大于等于2的整数时,clusterdata将cutoff理解成一个由linkage生成的聚类的,使切割能保留在聚类树中的最大值。

名称-数值 参数对

指定以逗号分隔的名称,值可选参数对。Name是参数的名称,并且Value是相应的取值。Name外必须加引号(‘‘)。你可以以任意顺序指定一些名称值参数对如Name1,Value1,...,NameN,ValueN。

输入参数

‘criterion‘                ‘inconsistent‘或‘distance‘
‘cutoff‘ inconsistent或距离度量的截断值是一个正的标量。当0<cutoff<2时,clusterdata形成聚类,使得所有的inconsistent值都大于cutoff。当cutoff是一个大于等于2的整数时,clusterdata将cutoff理解成一个由linkage生成的聚类的,使切割能保留在聚类树中的最大值。
‘depth‘ 深度用于计算inconsistent值,是一个正的整数。
‘distance‘
任何pdist认可的距离度量名称(‘minkowski‘选项后跟着指数值p):

度量 描述
‘euclidean‘ 欧几里德距离(默认值)
‘seuclidean‘ 标准化后的欧几里德距离。X行间的每个坐标的差值都通过除以标准差S=nanstd(X)的相应值来调整大小。如果要为S另外指定一个值,用D=pdist(X,‘seuclidean‘,S)。
‘cityblock‘ 城市街区度量。
‘minkowski‘ 闵可夫斯基距离。默认指数为2。若要另外知道一个指数,用D=pdist(X,‘minkowski‘,P),其中P为指数值,为一个正标量值。
‘chebychev‘ 契比雪夫距离(坐标差值)。
‘mahalanobis‘ 马氏距离,作为nancov计算以X的样本协方差。如果要用另一个协方差,用D=(X,‘mahalanobis‘,C),其中C是一个正定对称矩阵。
‘cosine‘ 1减去两个点(看作向量)间的夹角的cos值
‘correlation‘ 1减去两个点(看作向量)间的相关系数
‘spearman‘ 1减去两个观测值(看作值的序列)间的斯皮尔曼秩相关系数
‘hamming‘ 汉明距离,不同值坐标的比例。
用户距离函数
由@指定的距离函数:

D = pdist(X,@disfunctional)

一个距离函数必须形式如下:

d2 = distfun(XI,XJ)

作为参数的,一个是1行n列的向量XI,对应X的一行,和一个m2行n列的矩阵XJ,对应X的多行。distfun必须接受XJ矩阵行数任意。distfun必须返回一个距离为d2的m2行1维的向量,其中第k个元素是XI和XJ(k,:)的距离。

‘linkage‘
linkage函数允许的任何linkage方法:

‘average‘

‘centroid‘

‘complete‘

‘median‘

‘single‘

‘ward‘

‘weighted‘

‘maxclust‘ 最大聚类数目,为正整数。
‘savememory‘
一个字符串,为‘on‘或‘off‘。当可用的时,‘on‘设置使得cluserdata能不计算距离矩阵构造聚类。savememory当如下情况可用:

linkage是‘centroid‘,‘median‘或‘ward‘

distance是‘euclidean‘(默认)

当savememory是‘on‘时,linkage运行时间和维度的数目(X的列数)成比例。当savememory是‘off‘时,linkage内存的需求和N2成比例,其中N是观测值的数目。所有选择最好(耗时最少)的savememory设置取决于问题的维度,观测值的个数,或可用的内存。默认的savememory设置是最优设置的一个粗略近似。

默认:为‘on‘当X的列数少于或等于20,或计算机没有足够内存来存储距离矩阵时;反之则为‘off‘。

时间: 2024-11-08 01:50:55

帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cluster,clusterdata)(1)的相关文章

帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(linkage)(6)

例子 Compare Cluster Assignments to Clusters 导入样本数据. load fisheriris 从安德森鸢尾花卉数据集用Ward linkage计算四个簇,并忽略种类信息. Z = linkage(meas,'ward','euclidean'); c = cluster(Z,'maxclust',4); 观察聚类结果和三个种类是怎样的对应关系. crosstab(c,species) 打印Z的前5行. firstfive = Z(1:5,:) 生成Z的系统

帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(linkage)(5)

linkage 凝聚层次聚类树 语法 Z = linkage(X) Z = linkage(X,method) Z = linkage(X,method,metric) Z = linkage(X,method,pdist_inputs) Z = linkage(X,metric,'savememory',value) Z = linkage(Y) Z = linkage(Y,method) 描述 Z = linkage(X)返回一个矩阵Z,该矩阵是将实矩阵X的行编码为一个层次聚类的数. Z =

帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cluster,clusterdata)(2)

例子 从样本数据中生成层次聚类树 这个例子显示了如果利用样本数据生成层次聚类数,并用3维散点图展示该聚类. 产生样本数据矩阵,其中的随机数由标准均匀分布(U(0,1))生成. rng('default'); % For reproducibilty X = [gallery('uniformdata',[10 3],12);... gallery('uniformdata',[10 3],13)+1.2;... gallery('uniformdata',[10 3],14)+2.5]; 计算元

帮助文档-翻译-Statistics Toolbox-Exploratory Data Analysis-Cluster Analysis-Hierarchical Clustering(cophenet)(3)

cophenet Cophenetic 相关系数 语法 c = cophenet(Z,Y) [c,d] = cophenet(Z,Y) 描述 c = cophenet(Z,Y)计算Z表示的层次聚类树的cophenetic相关系数.Z是linkage函数的输出.

permission 文档 翻译 运行时权限

文档位置:API24/guide/topics/security/permissions.html System Permissions 系统权限 Android is a privilege-separated operating system, in which each application runs with a distinct system identity (Linux user ID and group ID). Parts of the system are also sep

【Android应用开发】Android 蓝牙低功耗 (BLE) ( 第一篇 . 概述 . 蓝牙低功耗文档 翻译)

转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/50515359 参考 :  -- 官方文档 : https://developer.android.com/guide/topics/connectivity/bluetooth-le.html; 1. 概述 BLE 概述 : -- 版本支持 : Android 4.3 (API Level 18) 内置框架引入了 蓝牙低功耗方案 (Bluetooth Low Energy,

mongodb 基本的概念-数据库、集合、文档

mongodb中基本的概念是数据库.集合.文档. 下表将帮助您更容易理解Mongo中的一些概念: SQL术语/概念      解释/说明   MongoDB术语/概念 解释/说明 database 数据库 database 数据库 table  表 collection 集合 row                                          记录行                            document                           

360SDK文档

360  账号_ _ 社交_ _ 支付_ _ 数据_ _ 推送  SDK  接入 文档 版本号  修改时间  内容  修改人 1.1.0(270) 2014-11-13  修改: 修改AndroidManifest配置, 删除浮窗相关的activity 和service. 修改:修改混淆的proguard选项,增加-dontwarn参数. 360 手游中心 1.1.0(270) 2014-11-19  修改:修改推送API说明,增加告知相关的API方法所在的类. 360 手游中心 1.1.2(2

MySQL更改默认的数据文档存储目录

MySQL默认的数据文档存储目录为/var/lib/mysql.假如要把MySQL目录移到/home/data下需要进行下面几步: 1.创建目录 cd /opt && mkdir data 2.把MySQL服务进程停掉 mysqladmin -u root -p shutdown .. 或者 service mysqld stop 3.把/var/lib/mysql整个目录移到/home/data mv /var/lib/mysql/* /opt/data/ 这样就把MySQL的数据文档移