高维度下的数据科学—线性空间(上)

使得集合Y的元素和集合X的元素相对应起来的规则f。

广义的概念:

电影票也是一种映射,发工资也是一种映射,男女朋友也是映射。只要有对应关系,我么就可以认为是映射。映射这个概念就是发明用来对自然界和社会上对应关系的一种抽象。

非常需要注意的是:一定要记住:映射的概念是非常广泛的一个概念,任何两种有关系的事物都可以用映射的概念进行描述,比如张三映射到高三一班,高纬度向量映射到低维度空间。

映射与线性空间的概念对于数据科学来说至关重要,因为现实世界的数据总是包含着许许多多的维度。因此线性空间这个数学工具从某种程度上来说简直就是为数据科学而天造地设的。

X映射到Y上得到的Y上的值就是X映射成为的像

例如X为全班男生,而其中某一个男生的女朋友便是他的像

值域与定义域

X的取值域为定义域

X在Y上的像的取值域为值域

单射与满射

以男生映射到女生为男女关系为例

1.当映射的值域与Y相等时,称映射为满射

即所有的女生都有男朋友,那么就是满射了

2.不同的X不能映射到同一个Y上,这种映射被称为单射

如果有某个女生脚踩两条船,有两三个男朋友,那毫无疑问就不是单射了

3.当映射f即是单射又是满射的话,我们就称映射为一一映射或者双射

即所有的男生都只有一个女朋友,所有的女生也只有一个男朋友

线性映射

从向量说起

对于平面R(2)中的任意向量,其加法运算和数乘运算的定义已经是清楚的了,这里不再赘述,这两种运算是封闭的,即运算后的结果仍然在R(2)中,而且这两种运算满足以下八条运算规律。

线性空间的概念

由线性代数的知识,二维空间可以推广到n维空间,因此我们将上述的情况推至n维实向量空间(注意向量空间和线性空间的区别),可以知道n维向量空间中的向量也是满足上述一些运算率的。

由于实向量空间这种普遍性的性质,我们想为其定义一个专门的名字。于是就有了线性空间的定义。注:但线性空间的概念是要比实向量空间更为大的。

线性空间定义: 如果对于非空集合的元素,加法和数乘两种运算是封闭的,而且其元素的运算规律满足上述八条运算规律,那么我们称集合为数域F上的线性空间或者说向量空间(数域是集合中最最基本元素的取值域)。

线性空间的基本性质

线性空间的基(Basis)、坐标(coordinate)和维数(Dimension)

:如果线性空间中有一组向量线性无关,并且线性空间中任意向量都能够表示成这一组向量的线性组合,那么就称这一组向量为线性空间的基。

由基的定义可以看出,线性空间有无数个基——任意一个基,只要对其内部的某一向量乘以一个常数,变成一个新的向量,取代掉其本身,那么这组新的向量仍然是线性空间的基。

坐标: 线性空间中的任意向量都能够由基向量的线性组合表示出来,其线性组合的参数便为该向量相对于基的坐标。

维数:基中向量的个数,便为线性空间的维数。

注意:线性空间中向量的维数,并不见得是线性空间的维数。如下图中,x1与x2组成的线性空间只是二维,但是x1与x2却是3维向量。线性空间的维数,取决于其任意一个基中所包含的向量的个数。

关于线性空间的基的几点说明

1.如果把线性空间看做是无数个向量组成的向量组,那么线性空间的基就是向量组的最大无关组,线性空间的维数就是向量组的秩序。(例如上图中x1,x2两个向量所张成的线性空间的所有向量的组成的向量组的秩,毫无疑问是2)

2.如果a1,a2…an是线性空间V的一个基,线性空间可以写成span{a1,a2,…an}

3.对于线性空间中的任意一个线性无关组,如果其个数与基相等,那么这个线性无关组也是一个基

4.研究n维向量空间V,通过它的基及向量坐标表示,就转化为研究线性空间R^n

默认的基

事实上,在线性空间R^n中,我们日常的3维坐标,是有一个默认的基的,它就是n*n的单位矩阵。一定要记住坐标与向量并不是同一回事儿。

线性空间的子空间

定义:1.子空间是线性空间的一个子集,子空间的基的维数要比母空间的基的维数要小;2.子空间要满足加法和数乘运算的封闭性,以及8条运算规律,所以子空间必须包含原点。

基变换与坐标变换

对于不同的基,线性空间上的向量的坐标当然是不一样的,那么两种坐标应当如何进行变换呢?

基变换

坐标变换

证明很简单,将基向量组与坐标相乘,不同的基与其对应的坐标相乘,两个基与坐标相乘的结果是一样的。都是该向量的值。

时间: 2024-07-31 14:33:48

高维度下的数据科学—线性空间(上)的相关文章

PCA算法详解——本质上就是投影后使得数据尽可能分散(方差最大),PCA可以被定义为数据在低维线性空间上的正交投影,这个线性空间被称为主?空间(principal subspace),使得投影数据的?差被最?化(Hotelling, 1933),即最大方差理论。

PCA PCA(Principal Component Analysis,主成分分析)是一种常用的数据分析方法.PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维.网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理.这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么. 当然我并不打算把文章写成纯数学文章,而是希望用直观和易懂的方式叙述PCA的数学原理,所以整个文章不会引入严格的

TCP Incast 问题TCP INCAST解决思路 应用场景:在集群文件系统内,客户端应用请求某个逻辑数据块(通常情况下一个读数据块大小是1MB),该数据块以条带化方式分别存储在几个存储服务器上,即采用更小的数据片存储(32KB,256KB等),这种小数据片称为服务器请求单元(SRU)。只有当客户端接收到所有的服务器返回的其所请求数据块的SRU后才继续发送出下一个数据块请求,即客户端同时向

TCP INCAST解决思路 应用场景:在集群文件系统内,客户端应用请求某个逻辑数据块(通常情况下一个读数据块大小是1MB),该数据块以条带化方式分别存储在几个存储服务器上,即采用更小的数据片存储(32KB,256KB等),这种小数据片称为服务器请求单元(SRU).只有当客户端接收到所有的服务器返回的其所请求数据块的SRU后才继续发送出下一个数据块请求,即客户端同时向多个存储服务器发起并发TCP请求,且所有服务器同时向客户端发送SRU. 出现的问题: 1)         这种多对一的服务器向客

高清图解:神经网络、机器学习、数据科学一网打尽

|导|读| BY:AI-Beetle 完全图解人工智能.NLP.机器学习.深度学习.大数据!这份备忘单涵盖了上述领域几乎全部的知识点,并使用信息图.脑图等多种可视化方式呈现,设计精美,实用性强.今天,我们要为大家推荐一个超实用.颜值超高的神经网络+机器学习+数据科学和Python的完全图解,文末附有高清PDF版链接,支持下载.打印,推荐大家可以做成鼠标垫.桌布,或者印成手册等随手携带,随时翻看.这是一份非常详实的备忘单,涉及具体内容包括:1.2神经网络3.神经网络基础知识4.神经网络图谱5.机器

上有庙堂之高,下有江湖之远。

踏实.务实.磨练. 上有庙堂之高,下有江湖之远.,码迷,mamicode.com

《Python数据科学手册》【高清中文版PDF+高清英文版PDF+源代码】

下载:https://pan.baidu.com/s/1RDTQxG3vjG2xGsX4Mx-5KA 最新出版的<Python数据科学手册>. <Python数据科学手册>[中文版和英文版][高清完整版PDF]+[配套源代码] 高清中文版PDF,474页,带目录和书签,能够复制粘贴:高清英文版PDF,548页,带目录和书签,能够复制粘贴:中英文两版可以对比学习. 配套源代码: 经典书籍,讲解详细: 其中高清中文版如图 原文地址:http://blog.51cto.com/32151

分享《Python数据科学手册》【高清中文版PDF+高清英文版PDF+源代码】

下载:https://pan.baidu.com/s/1RDTQxG3vjG2xGsX4Mx-5KA 最新出版的<Python数据科学手册>. <Python数据科学手册>[中文版和英文版][高清完整版PDF]+[配套源代码] 高清中文版PDF,474页,带目录和书签,能够复制粘贴:高清英文版PDF,548页,带目录和书签,能够复制粘贴:中英文两版可以对比学习. 配套源代码: 经典书籍,讲解详细: 其中高清中文版如图 原文地址:http://blog.51cto.com/32151

《Python数据科学手册》【中文版和英文版】【高清完整版PDF】+【配套源代码】

下载:https://pan.baidu.com/s/1RDTQxG3vjG2xGsX4Mx-5KA 最新出版的<Python数据科学手册>. 高清中文版PDF,474页,带目录和书签,能够复制粘贴:高清英文版PDF,548页,带目录和书签,能够复制粘贴:中英文两版可以对比学习. 配套源代码: 经典书籍,讲解详细: 其中高清中文版如图 原文地址:http://blog.51cto.com/3215120/2306934

分享《数据科学实战》高清中文版PDF+英文版PDF+数据集

下载:https://pan.baidu.com/s/1eonGXbeQr9OTY_4h0aP0Zw 更多资料分享:http://blog.51cto.com/3215120 <数据科学实战>高清中文版PDF,337页,带书签目录,文字可以复制,彩色配图.<数据科学实战>高清英文版PDF,405页,带书签目录,文字可以复制,彩色配图. 中英文两版可以对比学习.配套数据集.经典书籍,讲解详细:其中,高清中文版如图: 原文地址:http://blog.51cto.com/3215120

分享《数据科学入门》(高清中文版PDF+高清英文版PDF+源代码)

下载:https://pan.baidu.com/s/1_nNxLeEJhvkO0BL7Xo3JFQ 更多分享资料:http://blog.51cto.com/3215120 <数据科学入门>(高清中文版PDF+高清英文版PDF+源代码) 高清中文版PDF,310页,带目录和书签,能够复制粘贴:高清英文版PDF,330页,带目录和书签,能够复制粘贴:中英文两版可以对比学习. 配套源代码: 经典书籍,讲解详细: 其中高清中文版如图 原文地址:http://blog.51cto.com/32151