傅里叶变换的智慧[转]

[转自]https://www.toutiao.com/i6777318172765717006/(版权归原作者所有如有侵权请立即与我联系,我将及时处理)

傅里叶变换(Fourier Transform,有时候被写成“傅立叶变换”)是一个特别常用的数学工具,很可能你已经在大学学过,但我想专门讲讲。傅里叶变换是构建现代科技的一个基础方法,它可以说是无处不在 —— 而我感觉这个操作背后有个智慧,值得每个人深思。

就算你没正式学过,你也很可能听说过“傅里叶变换”这个词。计算机上的声音和图像信号、工程上的任何波动信息、数学上的解微分方程、天文学上对遥远星体的观测,到处都要用到傅里叶变换。你用手机播放MP3音乐、看图片、语音识别,这些都是傅里叶变换的日常应用。吴军最近在得到开了个讲信息论的课,其中也提到了傅里叶变换 [1]。

什么是傅里叶变换呢?维基百科的说法是“是一种线性积分变换,用于信号在时域(或空域)和频域之间的变换”……这句话恐怕比较难懂,而且懂这句话的人也未必理解傅里叶变换的本质。这一讲我们忽略所有的数学细节,一个公式都不用,直奔思想。

*

以我之见,从本质上来说,傅里叶变换,是把一个复杂事物拆解成一堆标准化的简单事物的方法。

咱们用声音来举个例子 [2]。注意声波只是应用傅里叶变换的一个例子,傅里叶变换既不必是关于声音的,也不必是关于波动的。

咱们先说什么是“简单事物”。声音其实就是空气的震动。你拨动一下琴弦,耳边传来一个纯净的、而且在短时间内是持续的声音。像一个 A 音符,大约每秒钟要震动 440 次,所以除非是重低音,你通常不一定能感觉到震动,但是你能感到音量和音调 —— 音量就是震动的幅度,音调就是震动的频率。

下面这张图表现了一个简单的声音。横坐标是时间,纵坐标是震动的幅度。这个声音呈现完美的周期性变化,说明它的频率是固定的,它有一个单纯的音调。这个曲线的形状是“正弦波”,也就是高中学过的正弦曲线的样子。

这就是一个简单事物。真实世界中绝大多数声音都不是简单的,比如我们说话的语音就明显不是一个纯净的音调。放大了细看,复杂的声音是下面这样杂乱的震动 ——

好,现在关键的洞见来了:复杂的震动,可以看做是一系列简单震动的叠加。

比如上面那条曲线看似复杂,其实是三个简单波动相加而成的 ——

你可以把图中最下面的复杂曲线当成你在一天之中感受到的温度变化。表面看来,你感受到的温度变化很复杂,但是实际上,你知道你是在同时经历三件事情。图中的红色曲线就相当于大自然温度的自然变化,绿色曲线相当于你在室内还是室外,蓝色曲线代表你是穿上还是脱下外套。

把这一件复杂的事情拆解成三件简单的事情,你就完全能看明白它到底是怎么回事儿了。

而所谓傅里叶变换就是说,如果我们先规定好一系列的简单波动,那么任何一个复杂的波动,就都可以用这些简单波动拆解。

比如我们看下面这个波形 ——

这个形状看起来有点怪,但是似乎又有一种整齐的规律,那到底是什么规律呢?傅里叶变换是一套数学操作,能把任何形状的曲线拆解成一系列简单波形的叠加。上面这个波形,其实是下面这几种波的叠加 ——

图中蓝色的,就是一系列简单波动。傅里叶变换能告诉我们图中每一个简单波动对红色曲线的贡献度有多大,比如说

红色曲线 = 频率是 100 的蓝色曲线 × 0.5 + 频率是 200 的蓝色曲线 × 0.2 + 频率是 300 的蓝色曲线 × 0.1 + 频率是 400 的蓝色曲线 × 0.08 + ……

那现在我们设想一下,如果上面那些各种频率的蓝色曲线都是大家约定俗成的“标准化的简单事物”,那么想要描写那个看似复杂的红色曲线,我们就只需要报出组成它的各种蓝色曲线的“成分”也就可以了!

红色曲线 = (0.5, 0.2, 0.1, 0.08, ……)

这就是傅里叶变换。

*

现在你看出傅里叶变换的好处来了没有?明明是一条复杂的曲线,可是我们只需要用几个数字就可以描写它!

这就是数字音乐的原理。那些标准化的简单音调都是大家约定好的,所以只需要记录一个声音分解成简单音调的成分值就行。而且因为特别高频和特别低频的声音人的耳朵是听不见的,所以标准化简单音调并没有无限多个,我们只需要用很有限的一组数字就能描写一段时间内的一个复杂声音……这就是最基本的 WAVE 音频格式。把 WAVE 文件里的信息再做一些压缩处理,就是 MP3。JPG 图像的原理也是类似的,只要把时间上的波动改成空间上的波动就行。

傅里叶变换并不要求你记录的这一段信息具有周期性。任何形状的线条都可以用那些标准化的简单曲线合成出来,哪怕只有一个周期也可以做,是不是“波动”并不重要。

那些“标准化的简单音调”都是如何选取的呢?这其中有一些讲究,要求“不重不漏”。所谓不漏,就是它们组合在一起必须在一定的分辨率之内,能覆盖耳朵能听见的所有频率;所谓不重,就是它们互相之间不能有重叠。比如你不能说这一个简单蓝色曲线又可以用其他几个简单蓝色曲线合成出来 —— 那样的话傅里叶变换的解就不是唯一的了。

这些标准化的简单事物是一个傅里叶变换的基石,你可以把它们想象成“维度”。复杂事物就好像是由那一大堆简单事物构成的多维空间中的一点,每一种简单事物的成分就构成了这个复杂事物的坐标。为了保证坐标系统的清爽,各个维度之间应该是互相垂直(数学语言叫“正交”)的关系,也就是谁也不能覆盖和取代谁。

数学概念就说到这里,下面说意义。

*

你每一次对着菜谱做菜,都是在做傅里叶变换。

菜谱说,用这个、这个和这个食材,什么时候加多少盐,什么时候放多少水……那些食材、盐和水,就是傅里叶变换中的那些“简单的标准化事物”。

菜谱无需告诉你牛肉是什么东西、西蓝花是什么东西、盐和水又是什么东西,大家约定俗成都知道它们是什么东西。菜谱只需要把成分告诉你就行。

这说明什么呢?说明如果一个社会有一个大家约定俗成的、标准化的简单事物话语体系,我们的交流就会非常方便。这也说明,要想让交流方便和高效,你就必须得有一个约定俗成的、标准化的简单事物话语体系。

比如古代行军打仗有个最原始的密码系统。事先约定二十个字,每个字代表一个意思。通信的时候写一首诗,比如其中有一句是“大漠孤烟直”。收信人一看“大”字上盖了个章,而知道事先的约定是“大”的意思是要求增兵,就知道你想说什么。

没有这个标准化的约定,我们就无法有效交流。请问谁能用语言精确描写前面图中那条曲线呢?了解一个领域,就得了解这个领域的话语体系。

*

现实中使用的傅里叶变换,总是失真的。理论上有无限个标准化简单音调,但是现实中我们只用有限个数字描写一个声音,这是因为那些不易分辨的、或者振幅特别低的音调都被省略了。所以对数字化声音来说,你得知道你面临下面这几个限制 ——

1. 你发不出不能用我们选取的那几个标准化音调描写的声音;

2. 你的声音的特别细微之处,将会被忽略;

3. 所有能传播的声音都是规定好的单纯声音的排列组合而已。

要不怎么福柯说,“人类的一切知识都是通过‘话语’获得的,任何脱离‘话语’的东西都是不存在的。”

这就意味着,在傅里叶变换的视角下,这个世界并没有什么新鲜的东西。

*

比如有一天你做了一个梦。你觉得这个梦太精彩了,就把它写成了一个小说,你认为这要是拍成电影肯定能火!你兴冲冲地把它拿个一个编剧朋友看,结果他说,你这不就是《罗生门》× 0.5 + 《哈姆雷特》× 0.2 + 《侏罗纪公园》× 0.3 吗?

他给你的剧情做了个傅里叶变换。

现在的情况是凡是能想到的剧情,可能都已经被人拍过了。我以前专门写文章说过 [3],TV Tropes 这个网站列举了所有的剧情桥段。

你所谓的创造,通常只不过是已知的、标准化的简单事物的排列组合而已。

这就是为什么成熟的领域里搞“纯创新”那么难。如果这个领域已经形成了自己特有的话语体系 —— 也就是说都用上傅里叶变换了 —— 你首先要做的大概是学习这个话语体系。

不过好在真实世界并不一定是一个完全可以数字化的封闭系统 [4],也许傅里叶变换终究不能把整个世界给标准化。

注释

[1] 吴军·信息论 40 讲,《10.等价性:信息是如何压缩的?》

[2] 这一小节的图片和主要例子来自 AATISH BHATIA, The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face, Nautilus, JUN 10, 2019.

[3] 《万万没想到》:桥段会毁了你的生活。

[4] 精英日课第二季,《哥德尔不完备性定理的世界观》。 

原文地址:https://www.cnblogs.com/ssqhan/p/12151588.html

时间: 2024-10-05 23:25:17

傅里叶变换的智慧[转]的相关文章

张书乐:BATJ联姻银行:智慧银行会来的更猛烈些吗?

几乎一夜之间,一直有些势成水火的主流互联网金融平台,都分别和四大国有银行牵上了手. 2017年3月28日,阿里巴巴集团.蚂蚁金服集团和中国建设银行签署了三方战略合作协议:6月16日,工商银行牵手京东刘强东进行全面合作,6月20日,百度与农业银行宣布达成战略合作:6月22日,腾讯则下了个"双黄蛋",同一天与中国银行和华夏银行均签战略合作协议-- 至此,互联网(不限于金融)领域俗称的BATJ(百度.阿里.腾讯.京东)与四大国有银行工.农.中.建,均结成了互助对子. 科技金融还是金融科技,这

如何提问问题?--《提问的智慧》再次推荐

下午在某群中有位网友A问: "大神们,问你们个问题,我在虚拟机里装了个服务器,怎么去配IP啊" 下面网友BC唏嘘了几下,网友B表示震惊,网友C表示"Google一大把"的. 但也有好心网友E回复说"控制台进去配",继而网友A就问"能远程?",网友E说"控制台",并截图(以VMware为例)示意. 网友C表示"这种问题也要人远程?未免太懒了点吧  自己搜索答案  又不是什么高深的问题  "

补零与离散傅里叶变换的分辨率

离散傅里叶变换(DFT)的输入是一组离散的值,输出同样是一组离散的值.在输入信号而言,相邻两个采样点的间隔为采样时间Ts.在输出信号而言,相邻两个采样点的间隔为频率分辨率fs/N,其中fs为采样频率,其大小等于1/Ts,N为输入信号的采样点数.这也就是说,DFT的频域分辨率不仅与采样频率有关,也与信号的采样点数有关.那么,如果保持输入信号长度不变,但却对输入信号进行补零,增加DFT的点数,此时的分辨率是变还是不变? 答案是此时分辨率不变.从时域来看,假定要把频率相差很小的两个信号区分开来,直观上

全景智慧城市VR全景行业佼佼者,VR全景

全景智慧城市VR全景行业佼佼者,VR全景,又被称为3D实景,是一种新兴的富媒体技术,其与视频,声音,图片等传统的流媒体大的区别是"可操作,可交互". 一. 360度全景市场需要随着计算机技术的飞速发展,多媒体所包含的种类也越来越多,所能表现的效果也越来越多, 而一些比较传统的表现方式也越来越无法满足大部分客户对于展示方式的要求. 在传统的表现方式中,展示的手段无非是静态的平面图片和动态的视频,也有进行三维全景进行展示的. 静态图片只能提供场景的某一角度图像,即使是广角镜头,也不能有效全

3D实景、720全景加盟,-全景智慧城市

VR全景智慧城市,多年从事三维全景技术应用的互联网公司,我们利用计算机图形学.多媒体.人工智能和计算机网络技术,深入研发和推广虚拟现实VR技术的行业应用.我们以优质的服务.国际领先的技术团队,为您定制全方位解决方案.720全景技术是基于真实场景的虚拟现实技术,可以让你从全方位的视角观察现场实景,身临其境的感觉是平面照片和三维重建都无法做到的.我们利用三维全景虚拟现实技术,制作成交互式720度全景虚拟漫游让你的产品更好地通过网络技术展现给您的客户,是提升您品牌形象的最佳呈现方式. 1)大众化电脑均

VR全景爆发,新颖平台-加盟全景智慧城市

VR虚拟现实.VR全景,又被称为3D实景.720全景,是一种新兴的富媒体技术,其与视频,声音,图片等传统的流媒体大的区别是"可操作,可交互". VR全景把不同的场景分为若干个VR视角点进入一个视角点,用户便能开启"上帝视角"转动手机,身临其境地360度转动察看,对场景的全貌和细节一目了然. 全景虚拟技术是目前迅速发展并逐步流行的一个虚拟现实分支,可广泛应用于网络三维业务也适用于网络虚拟教学领域.三维全景技术则是利用实景照片建立虚拟环境,按照照片拍摄-数字化-图像拼接

VR全景爆发互联网+,新颖平台-全景智慧城市

在互联网大趋势下,实体商家都迫切需要一个好的线上广告宣传方式,来推广自己的店铺及产品,传统的线上宣传方式已经无法满足消费者需求,360度全景展示能更真实直观的把商家展示给用户消费者,给商家带来客流及收益,据不完全统计河南省实体商户最少不低于几百万家,市场前景非常广阔.在互联网时代的今天,用户体验至上,360全景作为一个新型的科技展示技术,通过新颖的广告方式更能吸引用户眼球,足不出户,观看现场实景,达到沉浸式体验. 消费者视角痛点:比如酒店消费行业,很多消费者在预订酒店过程中,都遇到过这样的场景:

傅里叶变换

http://blog.jobbole.com/70549/ 我保证这篇文章和你以前看过的所有文章都不同,这是 2012 年还在果壳的时候写的,但是当时没有来得及写完就出国了--于是拖了两年,嗯,我是拖延症患者-- 这篇文章的核心思想就是: 要让读者在不看任何数学公式的情况下理解傅里叶分析. 傅里叶分析不仅仅是一个数学工具,更是一种可以彻底颠覆一个人以前世界观的思维模式.但不幸的是,傅里叶分析的公式看起来太复杂了,所以很多大一新生上来就懵圈并从此对它深恶痛绝.老实说,这么有意思的东西居然成了大学

傅里叶变换--虚部的理解

傅里叶变换后,包含实部和虚部.当输入信号是纯实数,按照傅里叶变换的奇偶对称性质,有:输入信号中的偶对称分量变换为实部,奇对称分量变换为虚部.