傅里叶变换交互式入门

Jez Swanson

由杜尚明翻译

傅里叶变换是一种在各个领域都经常使用的数学工具。这个网站将为你介绍傅里叶变换能干什么，为什么傅里叶变换非常有用，以及你如何利用傅里叶变换干漂亮的事。就像下面这样：

我将为你解释这个动画是如何工作的，沿途为你详细地解释傅里叶变换！

这次旅途结束后，你将会掌握下面这些知识：

什么是傅里叶变换
傅里叶变换的一些实际用途
傅立叶变换的一些很酷的用法（虽然有些没有实际意义）

我们现在暂时不提那些复杂的数学公式。傅里叶背后的数学原理十分有趣，但最好还是先从它的实际应用开始，以及为什么要使用它。如果你想了解更多，下面提供了一些进一步的阅读建议！

傅里叶变换是什么

简而言之，傅里叶变换把一个输入信号分解成一堆正弦波的叠加。就像大多数数学方法一样，这个名字来自一个名叫傅立叶的人。

让我们从一些简单的例子开始，然后继续前进。首先，我们来看看什么是波 —— 波随着时间的推移，一直按照某一规律变化。

这是一个波的例子：

这个波可以分解为两个正弦波的叠加。也就是说，当我们将两个正弦波相加时，就会得到原来的波。

傅里叶变换可以让我们从一个复杂的波形里面，把构成这个波的单个正弦波分离出来。在这个例子中，你几乎可以通过“脑补”完成这一操作。

为什么？事实证明，现实世界中的许多事物间的互相交互，都是基于正弦波。我们通常将这种波的快慢的性质，称为波的频率。

最明显的例子就是声音 —— 当我们听到声音时，我们听不到那条波浪线，但我们听到构成声音的正弦波的不同频率。

能够在计算机上区分这两个音调，我们就可以了解一个人实际可以听到的内容。我们可以理解声音的高低，或弄清楚这个波包含了什么音符。

一些波看起来不像由正弦波构成，我们也可以用这个分解的过程来进行分析。

我们来看看这个家伙吧。这个波称为方波。

虽然看起来不太可能，但它确实也可以分解成正弦波。

这次我们需要很多 —— 理论上是无限多的正弦波来完美地表达一个方波。随着我们加入越来越多的正弦波，叠加出的波形就越来越接近方波。

移动滑块来试试我们需要多少个正弦波。*

在视觉上，你会注意到前几个正弦波的叠加可以在结果中产生最大差异。滑块滑到一半时，就有一些方波的样子了，但它看起来摇摆不定。加上更多小的正弦波，组合出的波形看起来就平坦了。

当播放这个波形时，你会发现使用的正弦波少时，声音听起来更低沉一些。这是因为我们把高频率的成分去掉了。

这一过程可以用来处理任何有周期的波。试一试，画一个你喜欢的波形吧。

画一个波形！

移动滑块来观察，正弦波加得越多，组合出的波形越接近你画的原始波形。

和上一个方波类似，除了有些额外的摆动之外，滑块移动到中间位置，生成的波形就很接近你画的了。

我们可以利用这个事实：使用傅里叶变换，我们可以把音频中最重要的成分表达出来，并且得到和原始声音非常接近的波形。

在计算机中，波形以一系列数据点的形式来存储。

我们可以做的是，将声音表示为一堆正弦波。然后可以通过忽略掉较小幅度的高频成分来压缩声音。尽管得出的波形与原始波形不一样，但是听起来将会和原始声音很接近。

这基本上就是MP3做的事情。MP3除此之外还可以更聪明地知道需要保留哪些频率以及扔掉哪些频率。

所以在这种情况下，我们可以使用傅里叶变换来理解波的基本属性，然后我们可以将它用于数据的压缩之类的事情。

好的，现在让我们深入了解傅立叶变换。下一部分看起来很酷，也让你更加了解傅立叶变换的作用。但大多只是“看起来”很酷。

周转圆

在开始时，我介绍了傅里叶变换可以将事物分成正弦波。但更酷的是，它产生的正弦波不仅仅是一般的正弦波，它们都是“三维”的正弦波。你可以称之为“复杂的”正弦曲线，或者，“螺旋”。

如果我们从侧面看，它们看起来像正弦波。但是，从正面看，它们看起来像圆圈。

到目前为止，我们所做的一切只需要常规的2D正弦波。当我们对2D波进行傅里叶变换时，“复杂的”部分被忽略了，所以我们最终也只能得到正弦波。

但是我们可以使用3D正弦波来制作看起来很有趣的东西，就像这个：

这里发生了什么事情呢？

我们可以将一个手绘图理解为一个3D的形状，因为点的位置在随时间移动。如果你想象一个人正在绘制一只手，那么这三个维度就代表了某一时刻铅笔尖的位置。除了x和y维度告诉我们笔尖的位置，还有一个时间维度。

现在我们有一个3D的形状，我们不能使用常规2D正弦波把它表示出来。无论我们添加多少2D正弦波，我们都永远不会得到3D。所以我们需要些别的东西。

我们可以使用的是之前的3D螺旋正弦波。如果我们添加很多这些螺旋，得到的东西就看起来像我们的3D形状。

请记住，当我们从前面看它们时，这些波浪看起来像圆圈。围绕另一个圆圈移动的圆圈图案，被称为“周转圆”。

移动滑块来控制加入多少个圆。

像以前一样，我们只用几个圆圈就可以很好地近似表达出原始图案。因为这是一个相当简单的形状，所有后面添加的小圆都是使边缘更加锐利。

这些适用于任何一个图案。真的，现在你创作的机会来了。

画一个波形！

移动滑块来控制加入多少个圆。

同样，你会发现，对于大多数形状，我们可以用很少的圆圈很好地近似表达它们，要保存一个形状，我们不必保存形状上所有的点。

这个方法可以应用于实际数据吗？答案是可以！实际上，我们有另一种称为SVG的数据格式，比我们在这里绘制图案更好用一些。所以目前，我们只是制作了些炫酷的小GIF。

然而，还有另一种类型的视觉数据使用傅里叶变换。

JPEGs

你知道傅立叶变换除了可以表达简单的手绘线条，还可以用于图像吗？事实上，我们一直都在使用它，因为这就是JPEG的工作原理！我们将相同的原理应用于图像 —— 将某些东西分成一堆正弦波，然后只存储重要的东西。

要处理图像，我们需要一种不同类型的正弦波。我们需要这样的一种“正弦波”：无论我们有什么样的图像，我们都可以添加一堆这些正弦波来回到原始图像。

要做到这一点，我们使用的每个正弦波也将是一个个小图像。我们现在使用一些黑白条纹的小图像，这些更可以表达为“线”，而不是波。为了表示“波”的大小，每个图像将具有或多或少的明暗对比。

我们也可以以类似的方式表示出颜色，但我们先从灰度图像开始玩。为了表示灰度图像，我们需要一些水平的波图案，

还有一些垂直的波图案。

就其本身而言，只有水平和垂直图像还不足以表达出我们可以看到的图像。我们还需要一些额外的图案，将两者相乘。

×

=

要得到一个8x8分辨率的图像，这里是我们需要的所有小图案。

如果我们把这些小图案的对比度调整到适当的值，然后将它们相加，我们就可以得出任意图像。

让我们从一个字母"A"开始。它非常小，但我们需要它很小，否则我们最终会得到太多其他的图像。

随着我们添加越来越多的这些图案，我们最终得到的东西越来越接近实际图像。我觉得你只要添加很少一部分图案，就能看出字母“A”的样子来。

对于实际的JPEG图像来说，这就是基本原理，剩下的只有一些额外的细节。

图像被分解为8x8块，每个块分别进行分解。我们使用一组频率来确定每个像素的亮度或暗度，然后是另外两组用于颜色，一组用于红绿色，另一组用于蓝黄色。我们为每个块使用的频率个数决定了JPEG图像的品质。

这是一个实际的JPEG图像，放大后我们可以看到细节。当我们改变JPEG品质水平时，可以观察出画质的区别。

总结

让我们回顾一下：

傅里叶变换让我们输入一个事物，并将其分解为不同频率的成分
频率告诉我们有关数据的一些基本属性
并且可以通过仅存储重要的成分来压缩数据
我们还可以用傅里叶变换的原理，通过一堆圆圈制作看起来很酷的动画

这只是表面上的一些浅层次应用。傅里叶变换是一个非常强大的工具，因为将事物分解成不同频率是十分重要的分析方法。它们被用于许多领域，包括电路设计，移动网络信号，磁共振成像（MRI）和量子物理！

一些问题

我在这里跳过了大部分的数学原理。如果你对它的数学原理很感兴趣，可以用以下这些问题来帮助你研究：

你如何在数学上表示傅里叶变换？
连续时间傅立叶变换和离散时间傅立叶变换之间有什么区别？
你如何计算傅里叶变换？
你如何对整首歌曲进行傅里叶变换？（不仅仅是单个音符）

拓展阅读

要了解更多信息，你可以看看这些非常好的资源（作者推荐的这些资源是英文版的）。

An Interactive Guide To The Fourier Transform 从数学角度更加深刻地介绍傅里叶变换。

But what is the Fourier Transform? A visual introduction. 3Blue1Brown 制作的 YouTube 视频，从音频的角度解释傅里叶变换的数学原理。

A Tale of Math & Art: Creating the Fourier Series Harmonic Circles Visualization 另一篇不错的文章，从线性代数的角度解释如何用周转圆来画出形状。

Fourier transform (Wikipedia) 当然，维基百科的解释也很不错。

傅里叶变换（维基百科）译者为你添加了中文维基的链接。

关于作者

我的名字叫Jez！我在美国湾区的一家搜索引擎公司工作，在业余时间我喜欢制作这样的游戏和互动代码！

这个网页是开源的，你可以查看GitHub上的代码！如果您有任何反馈或想提出任何问题，可以给我发邮件fourier [at] jezzamon [dot] com，或者发Twitter。

如果你想查看我的更多作品，可以访问我的主页，如果想知道我以后会制作什么，可以关注我的Twitter：@jezzamonn!

这个页面的汉语翻译由virtualwiz提供。译者是一名学生，现就读于英国伯明翰大学(University of Birmingham)。欢迎访问译者的GitHub。