为了理解无穷小量是多么富有启发性,我们不妨从非常具体的例子入手。思考一下这个算术问题:2的立方(2×2×2)是多少?答案当然是8。那么,2.001×2.001×2.001是多少?其结果肯定略大于8,但到底大多少呢?
在这里,我们要寻找的是一种思维方式,而不是一个数值解。一般性的问题是,当我们改变一个问题的输入(在这个例子中,就是把2变为2.001)时,输出会改变多少呢?(在这里,答案从8变为8加上某个我们要了解其结构的东西)。
既然很难忍住不偷看,那么干脆看看计算器会告诉我们什么吧。输入2.001,然后按下 x³ 键,得到:
(2.001)³=8.012006001
我们需要注意的结构是这个数的小数部分,它实际上是由3个大小完全不同的部分组成的:
0.012006001=0.012+0.000006+0.000000001
我们可以把它想象成"小"的部分加上"超小"的部分再加上"超超小"的部分,并运用代数方法来理解这个结构。假设一个量 x (在这个例子中是2)略微变化为 x +△x (在这个例子中是2.001)。符号 △x 表示 x 的差分,指 x 的微小变化量(在这个例子中△ x =0.001)。当我们问(2.001)³是多少时,我们实际上问的是( x +△ x )³等于多少。经过乘法运算(或者运用杨辉三角形和二项式定理),我们发现:
( x +△x )³=x³+3x²△x +3x(△ x )²+(△x )³
把 x =2代入后,这个方程变为:
(2+△x )³=2³+3(2)²(△x)+3(2)(△x)²+(△x)³
=8+12△x +6(△x)²+(△x)³
现在我们就能明白,为什么除了8以外的数位是由3个大小不同的部分组成的。小但却占据主导地位的部分是12△x =12×0.001=0.012,而6(△x )²和(△x )³则分别对应超小部分0.000006和超超小部分0.000000001。某个部分中△ x 的指数越大,其数值就越小。每多乘以一次微小的因子 △x ,都会让一个小的部分变得更小,这就是各个部分大小不同的原因。
这个例子虽然不起眼,却恰恰展示出微积分背后的核心观点。在很多关于原因与结果、剂量与反应、输入与输出,或者其他类型的自变量 x 和因变量 y 之间关系的问题中,输入的一个小的变化量(△x)都会使输出产生一个小的变化量(△y)。这个小变化量通常是以我们可利用的结构化方式组织起来的,也就是说,输出的变化量包含不同层级的部分。按照大小,它们可以被分级成小的、超小的甚至更小的部分。这种分级方式会让我们专注于小但却占据主导地位的变化量,而忽略超小甚至更小的其他变化量。虽然这个变化量很小,但和其他变化量相比却是巨大的(比如,与0.000006和0.00000001相比,0.012是巨大的)。这就是微积分背后的核心观点。
微分除了对正确答案贡献最大的那一部分,其他部分全部忽略不计,这种思维方式似乎只能得到近似的结果。如果输入的变化量是有限的(就像我们在前文中给2加上的0.001),那么事实的确如此。但如果输入的变化量是无穷小的,这种思维方式反而会使结果变得精确;我们不会犯丝毫的差错,因为最大的那个部分变成了全部。而且,正如我们在本书里看到的那样,无穷小的变化量恰恰是我们理解斜率、瞬时速度和曲线下方面积所需要的东西。
为了理解这种思维方式的实际效果,让我们回到前文的例子中,计算一个略大于2的数的立方。只不过我们现在要把2变为2+ dx ,其中 dx 表示无穷小的差分△x ,这个概念本质上没什么意义,所以不用想太多,关键是学会如何利用它使微积分运算变得轻而易举。
特别是前文中将(2+△x)³展开为8+12△x +6(△x)²+(△x)³的计算过程,现在我们可以把它缩减得更简单:
(2+dx)³=8+12dx
那么,像6(dx)²+(dx)³这样的其他项去哪里了?答案是:我们舍弃了它们。作为超小和超超小的无穷小量,它们与12dx相比是完全微不足道的,因此可以忽略不计。但是,我们为什么要保留12dx呢,它和8相比不也是微不足道的吗?尽管事实的确如此,但如果我们把它也舍弃了,就无法考虑任何变化量了,答案将一直是8。所以秘诀在于,想要研究无穷小的变化量,就必须保留涉及 dx 的一次方的项,而忽略其他项。
对于这种利用 dx 之类的无穷小量的思维方式,我们可以从极限的角度重新加以表述,使其变得十分合理和严密,这就是现代教科书的处理方式。但是,使用无穷小量的方法更简单也更快,在这种背景下,它们对应的术语是微分。之所以取这样的名字,是因为我们把它们看作△x 和△y 的差,这些差趋于极限值0。就像我们在显微镜下观察抛物线时看到的那样,随着放大倍数的增加,曲线变得越来越直。
文章来源:《微积分的力量》,作者是美国数学家史蒂夫·斯托加茨。
奇思妙想就是有趣[呲牙笑][呲牙笑]