——以自由落体方程为例
摘要:数学可应用性问题一直未能被很好的解释,近期一种结构主义进路的“映射”理论被提出,认为可以仅仅通过诉诸数学与其所应用的领域之间的结构相似性来解释数学的可应用性。但该理论无法解释在某些数学应用的情况中,为何一些数学解无物理对应物。从认知的角度引入一种与映射理论相容的数学认知理论,通过解释数学与其所应用的领域之间结构相似性的认知来源,可以解释映射理论无法说明的问题。通过分析一个具体的自由落体方程负数解的案例可以展现从认知进路解释数学可应用性的可行性。
关键词:数学可应用性;数学认知;自由落体
一 引言
从日常生活中买东西算账到物理学家给亚原子的行为建模,数学被很好的应用在人类社会的各个领域。对于物理学来说,数学不仅仅提供了一种建构物理学理论的描述语言和描述框架,还直接参与到新理论发现之中。数学为何能如此有效的应用于其自身之外的领域?关于数字、集合、方程这类抽象对象的数学理论是如何能应用于物理世界的?这些数学可应用性的问题一直没有一个很好的回答。很多物理学家和应用数学家惊讶于数学在自然科学中的“不可思议的有效性”,著名的物理学家尤金·魏格纳曾说到:“数学语言在建构物理定律中所展现奇迹般的适用性是一个绝好的礼物,我们即无法了解,也不配拥有”[2]。
数学实在论与反实在论在解释数学可应用性上都存在各自的困难。数学实在论认为,像数字、集合这样的数学对象是客观存在的,数学公理与定理是关于抽象数学对象的客观真理,因此数学在科学应用中可以推导出真理是因为数学公理与定理本身是真理。但应用到物理世界的数学中包含无穷等结构,我们最好的物理理论却告诉我们世界并不是无穷的。所以包含无穷对象的数学如何能应用到有穷的物理世界,是数学实在论所要面对的问题[1]。20世纪下半叶很流行的一种数学实在论——蒯因和普特南的数学实在论——诉诸数学对于我们最好的物理理论的不可或缺性来论证数学的实在性。即用数学的可应用性来论证其整体实在论。在他们看来,数学实体对物理学对象的量化,对于我们最好的物理学理论来说是不可或缺的,因此我们最好的物理理论的经验证据也同时从经验上证实了这些数学实体的存在。这种整体的实在论及其不可或缺论证的问题在于,没能说明数学为什么是不可或缺的[3]。
为了解释数学的可应用性以及“不可思议的有效性”,一些结构主义的解释近期被提出,主要有平考克(Pincock)[4][5],席尔瓦(Jairo Jose´ da Silva)[6],贝克(Baker)[7],棱·玛丽(Leng)[8]。这些结构主义的解释认为,数学与所要应用的对象之间的结构相似性是其可应用的基础以及原因。本文讨论其中一种比较有代表性的被称之为“映射解释”(mapping account)的理论,并赞同诉诸结构相似相来解释数学可应用性。但认为只是描述结构相似相本身对于解释数学的可应用性是不够的,而需要同时解释结构相似性的来源。本文尝试并引入一种与映射理论相容的数学认知理论,通过解释数学与其所应用的领域之间结构相似性的来源,来解释数学的可应用性。并通过分析一个具体的自由落体方程负数解的案例来展现这种认知进路的可行性。
二 数学可应用性的“映射解释”及其局限性
映射理论[4][5]采用结构主义进路,认为在自然科学中所应用的数学的结构与自然科学研究的对象的结构之间有着相似性。该理论认为,解释数学的可应用性的关键在于解释为何可以在科学研究中使用“混合陈述”(mixed statement)。所谓“混合陈述”是指像“卫星的质量为100kg”这样的陈述——其中即包含数学术语(数字100),又包含关于世界某些性质的非数学术语(物理术语:卫星的质量)。数学术语是关于抽象的数学对象的,如数量、集合、方程等。而混合陈述中的非数学术语往往是关于物理世界实存的物体及其性质的,例如卫星、苹果、长度、质量等。数学术语为什么可以与非数学的术语结合,为什么自然科学中可以使用这样的混合陈述?(即这些混合陈述的成真条件是什么?)映射理论认为,混合陈述的真,取决于在数学域(mathematical domain)与物理对象之间存在着某种特定类型的映射(mapping)。以计数为例,就是在被计数的对象与自然数的前段之间存在着同构映射(isomorphism)。而更复杂的应用会包含其它种类的映射,例如在物体的质量与数之间,就存在着同态映射(homomorphism)。(所以如果“卫星的质量为100kg”为真,表明在卫星的质量与自然数100之间有某种映射关系。这样,在映射建立起来之后,就可以通过数学操作来解决实际问题,例如在物体的重量与正实数之间建立起映射关系后,知道物体a与物体b的重量,就可以通过数学操作而知道物体a与b的共同重量而不用去实际的再测量。根据这种观点,数学在自然科学中的作用有点类似于城市地图:一旦在城市地图与城市街道之间的结构性相似建构起来以后,地图就可以代表城市,我们就可以通过研究地图而发现很多平时很难直接发现的关于城市的性质[9]。即,用数学结构来刻画日常生活或者经验科学的研究对象中的某些结构关系,而一旦这两者之间的对应建立起来,就可用通过数学操作或者解数学问题来解决其所对应的实际问题。
映射理论在某种意义上是正确的。一个数学理论如果在经验科学和日常活动中可以有效的应用,它一定是刻画了那种活动和经验科学的研究对象系统的某种特性和关系。但是要说明数学的可应用性,仅仅指出在世界和数学之间存在某种结构映射,乃至逐个找出来都是不够的。在数学的实际应用当中,数学结构并不总是能精确有效的映射到物质世界的结构。有些时候当用数学解决物理学问题的时候,有些数学解并没有相应的物理对应物。例如在自由落体的问题中,由于自由落体方程( )是二次方程,所以有两个数学解(即落地时间t和-t)。但实际上自由落体真正的落地时间只有一个,即只有一个解具有物理意义,而另一个没有。而有些时候,一些原本被认为是没有物理意义的解,后来又被发现具有物理意义。映射理论无法解释上述数学应用中的现象。虽然映射理论可以反驳说,只需要解释所“用到”的那一部分有物理对应的数学即可。但问题在于,把数学应用到自然科学的一个目的就是要在建立起数学与研究对象之间的联系后,通过数学操作和解数学问题得到相对应的物理问题的解。如果存在没有物理对应物的数学解,那么一个好的数学可应用性理论应该能解释其原因,这是映射理论无法做到的。在自由落体的情况中,可以根据常识判定哪一个数学解具有物理意义,但是在更复杂的情况中就无法仅凭常识了。例如,狄拉克方程是二次偏微分方程,解出的两个解一个对应于物质,但另一个是否有物理对应,有的话对应于什么,并不能简单的凭借日常经验获得,而是需要提出一个假设后再去实验验证(这个例子中,另一个解对应的是反物质)。所以一个好的数学可应用性理论应该要能在理论内部解释这些现象。
三 从数学认知的角度解释数学可应用性
映射理论的困难在于其只讲述了故事的一半:只有了解数学与世界之间的映射关系是为什么以及如何生成的,而不仅仅是描述形成的是什么样的映射,才能很好的解释数学的可应用性问题。为此本文引入认知视角,通过明被应用的数学结构与其应用领域的研究对象的结构(一般是自然科学所要研究的物理世界的结构)之间为何会存在映射或者结构相似性,来解释数学可应用性问题。引入认知视角需要借助已有的数学认知理论,本文选择语言学家拉考夫(George Lakoff)与认知科学家努茨(Rafael Núñez)基于认知语言学所提出的数学认知理论(以下简称L&N理论)[10]。
L&N理论认为,人类具有一些特有的认知机制,可以把其所感知到的外部世界的结构以及自身身体性的经验结构“映射”到数学这样抽象的概念系统中。该理论认为复杂的数学概念及其系统正是人类基于天生的数学能力,通过像概念隐喻和概念混合等这样的认知机制在与外部世界的交互中历史性的发展出来的[11]。人类通过自然演化,具有先天的(innate)数学认知能力。大量的经验研究表明,刚出生的婴儿具有简单的数量识别以及简单的算术能力。但是这种简单的算术能力是无法天然的发展为更复杂的算术以及数学系统的。L&N理论认为,人类同时还具有像概念隐喻和概念混合这样基本的日常(everyday)认知机制,可以把人类在与外部世界交互中形成的一些具体的经验的结构映射到数学域中从而扩展先天数学的域和结构。这些具体的经验包括对物体进行拆分和聚合的经验、感知到物体在空间中运动轨迹的经验、自身在空间中移动的经验等等。
认知语言学通过对大量日常语言的结构的研究,发现一些人类通过语言所表达出来的思维方式和认知机制。概念隐喻就是这么一种可以通过语言表达出来的认知机制,这种认知机制可以把一个域(源域)的结构映射到另一个域(目标域)。例如,我们经常会说“期末考试近在眼前”,“夏天已经过去很久了”这样的话。这类表达有一种共同的规律——都把时间上的先后与空间上的前后方位对应起来。即用空间的结构来思考和描述与时间相关的事物。类似于这样的表达在日常语言中还有很多,例如我们也经常会说“这个论证太跳跃了”,这就是把人类某种具体经验的结构——走路与跳跃的关系——映射到关于“论证”这类抽象概念的结构上。概念隐喻就是这么一种人类进化而来的认知机制,其本质是一种可以保持结构的映射,把源域的结构(一般是与人类活动相关的具体的域或具体概念的域)映射到目标域(一般是更抽象的概念域)例如第一个例子中把人类感知到的空间结构映射到时间概念的隐喻,认知语言学称之为“时间上的事件是一维单向空间事件”。
L&N理论认为,存在四个“根隐喻”,可以把某些人类身体性经验的结构映射到天生的初等的算术域从而逐步扩展数域及其结构而形成复杂的数学概念体系。这四个隐喻分别是:“算术是物体的聚合”,“算术是物体的建构”,“作为测量尺的算术”,“算术是沿某一路径的运动”。 “算术是物体的聚合”把天生的局限在4以内的简单算术扩展为自然数及其上的算术;“算术是物体的建构”把数看作是由部分组成的(即自然数1也是由部分组成的),所以数域扩展到正分数即正有理数;隐喻“作为测量尺的算术”把数域扩展到正无理数。而“算术是沿某一路径的运动”带来负数的概念,同时把数域扩展到复数[10]60。这里需要指出的是,数域在历史上扩展过程很复杂,L&N理论所说的通过4个隐喻扩展的数域主要是指在个体的认知层面,这4个隐喻让我们有能力去扩展已有的数域,并使得我们可以理解实际扩展后的数域。即大多数人基于日常的活动都会拥有这四个隐喻所代表的认知机制和能力,这是数域在历史上不断扩展的基础。至于历史上数学的术语具体的扩展过程以及数学具体的发展过程是另外一回事,不同地区的不同社会状况以及不同的符号表达系统都会影响到这一发展。
可以看到,L&N关于数学的认知理论也是一种“映射”理论,不同的是他们利用认知语言学关于概念隐喻等认知机制的研究,具体的阐述是什么样的身体性的经验结构被映射到初级的数学域上,从而扩展了数域及其结构,发展出复杂的数学。他们给出了数学结构与“外部世界”结构相似性的一种认知的解释:数学的结构本身来自于我们所感知和经验到的外部世界的结构。所以L&N理论可以很好的解释数学的可应用性问题。下面,本文尝试通过一个案例分析来具体说明如何用L&N理论来解释映射理论无法解释的问题。
四 自由落体案例研究
本文第二部分提到由平考克提出的映射理论无法解释为什么某些数学应用中一些数学解无物理意义,其中最简单的一个例子是自由落体方程的负数解。本节引入L&N理论从数学认知的角度去解释在自由落体中的例子中为何要舍去负数解。
自由落体定律大约在1633年左右被伽利略发现,其对于近代物理中的动力学和运动学都有很重要的意义。自由落体定律可以用一个二次方程表示: 。其中,h表示自由落体的高度,g是重力加速度常数,t表示下落时间。当我们测得h,想要求下落时间的时候,我们得到t和-t两个解。我们通常在两种不同的意义上使用自由落体方程:自由落体方程可以是一个经验方程(我称之为伽利略意义上的使用);也可以是运动学的一个演绎方程(我称之为牛顿意义上的使用),即可以通过牛顿运动学方程推导出来。但我们无论在哪种意义上使用,最终都会舍去负数解,并给出同样的理由:时间是单向的无法倒流,所以负数解没有意义。但实际上如果从数学认知的角度分析,他们各自有不同的更深层次的原因。
整个问题可以被分为两个小问题:
1为何二次方程会有两个解。
2为何在应用到自由落体中要舍去一个。
(1)为何二次方程会有两个解
映射理论本身无法给出二次方程为何有两个解的原因。而对于数学本身来说,这是一个定义问题:我们规定一个正数有正负两个平方根,所以二次方程有两个解。从认知的角度就是要解释我们为什么要如此定义,即为何规定负数乘以负数为正数。根据L&N理论,基础的算术结构来自4个最基本的概念隐喻,这四个概念隐喻(认知机制)让我们基于基础的身体性经验来理解数。例如向容器中放入物体以及从容器中拿走物体这些日常的经验让我们得以理解“数”的加减法。同样,沿着一条路径朝一个方向走几步,再朝反方向走几步这种身体性的经验也让我们得以理解“数”的加减法。L&N理论认为,我们是基于“算术是沿着路径的运动”这个隐喻来得到和理解负负得正这个算术结构的。即负数乘法的结构来自于物体在空间中沿着二维路径运动的结构。当我们沿着一条路径移动,并确定一个起始点后,起点则可以看做是零点,两边的路径上的位点则分别看作是正数和负数。一个数A乘以一个正数n,可以看作沿着一个方向走A的距离n次,但是乘以-n本身是没有直观的意义的,即没有直接具体的日常经验可以让我们理解一个数乘以一个负数的意义。但出于数域闭合的需要——两个数相乘的结果必定也是一个数——以及正数与负数之间的对称关系,同时出于满足各种算术定律的需要,我们只能把乘以-n理解为先乘以n,再以路径原点为中心进行反转。即乘以-1就是以路径原点为中心进行反转[4]90。由此可见,根据L&N理论,我们之所以定义负数乘以负数为正数,是基于大多数人所共有的沿着路径移动的经验即物体在二维空间移动的经验。即包括负数相乘在内的算术结构“来自于”我们所能感知和体验到的物体在空间运动的结构,或者说是某种“空间结构。
(2)为何在应用到自由落体中要舍去负数解
近代科学的两个重要的特征是实验和数学。在科学研究中,我们量化实验对象,并找出他们之间的数量关系。在物理学中,空间(位移)和时间是最基础的变量,很多其他的物理量例如加速度和速度,都是由时间和空间来定义。把算术结构运用到对于位移的描述是很自然的事情,因为上小节论述过,算术结构“来自”于我们所经验到的物体在空间运动的结构。同时也可以把算术结构用到对于时间的描述。因为我们拥有一种通过空间结构来思考时间的认知机制——隐喻“时间事件是一维空间单向事件”。即我们可以用空间概念来隐喻的描述时间。这个隐喻可以把单向一维空间的结构精确的映射到时间的结构上,所以我们也可以把算术结构应用到关于时间的度量和计算。
在把自由落体方程看作是经验性定律的情况中,只需要用到正数。这种情况中,我们是通过实际的测量自由落体下落的时间和位移,并找出这两者之间的数量关系,经验性的得到自由落体公式: (其中A是常量参数)。构建方程时只用到正数,负数不被用来代表物理量。我们在用算术结构来刻画空间和时间的时候,就没有给予负数对应的物理意义。当然,我们可以把与正位移相反方向的位移定义为负位移。我们同样可以把过去的时间定义为负时间。但是在这种情况中我们一开始就没有用到负数这部分。我们舍去负数解是因为在这种情况下我们不需要负数来代表什么。方程有负数解是因为数学方程本身的原因,而我们不需要那部分。所以在伽利略的意义上使用自由落体方程,舍去负数解是因为在解方程之前就不需要负数来刻画时空,而不是负时间没有意义。
在把自由落体方程看作是运动学的一个演绎方程情况下,用到整个实数域。运动学中,数被用来量化运动的位移和时间,物体运动都可以被用位移和时间之间的关系来刻画。运动学中可以任意的定义位移和时间的原点:一般定义时间原点之后的时间为正时间,而之前的时间为负时间。加速度和速度分别被定义为: 、 ,所以定义位移 。如果设加速度为常量,则可推导出匀加运动方程: 。如果把速度为零的时间点定义为位移和时间的原点,则这个方程描述了一个匀变速运动——当向原点移动的时候绝对速度匀速减小,离开原点后绝对速度又匀速增加。由此,自由落体运动可以看作是这个匀变速运动的后半程。而方程解出的前半程的负时间在自由落体的情况中要被舍去,则是因为那前半程的运动未发生。在真实的世界中,我们选定运动的原点之后,我们可以朝向不同的方向移动,所以负数的位移总是有意义的,算术结构总是“适合”空间描述。但是我们无法去到时间原点的那一边,即算术结构并不总是“适合”真实的时间。算术结构中负负得正的结构本身就“来自于”我们所感知和体验到的某种真实的空间结构,所以可以很好的与真实空间结构相容,但并不总是能与真实的时间结构相容。我们能够把算术运用到时间是因为概念隐喻“时间事件是一维单向空间事件”使得我们可以用来自于空间结构的数学结构用在对于时间的描述上。人类可以描述过去的时间但是没法“达到”过去的时间,所以在上述例子中,时间是一种“可能”的时间。所以在牛顿的意义上即把自由落体方程看作是牛顿运动学的一个演绎方程时,舍去负数的时间解的原因是:负数解代表了一种可能的运动,但是在自由落体运动中,这种可能的运动不会发生。如果不是自由落体而是竖直向上抛一个物体,并定义速度为零时为原点,那么两个解都会有物理意义。
通过以上的分析我们看到,利用L&N理论从认知的角度去解释为什么自由落体方程会存在没有物理对应物的数学解,可以得到一个比“负数时间没有意义”更具体更有说服力的原因:应用于自由落体方程的算术结构“来自”我们所能感知到的某些真实的“空间结构”,而不是“时间结构”。当把含有种结构的数学再运用到同时包含空间和时间参数的自然科学理论中时,这种数学自然无法“准确”的应用,而会出现没有物理对应的数学解的现象。所以可以说,很多情况下数学并不能“准确”的应用于日常活动和自然科学,从认知的角度看原因是:基础的算术的结构(将会被我们的认知能力扩展为更复杂的数学概念体系)来自于我们的“部分”的经验结构(关于空间的经验结构),而当我们把带有这种结构的数学扩展后再用回到经验当中的时候,它肯定无法“准确”的适合全部的经验域(关于空间和时间经验结构)。
五 结语
通过自由落体案例分析,我们看到基于L&N理论从数学认知的角度可以很好的解释数学可应用性问题中的一些现象。自由落体只是一个很简单的例子,但可以展现出认知进路解释数学可应用性问题乃至其他数学哲学问题的可行性。同时需要指出的是,L&N理论虽然依据一定的实证研究结果而建立,其所主要基于的认知语言学理论也有大量的实证研究支持,但该理论本身仍旧有很多猜测的部分(例如扩展先天数学的4个概念隐喻)。所以L&N理论需要通过更多的实证研究去证实其所假设的隐喻机制。但无论L&N理论本身含有多少真理的成分,引入认知视角利用已有的数学认知理论来解决传统数学哲学问题本身是可行的且具有更多的优势。
参考文献
[1]叶峰.二十世纪数学哲学——一个自然主义者的评述[M].北京:北京大学出版社,2010.
[2]Wigner, E. P. The Unreasonable Effectiveness of Mathematics in the Natural Sciences [J]. Communications on Pure and Applied Mathematics , 1960, 13:1–14.
[3]Colyvan, Mark. The Miracle of Applied Mathematics [J]. Synthese, 2001, 127:265-277.
[4]Pincock, Christopher . A Revealing Flaw in Colyvan’s Indispensability Argument [J]. Philosophy of Science, 2004, 71: 61–79.
[5]Pincock, Christopher. A New Perspective on the Problem of Applying Mathematics [J]. Philosophia Mathematica, 2004, 12(2): 135–161.
[6]Jairo Jose´ da Silva. Structuralism and the Applicability of Mathematics [J]. Axiomathes, 2010, 20:229–253.
[7]Baker, Alan. The Indispensability Argument and Multiple Foundations for Mathematics [J]. Philosophical Quarterly, 2003, 53(210): 49–67.
[8]Leng, Mary. What’s Wrong with Indispensability? (Or the Case for Recreational Mathematics) [J]. Synthese, 2002, 131: 395–417.
[9]Bueno, Otávio. An Inferential Conception of the Application of Mathematics. Noûs, 2011, 45 (2):345 - 374.
[10]Lakoff, G., Nunez, R. Where Mathematics Comes From: How The Embodied Mind Brings Mathematics Into Being [M]. New York: Basic Books, 2000.
[11]Núñez, R. Numbers and Arithmetic: Neither Hard-wired nor Out There [J]. Biological Theory, 2009, 4(1):68-83.
A Cognitive Account about Applicability of Mathematics
—— A case study of free falling body
WANG Dong
(School of philosophy, Renmin University of China, Beijing 100872, China)
Abstract: The applicability of mathematics has always not been explained. A mapping account wanted to explain it by appealing to structural similarity between mathematical structure and structure of the world. But mapping account couldn’t explain why some mathematical solution have not physical counterpart. I try to explain applicability if mathematics by explaining where structural similarity comes from by a cognitive theory of mathematics. And I will analyze a case about free falling which have a negative mathematical solution having no physical counterpart.
Key Words: applicability of mathematics; mathematical cognition; free falling body
作者简介:王东,中国人民大学科学技术哲学博士生,主要研究方向:认知科学哲学、系统科学与复杂性哲学。
原载于《自然辩证法研究》2014(04)