大文斗作文网 > 高中作文 > 高一作文 > 高一其他 > 高一其他2000字

数学之美10篇作文2000字


作文摘要:该篇《数学之美10篇》的作文为高一作文,由作者“livere”与大家一起分享,体裁为其他作文,2000字作文,请同学们仔细阅读全文,你觉得作文中哪段或哪句写的最好呢?同时,你发现哪里有错句或错别字吗?请点击这里评论吧!

看图猜成语游戏

篇一:数学之美_19900字

数学史

浅析《九章算术》

龚 泽

(数学学院数学基地班0410020)

摘要:本文主要介绍了《九章算术》的内容、特点及其在数学发展和生活生产实践中的作用。

关键词:九章算术

在诸多自然学科中,发展时间最长,系统化程度最高,对其它学科影响最大的莫过于数学。在几千年的发展过程中,东西方由于不同的人文社会背景,在不同的方向上都创造了灿烂的数学文明。作为古代中国数学巨著的《九章算术》,是东方数学的经典著作,对世界数学的发展也产生了深远的影响。该书在隋唐时期就已传入朝鲜、日本,现在已被译成日、俄、德、英、法等多种文字。此书受到古代中国儒家思想的影响,在发展道路、内容、特点等方面,与产生在西方背景下的《几何原本》有很大的不同。

著名数学家吴文俊1975年开始重视并研究中国传统数学;他由此发扬了古代中国数学的算法思想,并结合笛卡尔的代数与几何的统一思想,开拓了数学机械化的新领域。数学机械化,成功地解决了一些重大历史难题,如四色猜想。从机械化证明中,我们看到了传统数学算法的重大现实意义。因此,本文就从《九章算术》,去领略一下中国的传统数学。 《九章算术》,又称《九章》,是流传到现在的中国最早的一部数学著作,是《算经十书》中最重要的一种,它是汉代以前数学知识的集大成者,此书由张苍、耿寿昌等数学家整理而逐渐完成,但是作者不详。魏晋时刘微注《九章算术》,全面地解释了《九章算术》的概念,并纠正了其中的一些错误,使该书更为清晰明白,更易为人所理解。

《九章算术》由九卷组成,是以应用问题为形式编写的,共有246个问题,大部分与当时社会生产和日常生活紧密相联。书中先举出实际问题,再以“答”和“术”(算法和公式)解之。

1 《九章算术》的主要内容

第一章 “方田”,列题38个。主要讲平面上几何图形面积(土地面积)的计算方法。包括长方形(直田)、等腰三角形(圭田)、直角梯形(邪田)、等腰梯形(箕田)、圆(圆田)及圆环(环田)等的面积公式。方田章从第五题开始就系统讲述分数的运算。其中包括约分、通分、分数的四则运算,比较分数的大小,以及求几个分数的算术平均数等。

第二章 “粟米”,列题46个。主要讲各种粮食折算的比例问题,在成比例的四个数中,根据三个已知数求第四个数,所用方法称为“今有术”。

第三章 “衰分”,列题20个。衰分是按比例递减分配的意思。这一章主要讲按比例分配

物资或按一定比例摊派税收的比例分配问题。其中含有用比例方法解决的等差数列、等比数列问题。

第四章 “少广”,列题24个。主要讲已知正方形面积或长方体体积反求边长,即开平方或开立方的方法,还给出了由圆面积求周长,由球体积求直径的近似公式。由于其中取圆周率为3,所以精确度较差。

第五章 “商功”,列题28个。主要讲各种形体的体积计算公式。涉及的几何体有长方体、棱柱、棱锥、棱台、圆柱、圆锥、圆台、楔形体等。问题大都来源于营造城垣、开凿沟渠,修造仓窖等实际工程。

第六章 “均输”,列题28个,均输意为按人口多少、路途远近、谷物贵贱、合理摊派税收和劳役等。这一章主要讲以赋税计算和其它应用问题为中心的较为复杂的比例问题的计算方法。

第七章 “盈不足”,列题20个。主要讲以盈亏问题为中心的计算方法。

第八章 “方程”,列题18个。主要讲一次方程组的解法,并提出了关于正、负数加减运算的“正负术”。

第九章 “勾股”,列题24个。主要讲勾股定理的应用和测量问题,以及勾股容方和容圆问题的解法。

2《九章算术》的成就

①算术方面,建立了完整的分数理论和比例计算理论,提出分数的通分、约分和加减乘除四则运算的完整法则,比欧洲早1400多年;

②代数方面,包括开方,正负数,方程理论。这是世界上最早的多位数和分数开方法则,它奠定了中国在高次方程数值解法方面长期领先世界的基础;外国则到7世纪才认识负数。采用分离系数的方法表示线性方程组,相当于现在的矩阵。这是世界上最早的完整的线性方程组解法;在西方,直到17世纪才提出完整的线性方程组的解法。

③几何方面,包括相当复杂的各种多边形、圆、弓形等求积公式和勾股问题。 3 《九章算术》的数学特征

①以实用为目的的应用数学体系

《九章算术》中的内容大多来源于社会生产实践中的具体问题,其中出现了一些数学术语,但没有做出解释,也没有指出其本质属性,因此其内在的逻辑关系并没有精确的层次。 ②以算法为内容,以算筹为工具。

用算筹进行计算是中国人自己创造的独特的计算方式,操作性强,且简单明了。使用算筹可以进行加减乘除运算,利用筹码不同的“位”表示不同的“值”,由此发明了十进制记数法。

《九章算术》如同其它中国古代数学著作一样,具有技术性的性格,其内容较多以经验为基础,中心是计算技术。

值得注意的是,这种以实用为中心的方式是受到中国传统儒家思想的影响,儒家推崇经

典,强调实用,对个人的创造性思维具有很强的束缚性,因此那些对实际生产没有直接作用的逻辑体系,也就很难产生。

《九章算术》以后的中国数学著作大多受到它的这种形式的影响而采用以问题为主体、算法为中心的模式。

可以说,在《九章算术》成书的时期,中国的数学研究是处在世界领先地位的;但是却没有最终走上理性思维、演绎推理的现代数学之路。从毕达哥拉斯前后起直到欧几里德及其后的一些古希腊大数学家,认识到数学“逻辑化思想方法”的核心价值并把它放到最高地位,开辟了数学公理化理论系统这一崭新的研究方式,张扬了今天我们称之为“思维体操”的数学价值。中国则不同:我们几乎始终如一地重视和强调数学“量化思想方法”这一核心价值,还扼杀了曾经在春秋战国时期生出的数学逻辑化研究萌芽,一方面使运用数值计算解决各类实际问题的数学水平登上古代世界最高峰,一方面则错过了数学“逻辑化思想方法”这另一核心价值的实现。这也是古代中国数学的局限性所在。

参考文献:

[1]代钦,《儒家思想与中国传统数学》,商务印书馆,2003。

[2]杜石然,《中国科学技术史稿》,科学出版社,1982。

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

中国古代数学的成就与落后的原因

陈静

(数学学院 数学基地班 0510045)

摘要:数学是一门古老的学科,它伴随着人类文明的产生而产生,至少有四、五千年的历史。我国历史上曾经是个数学发达的国家,出现过一批卓越的数学家,取得过辉煌的研究成果,对世界科学的发展都产生了一定的影响。

历史上不少史实表明,中国古代数学曾经远远领先于欧洲国家,甚至在宋代达到了黄金时代,成就了中国古代数学的顶峰。但是为何之后却走向大幅度下滑的局面呢?我国数学曲折发展的历史,应该认真总结,肯定成绩吸取教训,这对我们今后的数学研究工作有很大的借鉴价值。

1 中国古代数学的历史与成就

数学与其他科学分支一样,是在一定条件下发生与发展的。追溯数学的历史,是一件十分有意义的工作。目前数学史研究工作者将历史划分阶段时,多是以朝代的更替、社会性质

的演化和中国数学本身发展的阶段性为标准的。钱宝琮的看法是:“最好的分期方法就是既不脱离一般的社会条件,而又能从数学本身去出发,反映这种在发展过程中的阶段性。”

下面我们介绍大多数书籍所采用的分期方法。

第一阶段:原始社会到西汉末年(公元一世纪初期以前)

追溯最初的数学的起源是有一定难度的,旧石器时代并没有给我们留下可靠的数学资料。但是新石器时代的数学资料是比较丰富的。

例如,在河北磁县下潘汪村出土的四五千年前的陶器上就有这种例子。陶器上面有近似等分圆周形的条纹,很规则,有的正好为八十等份。这便可看出数的概念起源相当早,随之也会产生一系列计数方法。

从数学起源追溯起来,到西汉末年 ,在这大约几万年的漫长时期中,数学在中国从萌芽经过长期积累,到西汉末年完成数学专著,标志着中国传统数学体系的形成。

这一阶段中,出现了《九章算术》、《算数术》和《周髀》这样的一些著作,包括了算数、代数、几何各个方面,这些标志着初等数学体系的形成。

第二阶段,东汉初期到元代中期(公元一世纪初到十四世纪初)

从《九章算术》问世以来,它始终是传播数学知识的主要课本,一直持续到十四世纪初。我国的数学在此时期有了极大的发展,形成了高峰。期间出现了一批优秀的数学家,例如具有批判精神的刘徽。他从《九章算术》中吸收了许多有用的思想的同时,将《九章算术》中不能使人满意的问题一一提出解决办法。

这一时期中国数学基本上是独立发展的,受外国影响很小,发展呈起伏状态,硕果累累,可以说是中国传教数学的黄金时代。

第三阶段:元代后期到清代中期(公元十四世纪初期到十九世纪中期)

在这近五个半世纪,虽然我国已经有了资本主义萌芽,商业数学得到普及(特别是珠算的使用),西方初等数学的传入,康熙等人对数学的重视,以及一批优秀数学家的工作取得了一些成就。但是和当时欧洲的数学相比,我们已经是远远落后了。

在这一阶段,中国数学的发展虽然很曲折,但总的趋势是中国传统数学向西方数学转变的过程。

第四阶段:清代后期到现在(公元十九世纪中期到现在)

从清代后期开始,董祐诚、项名达、戴煦等数学家在幂级数上的研究取得了较大成就,并且出现了李善兰这样我国十九世纪杰出的数学家。他取得的成绩是多方面的,而且持续时间较长。直至十九世纪五十年代,西方的古典高等数学在清朝封建统治已经腐朽不堪,西方资本主义侵略势力相继东来的历史条件下,陆续传入中国并进行研究。这标志着我国数学发展进入了近代时期。

在《中国数学史简编》一书中,最后一个阶段划分到抗日战争时期为止,但在《中国数学史大系》中指出,中国数学现在仍处于第四阶段,希望中国数学在不久的将来进入高峰期,然后转入第五阶段,形成新的突破。

③②①

2 中国数学的特点

这里,我们主要探讨中国传统数学的特点。中国传统数学,一般指在西方数学合流之前在我国自行产生、独立发展起来的数学方法和理论。

探究“东方数学”的特点,将帮助我们分析中国数学渐渐落后的原因,以明确将来发展的方向。

中国传统数学具有三大特点,分别是:独创性、社会性、东方色彩。

所谓独创性,由于中国地处远东,在帕米尔高原和喜马拉雅山的屏蔽下,它长期处于相对独立的地位。直到公元前1000年中叶,中国不知帕米尔以西的国家,其他文明古国也不知道东方还有一个文明高度发展的中国。

以往,一些西方学者认为中国数学是受西方数学的影响而发展起来的。例如,斯科特(J.F.Scott)认为汉代以前希腊文化便已传入中国并影响了中国算术的发展。

英国著名学者李约瑟(Joseph Needam)基于多年对中

国科技史的研究,排除了过去西方数学史家的偏见。在中国

古代数学的独创性上,他写道:“中国和它的西方邻国以及

南方邻国之间的交往和反应,要比一向所认为的多得多。尽

管如此,中国思想和文化模式的基本格调,却保持着明显的、

从未间断的自发性。中国是和外界有接触的,但是,这种接

触从来没有多到足以影响它所特有文化以及科学的格调。”⑤④

足以见中国传统数学是自发独立的,土生土长的具有持久性

和连续性的科学。

所谓社会性,首先是它所具有的实用性。从《九章算术》

开始,我国的数学著作长期基本按“九章”的格式发展,大都是解决具体问题,以应用实际为主,缺少明确的概念和严格的逻辑推理。

同时,中国传统数学的教育与研究始终置于政府的控制之下,使之服务于统治阶级的需要。

所谓“东方色彩”,是指比较东方与西方两种迥然不同风格的体系后体现出一些显著特点。如:中国古代数学称为“算术”,其原始意义是运用算筹的技术,同时,中国古代数学以算为主。而西方数学则采用严谨的公理化结构。从《九章算术》与《几何原本》的对比中就可以深刻体会到两种风格的迥异。一种是发展计算方法,一种是长于逻辑推理。即中国传统数学重法轻理,寓理于算。它的存在是为了建立那些在实际中有直接应用的数学方法而构造的最为简单、精巧的理论建筑物。

3 中国数学的局限性与渐渐落后的原因

在中国传统数学特征的论述中,我们已经看到它不少的局限性。

数学发展是要与一定的社会条件相适应,同时伴随着社会实践的决定作用、社会制度的制约作用而发展的。

数学内部的矛盾运动促进数学不断发展,数学问题是数学发展的基本动力。

所以,想探究中国数学的发展与落后,应该结合中国的政治条件与社会条件分析。萌芽时期的数学与原始社会和奴隶社会早期低下的生产力相适应;变量数学与工业革命的社会生产力相适应;随机数学与信息时代相适应。

而中国近代数学的落后,是一个复杂的问题,通常从内因和外因两个方面讨论。内因,即中国传统数学体系的弱点。外因,即历史与社会因素。内因是起决定性作用的。这也是为什么我们要在前面阐述中国传统数学的特点。

关于内因,主要有三:一是中国传统数学“缺少严格求证的思想”,二是“从未自发地发明任何公式的符号方法”,三是偏重计算和依赖算具,限制了数学方法的流传和改进。

数学强调的是一种抽象性和精确性,或者更好地说是逻辑的严格性以及它的结论的确定性,最后是它的应用的极端广泛。而中国传统数学弱点之一——缺少严格求证的思想,恰恰是与数学的“抽象性”、“精确性”相悖的。偏重计算、依赖算具并不是中国传统数学的弱点。但是,正由于中国筹算的优越性,在客观上抑制了笔算的发展,不便于数学的符号化和理论的深入,这可能是过分依赖的副作用。

《数学简史》作者斯特洛伊克有一段有趣的话:“对于我们这些被欧几里德的严格推理所教育的人,这整个的东方思考方法在最初似乎是惊异而又高度地令人不满。但是当我们认识到我们讲授给我们今天的工程师们和技术人员们的数学大部分仍是‘如此做,做这个’的方式,而很少有严格的证明企图时,这种惊异就会消灭了。在许多中学中,代数学仍被教成一堆公式而不是一种演绎的科学。”

这一段话恰恰详细而形象地描绘出东西方科学体系的差异。理论应该指导实践,同时实践检验理论的正确性。显然中国传统数学颠覆了这一观点,越

过了理论的认识,或者经过较少的理论认识而直接进入实践阶

段。

我们是不能简单地否定中国传统数学的。从《周髀算经》、

《九章算术》和《几何原本》这些堪称标志性的奠基型的书籍

的比较中可以看到,我国古代数学具有浓厚的应用数学的色彩,

这与古代希腊数学追求纯粹“理念”形成强烈的对照。

欧洲的近代数学绝不是古希腊数学的延续。它是东、西方

数学的融合,与欧洲数学家的再创造的结果。因此,认识比较

东、西方数学之体系才知道为何中国近代数学会落后。

从另一个方面,即外因结合内因来分析这个问题也十分有意义,由于它的实用性在封建社会中表现为直接满足封建王朝各方面的需要,一旦现实不提出直接的要求,它就没有了发展的动力。而实用性科学眼光不够远大,封建社会结构本身就为其设定了一个发展的极限。过了这个极限,实用型思想将阻碍发展,除非社会结构发生重大变化。

在清朝,中国传统科学想要突飞猛进,只有从根本上改变其实用性特征,或者改造社会

结构。但这两条路都是行不通的。科学体系、科学传统是整个民族文化的一部分,想要彻底改变是不可能的。作为中国古代辉煌数学成果的继承者——清朝学者们,根本不可能设想对自己传统的彻底改革和突破,相反每每表现出天朝大国的优越感。

至于改造社会结构更是不可能的。满清统治者为了维护自己的封建专制统治,从政治、经济、思想、文化上实行极端严厉的控制,限制资本主义的发展、扼杀思想的自由。直到19世纪中叶帝国主义用坚船利炮轰开国门,改造社会结构的外部力量出现,以及无数仁人志士普遍意识到中国社会必须改革的时候,打破封建制度的时机才真正出现,才真正有可能为科学技术的发展开辟道路,但这时中国的科学已经大大落后于世界了。

中国传统数学本身所具有的局限性以及其依附于封建社会结构的实用性本质决定了并直接导致了中国近代数学的落后。当然,这不一定是全部原因所在。

在客观分析之后,面对中国传统数学这一民族文化遗产时应持“取其精华,去其糟粕”的态度,结合东西方数学体系的特点,发展当代中国数学。在这一方面,吴文俊院士已经为我们做了非常好的证明和例子。他研读中国数学史,提炼出中国传统数学的思想,并且运用自己掌握的数学理论知识开创了数学机械化领域。数学机械化继承了中国古代数学的思想,另一方面适应了现代科学技术的发展,为中国乃至世界科学发展做出了积极的贡献。

由此可见,以历史唯物主义的观点全面认识中国传统数学的特点,学习和研究中国数学史是对于认识数学发展规律和探索数学现代化的途径是很有价值的,历史的经验告诉我们:实际应用与理论研究两者都要重视,传统数学眼究与开辟新方向应该相结合,同时注意吸收外国先进数学成果,但要根于国内。

在辉煌的五千年文化面前,我们以实事求是态度分析历史,接受现状,并努力推进中国数学发展。中国不仅仅是数学大国,必将成为数学强国,重现顶峰时期的辉煌,为人类进步做出巨大贡献。

参考文献:

[1] 钱宝琮主编《中国数学史》北京 科学出版社 1964年。

[2] 李迪主编《中国数学史简编》辽宁人民出版社1984年。

[3] 吴文俊主编《中国数学史大系》北京师范大学出版社1998年。

[4] [英]斯科特著《数学史》。

[5] 李约瑟《中国科学技术史》卷一北京科学出版社1975年。

[6] 三上义父《中国算学之特色》。

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

中西方数学发展史比较与反思

杨子群

(数学院,数学类,0510168)

摘要:本文研究了中西方数学发展的不同及对近代中国数学落后的反思。 关键词:算法;演绎;西方数学;中国古代数学

数学,这颗自然科学王冠上的明珠,已有泱泱五千余年的历史。五千年来,她作为人类认识世界、认识真理的工具在世界各地、各个学科发挥着神奇的力量,同时,世界各地的数学研究有促进着她的发展和完善。其中就她的起源和发展来说,她大致可分为以中国为代表的东方数学和以欧洲大陆为代表的的西方数学.

东西方数学有着不同的思想体系和研究形式,因此也有着不同的模式,下面我们简单回顾一下她们各自的发展史。

1 中国数学发展简史

数学是我国古代科学中一门重要的学科,根据其发展特点,大致可分为五个时期:萌芽,体系的形成、发展、繁荣和中西方数学的融合

1.1中国古代数学的萌芽

诞生于黄河流域的中华民族很早便开始农业生产,农业的发展离不开天文、气象、水利工程等,而这些又都离不开数学的计算,因此,我们的祖先很早的年代就对数学做出了杰出的贡献。

半坡遗址的房屋基址都是圆形、方形,为了画圆为方,确定平直,人们还创造了规、矩、准绳等作图和测量工具。

在殷墟发现的甲骨文,证明在商代中期已产生一套十进制数字和计数法。

《周髀算经》提出西周初起用矩测量高、深、广、远的方法,并举勾三、股四、弦五以及环矩可以为圆的例子。

春秋战国之际,筹算已经得到普遍应用,筹算计数法已采用十进位值制,这种计数法对世界数学发展是有划时代意义的。

战国的百家争鸣时期是中国文化空前繁荣时期,但其研究多集中于哲学、文学和伦理方面,涉及自然科学的很少。但其中的名家和墨家对数学也有一些研究,名家认为经过抽象以后的名词概念与它原来的实体不同,他们提出“矩不方,规不可以为圆”,把“大一”(无穷大)定义为“至大无外”,“小一”(无穷小)定义为“至小无内”。还提出“一尺之棰,日取其半,万世不竭”命题。而墨家不同意此命题,提出一个“非半”的命题来反驳:将一线段按一段一段的无限地分下去,就必然出现一个在不能分割的“非半”。这个“非半”就是点。

其实名家的命题论述了有限长度可分割成一个无穷序列,墨家的命题则指出了这种无限

分割的变化和结果。名家和墨家的数学定义和数学命题的讨论,对中国古代数学理论的发展有很大意义。

1.2中国古代数学体系的形成

秦汉是封建社会的上升时期,经济和文化得到迅速的发展,中国古代数学体系正是形成于这个时期,她的主要标志是算术已成为一个专门的学科以及以《九章算术》为代表的数学著作的出现。

《九章算术》是战国、秦、汉封建社会创立并巩固时期数学的发展总结,就数学成就来说看成世界数学名著,例如分数四则运算、今有数(西方称三率法)、开平发和开立方、盈不足法、各种面积和体积公式、线性方程组解法、正负数运算的加减法则、勾股形解法等,水平都是很高的,其中方程组解法和正负数加减法则在世界数学史上是遥遥领先的,就其特点来说形成了一个一筹算为中心、与古希腊完全不同的独立体系。

《九章算术》有几个特点:采用按类分章的数学问题集形式,算是都是从筹算计数发展起来的,以算术、代数为主,很少涉及图形性质,,缺乏理论阐述。

《九章算术》在隋唐时期曾经传到朝鲜、日本,并成为这些国家当时的数学教科书,她的一些成就如十进位值制、今有术、盈不足术等还传到印度和阿拉伯,并通过他们传到了欧洲,促进了世界数学的发展。

1.3中国古代数学的发展

中国数学一直以实用计算为主、理论方面比较欠缺,直到魏晋时出现玄学,它诘辩求胜,又能运用逻辑思维分析义理,数学才从理论上有所提高。

赵爽是中国古代对数学定理和公式进行证明和推导的最早数学家之一,他在《周髀算经》中补充的“勾股圆方图及注”和“日高图注”是十分重要的数学文献。

三国时的刘徽注《九章算术》,创造了割圆术,利用极限的思想,证明了圆的面积公式并首次用理论方法算得圆周率为157/50和3927/1250之间。

刘徽用无穷分割的方法证明了直角方锤和直角四面体的比例恒为2:1,解决了求一般求立体体积的关键问题。在证明方锤、圆柱、圆锥、圆台的体积时,刘徽为彻底解决球的体积提出了正确地途径。

东晋以后,祖冲之父子在刘徽注《九章算术》的基础上,把传统数学向前大大推进了一步,他们的成就主要有:计算出圆周率在3.1415926和3.1415927之间;提出祖暅原理,比意大利数学家卡发雷立早1000年(现西方一般称为“卡发雷立公理”,这显然是错误的);提出二次与三次方程的解法等。

唐中期以后,经济繁荣,数字计算增多,迫切要求改革计算方法,从《新唐书》留下来的算数数目,可以看出这次改革主要是简化乘除法。

1.4中国古代数学的繁荣

从11-14世纪约300年期间,出现了一批著名的数学家和数学著作,如贾宪的《黄帝九章算法细草》、刘益的《议古根源》、秦九韶的《数学九章》、李冶的《测圆海镜》和《益

古演段》、杨辉的《详解九章算法》、《日用算法》和《杨辉算法》,朱世杰的《算学启蒙》《四元玉鉴》等。很多领域都达到古代数学的高峰,其中一些也是当时世界数学的高峰。

从开平方、开立方到四次以上的开方,在认识上是一个飞跃,完成这个飞跃的是贾宪,他已发现二项系数表,创造了增乘开方。其中贾宪三角比西方的帕斯卡三角早提出600多年。

把增城推广到数字高次方程解法的是刘益。

秦九韶是高次方程解法的集大成者。在求根的第二位数时,秦九韶还提出一一次项系数除常项为根的第二位数的试除法,这比西方最早的霍纳法早500多年。

用天元(相当于x)作为未知数符号,立出高次方程,古代称为天元术,这是中数学世上首次引入符号,并用符号运算来解决建立高次方程的问题。

朱世杰的四元高次联立方程组表示法是在天元术的基础上发展起来的,他的最大贡献是提出四元销元法,比西方同类方法早400多年。

1.5中西方数学的融合

中国从明代以后开是进入封建社会的晚期,封建统治者实行集权统治,宣扬唯心主义哲学,实行八股考试制度。在这种状况下,出珠算外,数学发展逐渐衰落。

中国数学在此期间建树极少,数学家们多是从事翻译西方数学著作的工作。在翻译的同时,中国学者作了大量的会通工作,写出一些著作,与传统数学相比是有进步的,但和同时代的西方数学比较则明显的落后了。

由于输入的近代数学需要一个消化吸收的过程,再加上中国近代的混乱,无暇顾及数学研究,直到1919年五四运动以后,中国近代数学的研究才真正开始。

2 西方数学发展史

2.1古代希腊数学

第一位数学家泰勒斯证明第一批几何定理——半圆周周角是直角、等腰直角三角形两底角相等,因此他也有论证几何鼻祖的美名。

毕达哥拉斯学派发现了偶数、奇数、素数、完全数、正方形数、毕达哥拉斯数组等;相传他也发现了“毕达哥拉斯定理”(即勾股定理),另一重要几何成就是正多面体作图,欧几里得的《几何原本》前二卷大部分材料也来源此学派。但他们相信“万物皆数”(整数),但后来有发现无理数,引发了“第一次数学危机”。

希腊数学的黄金时代出现了伟大数学家欧几里德,著有《几何原理》13卷,创建了“欧氏空间”,对我们认识客观世界、后世研究数学提供了工具和平台。

在他之后出现了亚历山大学派,其代表人物是阿基米德,他求得了310/71<∏<31/7,并得出球表面面积等于圆面积的四倍。

在公元前一世纪,罗马征服希腊,唯理被务实取代,希腊数学从此衰落。

2.1变量数学的建立

5—11世纪,天主教会成为欧洲社会的绝对势力,欧洲数学处于黑暗时期,直到12世纪受翻译翻译、传播阿拉伯、希腊著作的刺激,欧洲数学才有了复苏的迹象,但过程十分曲

折,到17世纪,欧洲数学随文艺复兴而兴盛起来,代数学是成果最突出、影响最深远的领

域,拉开了近代数学(变量数学)序幕,主要包括三、四次方程求解与符号代数的引进这两

方面,其中以法国数学家韦达的贡献最大。

变量数学也在这个时候建立起来,第一个里程碑是解析几何的发明,这主要归功于法国

数学家笛卡尔和费马。

解析几何作为代数与几何相结合的的产物,将变量引进了数学使运动与变化的定量表述

成为可能,从而为微积分的创立搭起了舞台。

微积分的发明经历了半世纪的酝酿,为期最终产生作出贡献的先驱者有:

开普勒发现行星运转三大定律;

华利斯最早发现4/∏=(1.3.3.5.5…)/(2.4.4.6.6…),并说明零指数、负指数、及

分数指数。

牛顿发现流数、万有引力、光学、连续切线问题与求积问题;

莱布尼茨引进了和、积、幂、根式的微分法则,发现微积分为互逆运算。

微积分的出现导致了“无穷小悖论”的数学危机。

为使分析基础严密化的工作,法国著名数学家柯西迈出了第一大步,他开始用不等式来

刻画极限,使无穷的运算化为一系列不等式的推导。这就是所谓极限概念的“算术化”。后

来,德国数学家魏尔斯特拉斯给出更为完善的我们目前所使用的“ε-δ ”方法。另外,在

柯西的努力下,连续、导数、微分、积分、无穷级数的和等概念也建立在了较坚实的基础上。

2.3分析的时代

18世纪,危机微积分进一步发展,刺激了许多数学新分支的产生,从而形成了“分析”

这一个在概念和方法上的具有鲜明特点的数学领域。

在数学史上,18世纪是向现代数学过度的主要时期,微积分深入发展的几个主要方面

有:

1,积分技术与椭圆积分;

2,微分几何向多元函数的推广;

3,无穷级数理论;

4,函数概念的深化;

5,微积分严格化的尝试。

这期间产生了许多著名的数学大师,如高斯、欧拉等,他们都有极为丰富的研究成果和

贡献,这里就不详述了。

18世纪是分析的时代,分析的光芒氏综合几何发展黯然失色,但分析方法应用却开拓

出了一个崭新的几何分支——微分几何,由欧拉奠基并由蒙日推到了高峰。而代数却被看为

“分析”的同义词,其本身的研究有时也服从于分析的需要。此间,代数学的主题仍是代数

方程,数论也有所发展,贡献最大的当属费马,提出了著名的费马大、小定理。

到了19世纪,代数学迎来了新生。两位年轻的数学家阿贝尔和伽罗瓦彻底解决了方程

根式解这一经历了三百年的难题,并创造了“群“的理论。同时数论在高斯的推动下成为现

代数学的一个重要分支,得到了系统的发展。

19世纪,几何学也发生了变革,产生了非欧几何

3 比较

3.1不同的研究思维——算法与演绎

从中西方的数学发展史可以看出,中国数学一直以“算法”为主,追求实用,寓理于算。

在西方,算法虽然曾经有过一段繁荣时期,但就其整个数学体系来说,演绎思维一直是条主

线,这可能是受希腊哲学的影响,很早便开始由原始算法向系统演绎过渡,早期的希腊数学

家都是哲学家,他们不满足于经验几何法则而要坚持给出演绎的证明。亚里士多德的三段论

法则出现杂欧氏几何之先,无疑是后者证明方法的逻辑基础。而中华民族是一个务实的民族,

哲学一直不很发达,数学的产生、发展都是应实用所需,因此中国的算法发展很快,有的十

分复杂(如“大衍求一术”、“正负开方术”),是高度概括思维的产物,这种思维与演绎思

维完全不同,但却在世界数学发展中起着完全可与之媲美的作用!

但在20世纪上半世纪甚至更长的时间里,演绎精神不仅是衡量数学纯与否的标准,也

成为衡量数学美与否的标准,人们谈论数学言必称希腊,这是很不公平的!

3.2现代中西方数学的不同发展状况和应用前景

西方数学早在17世纪就走出低谷,开始迅猛发展,而中国数学却从明朝开始走入低谷,

至今还未腾飞。因此,西方数学、演绎精神成为世界数学的主流。

到了20世纪40年代,电子计算机出现,并表现出强大的生命力,,动摇了演绎的地位,

而提高了算法传统的地位,中国数学也逐渐受到重视而逐步发展起来,又对“大衍求一术”、

“正负开方术”的分析表明,这些算法的计算程序具有很高的机械成都并包含了现代计算机

语言中非评议算法的基本要素(如循环语句、条件语句)与基本结构(如子程序)。几乎可

以预见,在计算机盛行的21世纪,算法将发挥巨大的作用并有光明的前途!如果中国数学

能抓住机会,也必将有长足的发展!

4 反思

泱泱中国,有五千年文明,有辉煌的古代数学,也有如华罗庚、陈省身这样的数学大师,

不可以不谓“地杰人灵”。

可是,为什么中国数学经历了1919年至今的努力、发展仍未有大的腾飞?国内顶级数

学家为什么人是如此寥寥?为什么人们至今谈论数学仍是“言必称希腊”,而同为当今数学

鼻祖的中国数学,知者甚少,甚至国人也所知不多?

我认为,原因有以下几点:

1,中华民族作为一个务实的民族,一直重算法而轻演绎,使得中国数学没有系统化的

体系和严谨的理论基础。虽然算法更能指导实践,但它毕竟来源于生产实践,有一定的滞后

性,而演绎则不同,它能使数学摆脱对自然的依赖而超前发展,对生产实践、各学科的研究

有指导作用,如广义相对论、杨振宁—米尔斯非阿贝尔规范场的研究成果。

因此我们应该算法与演绎“两手都要抓,两手都要硬”。既要抓住21世纪计算机空前发

展的机会发展我国的算法数学,又要重视演绎思维的培养。

2,政府重视不够。数学是纯理论的研究,不比工科,研究成果可以马上见效益,但它

对生产实践却有着巨大的推动作用,政府应给予足够的支持、经费,这样才能留住人才,数

学研究才能顺利进行,取得更多、更大的成果

3,科研评优体制不健全和社会风气浮躁。如今研究人员评职称、奖金等都要求每年完

成定量的论文,要求出成果,这是许多人不能静下心来脚踏实地的搞研究,为了评优做一些

小研究、小成果,而真正有意义、有影响的大课题、大项目是耗时耗力的,鲜有人作。

我国应该改革科研评优体制,对那些“十年磨一剑”、甘坐“冷板凳”的研究人员应给

予鼓励和支持。

4,我国数学史的研究、普及不够。“不了解数学史就不可能全面了解数学科学”(李文

林《数学史概论》)对我国古代数学史的研究是很重要的 ,一,可以告诉世界中国数学对世

界数学的贡献,夺回本应属于中国、属于中国古代数学家的荣誉和尊重;二,有利于研究人

员更好的了解中国数学的思维,从而更好的发展中国数学;三,可以增强民族自信心,许多

国人只知道中国古代数学比西方早发现勾股定理、早得出∏的较为精确值,而对中国算法数

学为世界数学的伟大贡献却所知不多,面对如此强势的西方演绎数学显得有些心虚与气馁,

甚至认为中国人作不出一流的数学,这都是错误的!

我们应该对我国的算法数学多一些研究,普及中国数学史的知识,让人们有信心、有兴

趣做数学研究。

我坚信,在全民重视、学习数学的风气下,中国数学必将有大的发展,必将腾飞!终能

实现陈省身先生的遗愿:中国从数学大国变为数学强国!

参考文献:

[1]李文林《数学史概论》,高等教育出版社,2002。

[2]李文林《数学的进化——东西方数学史比较研究》,科学出版社。

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

数学文化与中国发展史

杜芬

(经济学院金融学专业0411921)

摘要:本文以中国各年代为时间线索,总结中国五千多年发展进程中数学文化带来的影响与成果,揭示数学文化在中国文明中的重要作用。将数学文化与中国历史相联系能够更充分的展示出一个拥有绚丽灿烂文明的古国是如何将数学融入生活,融入民族文化的。

关键词: 数学文化,中国历史

1数学文化产生人类的文明。

有一种说法:数学是理性文明的火车头。人类文明大致经历了四个高峰:古希腊时代产生了《几何原本》,它使人类受到了数学理性思维的洗礼,影响深远至今。文艺复兴到17、18世纪产生了微积分,将物理的世界和人类的科学研究带入了一个新境界。现代文明的开始是从19世纪出现了高斯、黎曼等优秀的数学工作者,他们的几何研究就是后来爱因斯坦相对论的数学基础。再接着就是20世纪下半叶信息时代出现的计算机科学。冯·诺依曼创造了计算机方案,他也是一位数学家。这是从整个世界的发展揭示了数学和社会的发展同步,数学和人类的文化共生。

那么,中国的文明是否以数学为源头?又是如何贯穿数学思想的呢?

中国古代数学成熟较早,有记载着这样一个传说:3000年前,夏禹为民治水,废寝忘食,三过家门而不入。有一日,突然从滚滚的波涛中跃出一个龙头马身子的动物,他背上驼着一只巨大的乌龟,分别都咬着一幅图:一幅为“河图”,另一幅为“洛书”。它们把这一书一图献给了大禹。这是河神的旨意,大禹详读了“河图洛书”后懂得了测量,而后带领百姓开渠引水,最终战胜水患,这是最早的有关数学的记载,可见我国数学概念早已萌芽。

让我们把思路理清跟着历史的脚步走一朝,看看我国数学的发展吧。

2 数学文化在中国的源头。

时间:西汉末期之前

在7000年前,我们的祖先只会用“很多”来形容四个以上的物品,对于他们而言世界是复杂的,是令他们困惑不解纷繁冗杂的。后来人们开始摸索有了结绳计数以及“书契”,这种原始的记数方式。渐渐发展到五六千前会写1—30的数字。到了春秋时代开始有了加法和乘法的意识,在金文周《鼎》有这样一段话:“东宫迺曰:偿禾十秭,遗十秭为廾秭,来岁弗偿,则付秭。”这段话包含着一个利滚利的问题。说的是,如果借了10捆粟子,晚点还,就从借时的10捆变成20捆。如果隔年才还,就得从借时的10捆涨到40捆。这不正是我们现在所说的复利概念吗?到公元前551到公元前479年孔子修改过的古典书籍之一《周易》

中,就出现了八卦。这神奇的八卦至今在中国和外国仍然是人们努力研究的对象,它在数学、天文、物理等多方面都发挥着不可低估和作用。

到了战国时期这一阶段他们在算术、几何,甚至在现代应用数学的领域,都开始了耕耘播种。算术领域,四则运算在这一时期内得到了确立,乘法口诀已经在《管子》、《荀子》、《周逸书》等著作中零散出现,分数计算也开始被应用于种植土地、分配粮食等方面;几何领域,出现了勾股定理;代数领域,出现了负数概念的萌芽。

当历史推进到秦汉时期,祖先们不再往骨头上刻字了。他们把需要记的事都用毛笔写在竹片上、木片上,这种写了字的竹、木片被称为“简”或“牍”。这种简或牍以西汉时期的流传下来最多。

从那些汉简中,我们发现,秦汉时期在算术方面乘除法算例明显增多,还出现了多步乘除法和趋于完整的九九乘法口诀。在几何方面,具备了对于长方形面积以及体积计算的知识。可见数学的发现来自于生活,正是人们对于实际应用的需要才不断的发展着数学,让数学成为一种科学,让数学形成一种文化。可以说中国的文化是与数学文化同期发展,他们的源头都是生活,都是源于人类最早期的文明。

3 数学文化的发展繁荣时期

时间:西汉末期——隋朝中叶

这是中国数学理论发展的第一个高峰期。这个高峰的标志就是数学专著《九章算术》的诞生。1800年前的《九章算术》是管理国家的官方文书,它是我国秦汉时期一二百年的数学知识结晶。到公元1世纪开始流传,它标志着我国古代完整的数学体系已经形成。这一时期还出现了刘徽著的《海岛算经》、夏侯阳的《夏侯阳算经》、张丘建的《张丘建算经》、祖冲之的《缀术》、王孝通的《缉古算经》及《孙子算经》等数学专著。这些书都与社会生产有着密切的关系。同时也反映了我国注重实际的民族文化,应用成为当时的主流,数学的快步发展也是基于此种思想。

在中国历史不断演进的过程中,数学文化的高峰时期也正是中国古代文明最鼎盛时期,当人们开始意识到数学对于人类进步的重要性时,社会就进入了另一个理性的文明时代。这一时期出现的著作具有很强的时代代表性,也从一方面反映我国古人在对待科学的态度上变得客观和实际起来。这时候的中国强调的是积极的发展和不断的探索,数学成为人们思维发展的检索。

4 数学全盛时期

时间:隋中叶——元后期

在这一时期,数学教育的正规化和数学人才辈出,是其最主要的特点。七世纪初隋代开始在国子监中设立“算学”,并“置博士、助教、学生等员”,唐代进一步在科举考试中设了数学科目,叫“明算科”。同时还由数学家李淳风对以前的十部数学著作进行注疏整理,编写了教科书,内容完备史称《算经十书》。正是在如此重视发展教育的环境下才产生了秦九韶、沈括、李冶、朱世杰、王孝通、杨辉等数学大师。

结合中国古代历史看这一时期的数学文化在中国的地位,这真正的揭示了一个人类进步的标志和规律。全盛时期的经济文化必然伴随着全盛时期的数学发展。加强数学教育的思想更是人类历史上的一次飞跃。因为人们承认了数学的地位,并将传承这一文化。这一时期人才辈出,在中国历史上是最值得骄傲的年代。

5 数学文化黯淡期

时间:元后期——清中期

与先前相比,这一阶段的发展明显缓慢很多。这与当时的政治气候相关。从宋朝末年到元朝建立中央集权制,科学技术不受重视,造成大量宝贵数学遗产损失,再加上封建统治的腐败,在这一时期数学发展跌入了低谷。

从16世纪至18世纪西方数学开始渗透进中国,意大利传教士利玛窦与我国古代数学家徐光启还有李之藻分别合译了《几何原本》,《同文算指》。

这一时期产生了中国数学的代表计算工具――算盘和大量有关珠算的书籍。这为后来西方人发明计算器奠定了基础。

数学的发展和其他人文科学一样需要一个安静的环境,没有稳定的政治格局作为后盾,没有一个积极的思想鼓励,纵使数学要发展也会困难重重,举步艰难。我们是不是应该反思一下社会的动荡带来的不只是经济的落后,民族的衰退,更重要的是文化思想的萎缩不前。无论怎样的发展一个太平盛世应该是所有大条件中的最大前提。

6 中西数学合流期

时间:公元1840——1911

19世纪60年代开始,曾国藩、李鸿章等为了维护腐败的清政府,发起了“洋务运动”。这时以李善兰、徐寿、华蘅芳为代表的一批知识分子,作为数学家、科学家和工程师参加了引进西学、兴办工厂、学校等活动,经过他们的不懈努力,奠定了近代科技、近代数学在中国的发展基础。

到了19世纪末20世纪初,中国数学界发生了很大的变化,派出大批留学生,创办新式学校,组织学术团体,有了专门的期刊,中国从此进入了现代数学研究阶段。1935年7月成立“中国数学会”,创办了《中国数学会学报》和《数学杂志》。

7 建国以后的数学文化

时间:1949至今

1949年,新中国成立之初,国家虽然正处于资金匮乏、百废待兴的困境,然而政府却对科学事业给予了极大关注。1949年11月成立了中国科学院,1952年7月数学研究所正式成立,接着,中国数学会及其创办的学报恢复并增创了其他数学专刊,一些科学家的专著也竞相出版,这一切都为数学研究铺平了道路。

1950年后的中国数学研究规模成倍扩大,纯粹数学和应用数学的门类逐渐齐全。华罗庚领导的数论研究,云集了王元、陈景润、潘承洞等青年各家,日后大有作为。

在1966年独立创立“有限元方法”的冯康赢得了国际的赞誉。与此同时,国家不断出

台推动科学研究的政策。应用数学大师林家翘,帮助创立“工业与应用数学学会”,创立清华“应用数学研究所”。1980年,陈景润的“哥德巴赫猜想研究”如报春信息,使其成为一代知识青年的科学偶像。

我们意识到“世界强国必然是数学强国”的道理。于是我们发展数学,加强与外界的交流。在21世纪要建设我们自己的数学文化。用数学大师陈省身的话就是要建设一个大的数学王国。中国的发展目标是长远的,也是正在努力做的。

中国近几年来的发展是举世瞩目的,同样数学文化也在传承着。我们这个年代一方面没有战乱的威胁,另一方面国家的强有力支持。大量的人才引进为我国的数学发展注入新的血液。按照历史的规律,数学文化必然影响整个中国文化,这个时期我国定将成为世界的强国。 8 未来展望

回顾历史的发展,数学文化在中国的历史长河中犹如万吨巨轮能使河水上流。数学的魅力足以感染整个中华民族的文化。在逝去的几千年里面,我们能看到祖先们留下的痕迹,而每一个重重的脚印下面必然印着数学的影子。

中国的历史发展正是从数学开始起源,并伴随着数学长大。无论哪个朝代都会拥有一批优秀的数学人才传播着数学文化,使那个年代有了理性的光芒。

人类总是在不断探索,找寻着下一次新生的事物,了解下一个神奇的世界。而数学定将成为必要的工具指引着人们开启那扇造物者紧闭的知识之窗,让人们尽情享受知识阳光下沐浴的快感。

不同的国家有不同的数学文化,不同的时代也有不同的数学时尚。中国数学的传统用数学的影子揭示着数学文化的底蕴和文化品位。

数学让我们看到了希望,数学文化让我们对未来有了明朗化的思考。我们正用我们的青春和热情迎接着数学带给我们的下一个全盛时期,当今正有无数的人参与到数学的研究中去,在生活中享受着它的乐趣,数学来自于生活也必将带给生活新的活力。

参考文献:

[1] 方木,中国数学发展简史,中国数学网.

[2] 刘邦凡,关注中国传统数学,博客网.

[3] 刘毅、宁启文,中国数学加快追赶步伐,人民网.

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

中国古代数学之最

邢星

(物理学院05级物理学类 0510363)

摘要:中国是一个地大物博,人口众多,历史悠久的文明古国,我国古代文学艺术成就巨大,科学技术方向四大发明举世闻名。同时,我国古代数学成就也是相当辉煌的!中国创造了多个世界历史上的数学之最,为数学发展做出巨大贡献:八卦中蕴含的数学原理、奇妙无比的幻方、驰名世界的中国剩余定理……它们都闪耀着永恒的光辉,成为数学历史上的里程碑!

关键字:八卦;幻方;祖率;杨辉三角;珠算盘

1 奇妙的八卦

《周易》[1]是我国古代重要的科学著作,其上记载着有关八卦的知识,八卦实际上是数学上的八阶矩阵。

我国古代的人民为了适应生产上的需要,便于研究天文地理,发明了记数的两种符号:阳爻“--” 和阴爻“—”,合称“两仪”。每次取两个,有四种不同排法叫“四象”。每次取三个共八种不同排法,并分别规定名称叫“八卦”。八卦符号常代表八种不同事物,如:天、地、风、雷、水、火、山、泽八种自然事物等,八个方位对应起来画在罗盘周围。

根据《周易》排列的变化:“易有太级,是生两仪,两仪生四象,四象生八卦。”这段话包含着等比数列:1 、2 、4 、8。如果推下去也能得重要的数学定理。

八卦还有许多奇妙的数学意义。如果把阳爻看作“+”的符号,把阴爻看作“—”符号,并把每一卦的三个爻看作X Y Z,这八个卦就是X+Y+Z,-X+Y+Z,……-X+Y-Z,正好代表立体几何中笛卡儿坐标中八个卦限。事实上,“卦限”的“卦”字就是从八卦中借用来的。而平面解析几何中直角坐标的四个“象限”的“象”字,也是从“四象”中借用来的。

古老的八卦蕴涵的的道理深不可测,记载着中国数学史的同时也正在轻叩现代科学殿堂的大门。

2 夏禹治水图

传说中,夏禹治水时,从黄河的水中跃出一头龙马,驮着一张“河图”,从洛河里浮出一头大龟,背着一副“洛书”,这些献给夏禹,帮助他治理天下。当然这都是神话,但“河图”和“洛书”其实指的是幻方。

南宋数学家杨辉称三阶幻方为“纵横图”,他还想出一个奇妙的换位方法,很快将它编出来,不仅如此,他在《续古摘奇算法》还进一步编出了四阶幻方。

而在国外幻方的最早出现是130年,希腊人第一次提到了幻方,这显然比我国春秋的河图洛书要迟600多年。至于对幻方深入研究:1514年在欧洲,德国著名画家丢勒才在一副

版画上画出了完整的四阶幻方,这不仅比杨辉迟了200多年,还远不如杨辉深入。

当代世界已排出的最大幻方是105阶,它是由一13岁的美国少年逊达完成的,谁会编出一个106阶幻方呢?也许不久的将来这个最早出现幻方的国家将会出现一人站起来,告诉世界……

3 355/113的9/100000000的误差——祖率

圆周率PI,是实际应用和数学研究中非常重要的一个数据,因此德国一位数学家说过:“历史上一个国家所算的圆周率的准确程度可以作为衡量这个国家当时数学发展的一个标志。”

我国南北朝时代有一个伟大的数学家——祖冲之(1429-1500)。他运用的极限的思想方法,当时是世界上最先进的,在当时技术条件下,要具体算出这个数字,工作量是极其艰巨的。它需要从正六边形算起,不断算出内接边数增加一倍时的正多边型的边长和面积,而运算中需把同一程序反复进行12次,而每一程序又包括加减乘除和乘方等11个步骤,每个数据又都需要精确到一亿分之一。如果其中一次运算错一个数字,就不正确了。而他当时阿拉伯数字还未出现,其计算艰难程度可想而知!从而充分表现了他惊人的思维力、毅力和献身精神!

而这个PI到底多精确呢?他相对误差只有9/100000000!即假若一个直径10公里的圆的周长,用此值得出结果比真值结果还大不到3毫米!而国外数学家对PI的研究及发现最早的数学家奥托也早1100多年!

为了纪念祖冲之的首创之功和非凡的成就,日本数学家建议[2],把PI即355/113叫“祖率”,这个叫法在解放后通行全国。

3 杨辉三角

我国古代杰出数学家杨辉[3]在他的《详解九章算法》中保存了一张宝贵图形——“开方做法本源”图。根据其自注,这个图“出《释所算术》,贾宪用此术”。可见贾宪最早研究此三角,但至今我们称之为“杨辉三角”,用阿拉伯数字表示出来是这样的:1

12 1

1 3 31

14641

………………………..

在欧洲也有不少数学家研究此图形,其中以巴斯加最著名,但杨辉三角的发现我国比欧洲早了至少300年!

杨辉三角誉满全球,它蕴藏着丰富的数学性质,具有广泛的应用价值。我国当代数学家华罗庚教授曾对它做过精彩的阐述及发挥[4]。

这一古代优秀的创造发展推广到很多数学应用中去。例如:可以直接联系二项式定理,可以作为开方的工具,……直到现在,它仍然受到世界上数学家的重视。

5 珠算盘

看过《暗算》的人可能会了解:在我国解放初时《我国数学家对于一些难以计算的数学问题仍然用珠算盘,可见算盘这一古老的计算工具在现代还是有巨大的威力的!

我国最早的珠算术书并没有流传下来,但据载,从1078-1162年有《算盘集》《走盘集》《通微集》等著作,可惜一本都没流传下来。而15世纪中期的《鲁班木经》已有制造规格的介绍,还有一个13档的算盘图:上两珠,下五珠,中间用木制横梁隔开。这与现在通行的算盘已完全相同,这样的设计对加减乘除已经没有什么困难了。

我国是珠算盘的故乡,关于珠算最早创造于何时书上并无记载。但四、五世纪时珠算在我国人民中已广泛应用,并深受广大人民欢迎。关于珠算口诀很多,来源很早[5],其中简单的口诀有:

加法口决:“一上一”“一下五除四”“一退九进一”“二上二”

减法口诀:“一去一”“一上四去五”“一退十还九”“二去二”等等。

李东阳把算盘描述为“珠之走盘”[6],说明熟练掌握珠算歌诀和基本技巧的计算者,计算速度是惊人的。我想这也在很大程度上促进了我国商业的发展,出现了清末著名的晋商徽商等,促进了社会的繁荣与进步。

算盘作为计算工具历经3000多年,时至今日,世界进入了计算机时代,它仍是世界上使用较为广泛的计算工具。在日本每年应考珠算技术等级合格证的人有增无减,在美国算盘也迅速普及。日本珠算教育联盟会长荒木勋在指出珠算发展前景时说:“在中国诞生又传播到亚洲各国而发展起来的珠算,通过日中两国专家合作,正在走向世界范围普及了!”

我国古代数学在世界上一直居于领导地位,从记数、分数、小数、正负数及无限逼近任意实数的方法,以及解联立方程组与二次、高次数学方程等实质上都是中国数学家的发明创造。中国古代数学之最也不局限于上述五个,我国历代在数学上人才辈出、推陈出新、独具特色。我们要想预见未来,首先得站在历史高度上了解中国数学的过去。过去的辉煌必须铭记,这样我们才能更好的继承数学史上一个个伟大数学家的光荣传统,投身于美妙的数学研究之中,创造出更多更伟大绚烂的数学之最来!

参考文献

[1]这是一本很古老的书,相传是伏羲氏、周文王、孔丘所作,是世界公认的上第一本讨论排列的书。

[2]三上义夫在《中日数学发展史》(1913)

[3]漾辉字谦光 钱塘人 是我国南宋时代杰出的数学家。1216年著《详解九章算法》

[4]见文章《从杨辉三角谈起》

[5]杨辉在《算法通变本末》上说:“口诵者为因”,说明当时已使用口诀。

[6]见《麓堂诗论》

篇二:数学之美_4000字宣化一中 宋丽丽

喜欢? 不喜欢?

生活中的数字美

• 日常生活中,人们说话喜欢讨口彩, 也代表着美好祝愿,比如,一家子 一帆风顺,夫妻俩双喜临门,三口 子三星高照、四季平安、五官端正、 六六大顺,女儿长的像“七仙女”, 儿子八面威风,九九重阳敬老节, 一家人十全十美。

对联中的数字美

• 毛泽东在湖南一师读书时曾写联自勉, “苟有恒,何必三更眠五更起;最无益, 只怕一日曝十日寒”;清两江总督陶澍的 “要半文,不值半文,莫道无人知道;办 一事,须了一事,如此心乃安然”,教人 勤政廉洁;辛亥革命后南京临时国民政府 第一个春节贴的春联是“化六大洲为一国, 并十八省为一家,共和升平,亿姓合群沾 幸福;立三代后未有功,开五千年未有奇, 脱离压制,同胞努力抗强权”。

• 任何一首歌曲,不论高亢激越还是婉转低回,都

由1、2、3、4、5、6、7(哆唻咪法嗦啦西)谱写

音画中的数字美

而成,数字的变化组合,可以谱出无数优美的旋

律。在绘画中也有数字美,如明朝伦文叙题苏东

坡《百鸟归巢图》:“天生一只又一只,三四五 此诗看似平淡,实则饶有风趣。第二句若采用先

乘后加法共98只,再加首句2只,正好100只。

六七八只,凤凰何少鸟何多?啄尽人间千万石”。

文学中的数学之美

数 学 入 诗 《蒙学诗》

一去二三里,烟村四五家, 亭台六七座,八九十枝花。

这是宋代邵雍描写一路景物的诗,共20个字,把 10个数字全用上了。这首诗用数字反映远近、村 落、亭台和花,通俗自然,脍炙人口。

《雪梅诗》

一片二片三四片,五片六片七八片。

九片十片无数片,飞入梅中都不见。

这是明代林和靖写的一首雪梅诗,全诗用表示雪

花片数的数量词写成。读后就好像身临雪境,飞

下的雪片由少到多,飞入梅林,就难分是雪花还

是梅花。

一片二片三四片,五片六片七八片。

九片十片十一片,飞入草丛皆不见。

-------

纪晓岚

一片二片三四片,五片六片七八片, 千片万片无数片,飞入芦花总不见。

-------

郑板桥

• 西汉时,司马相如告别妻子卓文君, 离开成都去长安求取功名,时隔五年, 不写家书,心有休妻之念。后来,他 写了一封难为卓文君的信,送往成都。

卓文君接到信后,拆开一看,只见写

着“一二三四五六七八九十百千万

万千百十九八七六五四三二一”。

• 她立即回写了一首如诉如泣的抒情诗:

• 一别之后,二地相思 ,只说是三四月,又谁 知五六年,七弦琴无心弹,八行书无可传, 九连环从中折断,十里长亭望眼欲穿 ,百般 想,千般念,万般无奈把郎怨

。万语千言道 不尽,百无聊赖,十依阑干,九九重阳看孤 雁,八月中秋月圆人不圆,七月半烧香秉烛 问苍天,六月伏天人人摇扇我心寒,五月石 榴如火偏遇阵阵冷雨浇花端,四月枇杷黄我 欲对镜心意乱 ,三月桃花随流水,二月风筝 线儿断。噫!郎呀郎,巴不得下一世你为女 来我为男。

• 司马相如读后深受感动,亲自把卓文君接到 长安。

数学入迷

一、数学工具谜

独木桥畔百万兵,分开上下两行队,上边兵强 (算盘) 一当五,下边兵多听号令. 这个脑袋真正灵,忽闪忽闪眨眼睛,东西南北 带着它,加减乘除不费劲. (计算器) 长着两只脚,走路闲只脚,生来走弯路,从不 走直道。 (圆规)

• 二、数学名词谜

• • • • 停战 夏周之间 储蓄 完全合算 (和) (商) (积) (绝对值 )

• • • • • •

三、打一成语: 2、4、6、8、10 1、3、5、7、9 1 2 3 4 5 6 9 1 2 5 6 7 8 9 3 3 3 ,5 5 5

(无独有偶)

(无奇不有) (七零八落) (丢三落四) (三五成群)

数学中的文学之美

数学是一种抽象思维活动,本来与 诗无缘,可是清代诗人徐子云竟将 「抽象」与「形象」结合在一起, 创作出这首数学诗: 巍巍古寺在山林,不知寺内几多僧。 三百六十四只碗,看看周尽不差争。 三人共食一碗饭,四人共吃一碗羹。 请问先生明算者,算来寺内几多僧?

诗 歌 趣 题

• 诗句的意思是:寺内有三百六 十四只碗,如果三个和尚共吃 一碗饭,四个和尚共吃一碗羹, 就每个和尚都有得吃,寺内共 有和尚多少个? • “周尽不差争”意即很准确, 碗数就这样,一点也不差。

设和尚数为x,

列出以下的代数式子:

x/3+x/4=364,x=624.

百羊问题

明代大数学家程大位著的 《算法统宗》一书,有一道 诗歌形式的数学应用题,叫 百羊问题。

甲赶羊群逐草茂,乙拽一羊随其后, 戏问甲及一百否?甲云所说无差谬, 所得这般一群凑,再添半群小半群, 得你一只来方凑,玄机奥妙谁猜透?

此题的意思是: 一个牧羊人赶着一群羊去寻找青草茂盛的地方。 有一个牵着一只羊的人从后面跟来,并问牧羊 人:“你的这群羊有100 只吗?”牧羊人说: “如果我再有我这样一群羊, 加上我这群羊 的一半再加1/4群,连同你这一只羊,就刚好 满100只。 ”谁能用巧妙的方法求出这群羊有 多少只?

用方程来做:设此人有羊

x

x x x  x    1  100 2 4

x  36

李 白 打 酒

李白街上走,提壶去打酒; 遇店加一倍,见花喝一斗; 三遇店和花,喝光壶中酒。 试问酒壶中,原有多少酒?

这是一道民间算题。题意是:李白在街上走, 提着酒壶边喝边打酒,每次

遇到酒店将壶中酒 加一倍,每次遇到花就喝去一斗(斗是古代容 量单位,1斗=10升),这样遇店见花各3次, 把酒喝完。问壶中原来有酒多少?

此题用方程解。

设壶中原来有酒x斗。 得〔(2x-1)×2-1 〕×2-1=0,

解得x=7/8。

问 : 梨 果 多 少 价 几 何 ?

一 十 一 文 梨 九 个 , 七 枚 果 子 四 文 钱

九 百 九 十 九 文 钱 , 及 时 梨 果 买 一 千

《 四 元 玉 鉴 》 中 有 这 样 一 道 题 目 :

元 代 数 学 家 朱 世 杰 于 年 编 著 的

及 时 梨 果

1303

此题的题意是:用999文钱买得梨 和果共1000个,梨11文买9个,果

4文买7个。

问买梨、果各几个,各付多少钱?

解 11 梨每个价: 11  9  (文)

9

4 果每个价: 4  7  7

(文)

11 11 4 果的个数: 1000  999 )  (  )  343 (个) ( 9 9 7

梨的个数:1000-343=657(个)

11 梨的总价:  657  803 (文) 9 4 果的总价:  343  196 (文) 7

隔壁分银

• 只闻隔壁客分银,不知人数不知银, 四两一份多四两,半斤一份少半斤。

• 试问各位能算者,多少客人多少银?

• (注:旧制1斤=16两,半斤=8两)

此题是民间算题,用方程解比较方便。 设客人为x人。则得方程: 4x+4=8x-8 解 x=3,4×3+4=16 答:客人3人,银16两。

这是明代 数学家吴 敬偏著的 《九章算 法比类大 全》中的 一道题, 题目是:

宝塔装灯

远望巍巍塔七层, 红光点点倍加增, 共灯三百八十一, 请问顶层几盏灯?

• 解: 各层倍数和:

• 1+2+4+8+16+32+64=127

• 顶层的盏数:381÷127=3(盏)

国际象棋发明人的报酬

这是印度的一个古老传说,舍罕王打算重赏象棋发明人:宰相 西萨· 达依尔。这位聪明的大臣的胃口看来并不大,他跪在国 班· 王面前说: ‘陛下,请您在这张棋盘的第一个小格内,赏给我 一粒麦子,在第二个小格内给两粒,第三格内给四粒,用这样下 去,每一小格内都比前一小格加一倍。陛下,把这样摆满棋盘上 所有64格的麦粒,都赏给您的仆人吧!’ ‘爱卿,你所求的并不多啊。”国王说道,心里为自己对这样一件 奇妙的发明赏赐的许诺不致破费太多而暗喜。“你当然会如愿以偿 的,”国王命令如数付给达依尔。 计数麦粒的工作开始了,第一格内放1粒,第二格内放2粒第 三格内放2’粒,…还没有到第二十格,一袋麦子已经空了。一袋 又一袋的麦子被扛到国王面前来。但是,麦粒数一格接一格飞快增 长着,国王很快就看出,即便拿全印度的粮食,也兑现不了他对达 依尔的诺言。

原来,所需麦粒总数

1+2+2 +2 +2 +……+2 =2 -1

2

3

4

63

64

=184

46744073709551615。

这些麦子究竟有多少?打个比方,如果造一个仓库来放这些 麦子,仓库高4米,宽10米,那么仓库的长度就等于地球到太 阳的距离的两倍。而要生产这么多的麦子,全世界要两千年。尽 管印度舍罕王非常富有,但要这样多的麦子他是怎么也拿不出来 的。这么一来,舍罕王就欠了宰相好大一笔债。要么是忍受达依 尔没完没了的讨债,要么是干脆砍掉他的脑袋。结果究竟如何, 可惜史书上没有记载。

卖马

某人卖马一匹,得钱156卢布。但是买主买到马 以后又懊悔了,要把马退还给卖主,他说这匹马根本不 值这么多钱。于是卖主向买主提出了另一种计算马价的 方案说,如果你嫌马太贵了,那么就只买马蹄上的钉子 好了,马就算白送给你。每个马蹄铁上有6枚钉子,第 一枚钉子只卖1个戈比(1卢布等于100戈比),第 二枚卖2个戈比,第三枚4个戈比,后面每个钉子价格依 此类椎。买主认为钉子的价值总共也花不了10个卢布 ,还能白得一匹好马,于是就欣然同意丁。结果买主算 账后才明白上当。试问买主在这笔交易中要亏损多少?

1+2+2 +2 +2 + …+2 =

2

3

4

23

分数的妙用

有一位阿拉伯老人,生前养有11匹马,他去世前立下

遗嘱:大儿子、二儿子、小儿子、分别继承遗产的

1/2,1/4,1/6。儿子们想来想去没法分:他们所

得到的都不是整数,即分别为11/2,11/4,11/6。

总不能把一匹马割成几块来分吧? 聪明的邻居牵来了自己的1匹马,对他们说:“你们 看,现在有12匹马了,老大得12匹的1/2,就是6匹 中,老二得12匹的1/4就是3匹,老三得12匹的1/6就 是2匹,还剩下一匹我照样牵回家去。”

篇三:数学之美_1700字发现数学规律, 发觉数学之美 ——计算器的应用

沾二实 霍希岩 2015.03.10

1x8+1=9

12x8+2=98 123x8+3=987 1234x8+4=9876 12345x8+5=98765 123456x8+6=987654 1234567x8+7=9876543 12345678x8+8=98765432 123456789x8+9=987654321

9999X11=109989 9999X12=119988 9999X13=129987

9999X11=109989 9999X12=119988 9999X13=129987 9999X14=139986 9999X15=149985 9999X16=159984 9999X17=169983 9999X18=179982 9999X19=189981

1x9+2=11 12x9+3=111 123x9+4=1111

1x9+2=11 12x9+3=111 123x9+4=1111 1234x9+5=11111 12345x9+6=111111 123456x9+7=1111111 1234567x9+8=11111111 12345678x9+9=111111111 123456789x9+10=1111111111

9x9+7=88 98x9+6=888 987x9+5=8888

9x9+7=88 98x9+6=888 987x9+5=8888 9876x9+4=88888 98765x9+3=888888 987654x9+2=8888888 9876543x9+1=88888888 98765432x9+0=888888888

1x1=1 11x11=121 111x111=12321

1x1=1 11x11=121 111x111=12321 1111x1111=1234321 11111x11111=123454321 111111x111111=12345654321 1111111x1111111=1234567654321 11111111x11111111=123456787654321 111111111x111111111=12345678987654321 1111111111X1111111111=12345678900987654321

9x9=81 99x99=9801 999x999=998001

9x9=81 99x99=9801 999x999=998001 9999x9999=99980001 99999x99999=9999800001 999999x999999=999998000001 9999999x9999999=99999980000001 99999999x99999999=9999999800000001 999999999x999999999=999999998000000001

1x9+2=11 12x9+3=111 123x9+4=1111

1x9+2=11 12x9+3=111 123x9+4=1111 1234x9+5=11111 12345x9+6=111111 123456x9+7=1111111 1234567x9+8=11111111 12345678x9+9=111111111 123456789x9+10=1111111111

1122÷34=33 111222÷334=333 11112222 ÷3334=3333

1122÷34=33 111222÷334=333 11112222 ÷3334=3333 1111122222 ÷33334=33333 111111222222 ÷333334=333333 11111112222222 ÷3333334=3333333 1111111122222222 ÷33333334=33333333 111111111222222222 ÷333333334=333333333 11111111112222222222 ÷3333333334=3333333333

谢谢观赏!

篇四:数学之美_1800字数学之美

数学——人类进化过程中创造的学问,它是 智慧的积累、知识的升华、技巧的创新,其 中自然不乏美。但数学的美到底在哪里?

数学,如果正确的看,不但拥有真理,而且 具有至高无上的美。 (罗素) 数学是上帝用来书写宇宙的文字。 (伽利 略)

芋头根茎

数学图形之美

一、数学的和谐美

和谐是美妙的。宇宙是和谐的,所以是美妙 的。 如:蜂房结构之美

蜂房音箱

一、数学的和谐美

生命现象中的一些最优化结构 如:血管的粗细直径之比为3√2:1,这是 生物多年进化、去劣存优的结果 。 动物的头骨似乎有很大差异,其实他们是同 一结构,只是在不同坐标系下的表现和写真, 这是大自然进化的必然结果。

一、数学的和谐美

数学论证了自然界的和谐,反之,自然界的 和谐也为数学的严谨与和谐提供了有利的范 例。 数学的严谨自然流露出它的和谐,为了追求 严谨、和谐,数学家一直在努力消除其中不 和谐的东西。 (如:悖论!)

二、数学的简洁之美

弗莱明:数学简化了思维过程并使之更可靠。 华罗庚指出:宇宙之大、原子之微、火箭之 速、化工之巧、地球之变、生物之迷、日用 之烦……无不可用数学表示。 数学之所以用途如此之广,盖因数学首要的 特点在于它的简洁。 数学家莫德尔说:在数学里美的各个属性中, 首先要推崇的大概是简洁性。

二、数学的简洁之美

自然界是简洁的。 光沿直线传播——光传播的最短路径 植物的叶序——保证植物通风采光的最佳布 局 藤类植物螺旋式攀缘——螺旋形状对植物攀 缘路径来讲是最节省的 大雁飞行的人字型角度——一边与飞行方向 的角度是54°44’8’’,这个角度使得飞行的 阻力最小

身边的数学

二、数学的简洁之美

描述宇宙的文字与工具数学也是简洁的。 建立公理化结构时——要求公理尽量少 命题证明——力求严谨简洁 计算方法——尽量快 数学符号引入——就是为了简洁 算式——把自然界朴实的东西以最简的形式 表达出来 (如:勾股定理、三角函数)

研究论文题目

1、寻找生活、工程实践或生产活动中的一 些现象,用数学原理解释起原因、合理性。

2、寻找利用数学原理解决实际问题的案例。 叙述其中的数学原理及应用的基本过程。如: 黄金分割的应用。

三、数学的形式美

怀德海:只有音乐堪与数学媲美。 艺术家追求的美中,形式是特别重要的。 数学家也十分注重数学的形式美。 整齐简练的数学方程 匀称规则的几何图形 数学注重追求一种最适合表现自然规律的科 学理论形式

三、数学的形式美

1、自然数的和式分解 毕达哥拉斯学

派十分注重形式美,他们把整数按可用石子摆放 的形状来分类,如:三角数、四角数五角数、六角数、…. 他们发现性质:每个四角数是两个相继三角数的和 第n-1个三角数与第n个k角数之和等于第n个k+1角 n-1 n k n k+1 数 后来的数学家继续研究这种形式美。 法国业余数学家费马猜测: 法国业余数学家费马猜测: 每个自然数可用至多三个三角数、四个四角数…..k个k角数 每个自然数可用至多三个三角数、四个四角数 个 角数 之和表示。 之和表示。 研究题目3: 研究题目 :收集并概括其中的某个证明

三、数学的形式美

2、哥德巴赫猜想 大于等于6的偶数,可以表示成两个奇素数之和。 最好的结果:我国数学家陈景润的结论1+2 即:大偶数可以表示成一个素数与一个至多是两个 素数乘机的数之和。 研究题目4: 研究题目 :1)叙述哥德巴赫猜想的完成过程 2)叙述其中使用的数学知识点或学科 3)为什么它不能成为新世纪中的数学热点问题

三、数学的形式美

幻方与数独游戏 该问题在学习计算方法课程时,作为研究题 目。

四、数学的奇异美

贝尔:审美趣味与数学趣味是一致的或相同 的。 数学中有许多奇异的现象,表面上它与人们 的预期相反,但在令人失望之余,也给了人 们探索它们的动力与机遇。

四、数学的奇异美

不定方程3x2-y2=2有无数组有理解,但x2-3y2=2 却没有 x2+y2=1有无数组有理解,但x2+y2=3却没有 x2+y2=z2有无数组正整数解(叫勾股数组), xn+yn=zn(n>2)却没有非平凡的整数解(该命 题即1640年提出的“费马猜想”)。 “3x+1”问题:任意给一个自然数,如果它是偶数, 则除2,如果是奇数则乘以3+1,….,继续下去, 经过有限步骤后,其结果一定为? 其证明非常难,有人说它的难度与“哥德巴赫猜想” 相当。

四、数学的奇异美

研究题目5: 查找数学历史中类似的、你感兴趣的问题 叙述问题的来源 详细说明问题的内涵与外延 阐述问题解决的过程、使用的数学原理 如果可能研究其可能的应用,或推广

篇五:数学之美_43100字数学之美 系列一 -- 统计语言模型

从本周开始,我们将定期刊登 Google 科学家吴军写的《数学之美》系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用。

前言

也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望利用 Google 中文黑板报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发 Google 产品的。

系列一: 统计语言模型 (Statistical Language Models)

Google 的使命是整合全球的信息,所以我们一直致力于研究如何让机器对信息、语言做最好的理解和处理。长期以来,人类一直梦想着能让机器代替人来翻译语言、识别语音、认识文字(不论是印刷体或手写体)和进行海量文献的自动检索,这就需要让机器理解语言。但是人类的语言可以说是信息里最复杂最动态的一部分。为了解决这个问题,人们容易想到的办法就是让机器模拟人类进行学习 - 学习人类的语法、分析语句等等。尤其是在乔姆斯基(Noam Chomsky 有史以来最伟大的语言学家)提出 “形式语言” 以后,人们更坚定了利用语法规则的办法进行文字处理的信念。遗憾的是,几十年过去了,在计算机处理语言领域,基于这个语法规则的方法几乎毫无突破。

其实早在几十年前,数学家兼信息论的祖师爷 香农 (Claude Shannon)就提出了用数学的办法处理自然语言的想法。遗憾的是当时的计算机条件根本无法满足大量信息处理的需要,所以他这个想法当时并没有被人们重视。七十年代初,有了大规模集成电路的快速计算机后,香农的梦想才得以实现。

首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克 (Fred Jelinek)。当时贾里尼克在 IBM 公司做学术休假 (Sabbatical Leave),领导了一批杰出的科学家利用大型计算机来处理人类语言问题。统计语言模型就是在那个时候提出的。

给大家举个例子:在很多涉及到自然语言处理的领域,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中,我们都需要知道一个文字序列是否能构成一个大家能理解的句子,显示给使用者。对这个问题,我们可以用一个简单的统计模型来解决这个问题。

如果 S 表示一连串特定顺序排列的词 w1, w2,…, wn ,换句话说,S 可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子。现在,机器对语言的识别从某种角度来说,就是想知道S在文本中出现的可

能性,也就是数学上所说的S 的概率用 P(S) 来表示。利用条件概率的公式,S 这个序列出现的概率等于每一个词出现的概率相乘,于是P(S) 可展开为:

P(S) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…wn-1)

其中 P (w1) 表示第一个词w1 出现的概率;P (w2|w1) 是在已知第一个词的前提下,第二个词出现的概率;以次类推。不难看出,到了词wn,它的出现概率取决于它前面所有词。从计算上来看,各种可能性太多,无法实现。因此我们假定任意一个词wi的出现概率只同它前面的词 wi-1 有关(即马尔可夫假设),于是问题就变得很简单了。现在,S 出现的概率就变为:

P(S) = P(w1)P(w2|w1)P(w3|w2)…P(wi|wi-1)…

(当然,也可以假设一个词又前面N-1个词决定,模型稍微复杂些。)

接下来的问题就是如何估计 P (wi|wi-1)。现在有了大量机读文本后,这个问题变得很简单,只要数一数这对词(wi-1,wi) 在统计的文本中出现了多少次,以及 wi-1 本身在同样的文本中前后相邻出现了多少次,然后用两个数一除就可以了,P(wi|wi-1) = P(wi-1,wi)/ P (wi-1)。

也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题。其实不光是常人,就连很多语言学家都曾质疑过这种方法的有效性,但事实证明,统计语言模型比任何已知的借助某种规则的解决方法都有效。比如在 Google 的中英文自动翻译中,用的最重要的就是这个统计语言模型。去年美国标准局(NIST) 对所有的机器翻译系统进行了评测,Google 的系统是不仅是全世界最好的,而且高出所有基于规则的系统很多。

现在,读者也许已经能感受到数学的美妙之处了,它把一些复杂的问题变得如此的简单。当然,真正实现一个好的统计语言模型还有许多细节问题需要解决。贾里尼克和他的同事的贡献在于提出了统计语言模型,而且很漂亮地解决了所有的细节问题。十几年后,李开复用统计语言模型把 997 词语音识别的问题简化成了一个 20 词的识别问题,实现了有史以来第一次大词汇量非特定人连续语音的识别。

我是一名科学研究人员 ,我在工作中经常惊叹于数学语言应用于解决实际问题上时的神奇。我也希望把这种神奇讲解给大家听。当然,归根结底,不管什莫样的科学方法、无论多莫奇妙的解决手段都是为人服务的。我希望 Google 多努力一分,用户就多一分搜索的喜悦。

数学之美 系列二 -- 谈谈中文分词

谈谈中文分词

----- 统计语言模型在中文处理中的一个应用

上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天

官员应邀到美国与太空总署官员开会。”

分成一串词:

中国 / 航天 / 官员 / 应邀 / 到 / 美国 / 与 / 太空 / 总署 / 官员 / 开会。

最容易想到的,也是最简单的分词办法就是查字典。这种方法最早是由北京航天航空大学的梁南元教授提出的。

用 “查字典” 法,其实就是我们把一个句子从左向右扫描一遍,遇到字典里有的词就标识出来,遇到复合词(比如 “上海大学”)就找最长的词匹配,遇到不认识的字串就分割成单字词,于是简单的分词就完成了。这种简单的分词方法完全能处理上面例子中的句子。八十年代,哈工大的王晓龙博士把它理论化,发展成最少词数的分词理论,即一句话应该分成数量最少的词串。这种方法一个明显的不足是当遇到有二义性(有双重理解意思)的分割时就无能为力了。比如,对短语 “发展中国家” 正确的分割是“发展-中-国家”,而从左向右查字典的办法会将它分割成“发展-中国-家”,显然是错了。另外,并非所有的最长匹配都一定是正确的。比如 “上海大学城书店”的正确分词应该是 “上海-大学城-书店,” 而不是 “上海大学-城-书店”。

九十年代以前,海内外不少学者试图用一些文法规则来解决分词的二义性问题,都不是很成功。90年前后,清华大学的郭进博士用统计语言模型成功解决分词二义性问题,将汉语分词的错误率降低了一个数量级。

利用统计语言模型分词的方法,可以用几个数学公式简单概括如下:

我们假定一个句子S可以有几种分词方法,为了简单起见我们假定有以下三种:

A1, A2, A3, ..., Ak,

B1, B2, B3, ..., Bm

C1, C2, C3, ..., Cn

其中,A1, A2, B1, B2, C1, C2 等等都是汉语的词。那么最好的一种分词方法应该保证分完词后这个句子出现的概率最大。也就是说如果 A1,A2,..., Ak 是最好的分法,那么 (P 表示概率):

P (A1, A2, A3, ..., Ak) 〉 P (B1, B2, B3, ..., Bm), 并且

P (A1, A2, A3, ..., Ak) 〉 P(C1, C2, C3, ..., Cn)

因此,只要我们利用上回提到的统计语言模型计算出每种分词后句子出现的概率,并找出其中概率最大的,我们就能够找到最好的分词方法。

当然,这里面有一个实现的技巧。如果我们穷举所有可能的分词方法并计算出每种可能性下句子的概率,那么计算量是相当大的。因此,我们可以把它看成是一个动态规划(Dynamic Programming) 的问题,并利用 “维特比”(Viterbi) 算法快速地找到最佳分词。

在清华大学的郭进博士以后,海内外不少学者利用统计的方法,进一步完善中文分词。其中值得一提的是清华大学孙茂松教授和香港科技大学吴德凯教授的工作。

需要指出的是,语言学

家对词语的定义不完全相同。比如说 “北京大学”,有人认为是一个词,而有人认为该分成两个词。一个折中的解决办法是在分词的同时,找到复合词的嵌套结构。在上面的例子中,如果一句话包含 “北京大学”四个字,那么先把它当成一个四字词,然后再进一步找出细分词 “北京” 和 “大学”。这种方法是最早是郭进在 “Computational Linguistics” (《计算机语言学》)杂志上发表的,以后不少系统采用这种方法。

一般来讲,根据不同应用,汉语分词的颗粒度大小应该不同。比如,在机器翻译中,颗粒度应该大一些,“北京大学”就不能被分成两个词。而在语音识别中,“北京大学”一般是被分成两个词。因此,不同的应用,应该有不同的分词系统。Google 的葛显平博士和朱安博士,专门为搜索设计和实现了自己的分词系统。

也许你想不到,中文分词的方法也被应用到英语处理,主要是手写体识别中。因为在识别手写体时,单词之间的空格就不很清楚了。中文分词方法可以帮助判别英语单词的边界。其实,语言处理的许多数学方法通用的和具体的语言无关。在 Google 内,我们在设计语言处理的算法时,都会考虑它是否能很容易地适用于各种自然语言。这样,我们才能有效地支持上百种语言的搜索。

对中文分词有兴趣的读者,可以阅读以下文献:

1. 梁南元

书面汉语自动分词系统

http:///demo/LiangNanyuan-JCIP-1987.pdf

2. 郭进

统计语言模型和汉语音字转换的一些新结果

http:///demo/GuoJin-JCIP-1993.pdf

3. 郭进

Critical Tokenization and its Properties

http://acl.ldc.upenn.edu/J/J97/J97-4004.pdf

4. 孙茂松

Chinese word segmentation without using lexicon and hand-crafted training data

http://portal.acm.org/citation.cfm?coll=GUIDE&dl=GUIDE&id=980775

数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用

前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决,让我不由由衷地感叹数学模型之妙。

自然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系统中的解码问题 -- 一个人根据接收到的信息,去猜测发话人要表达的意思。这其实就象通信中,我们根据接收端收到的信号去分析、理解、还原发送端传送过来的信息。以下该图就表示了一个典型的通信系统:

其中 s1,s2,s3...表示信息源发出的信号。o1, o2, o3 ... 是接受器接收到的信号。通信中的解码就是根据接收到的信号 o1, o2, o3 ...还原出发送

的信号 s1,s2,s3...。

其实我们平时在说话时,脑子就是一个信息源。我们的喉咙(声带),空气,就是如电线和光缆般的信道。听众耳朵的就是接收端,而听到的声音就是传送过来的信号。根据声学信号来推测说话者的意思,就是语音识别。这样说来,如果接收端是一台计算机而不是人的话,那么计算机要做的就是语音的自动识别。同样,在计算机中,如果我们要根据接收到的英语信息,推测说话者的汉语意思,就是机器翻译;如果我们要根据带有拼写错误的语句推测说话者想表达的正确意思,那就是自动纠错。

那么怎么根据接收到的信息来推测说话者想表达的意思呢?我们可以利用叫做“隐含马尔可夫模型” (Hidden Markov Model)来解决这些问题。以语音识别为例,当我们观测到语音信号 o1,o2,o3 时,我们要根据这组信号推测出发送的句子 s1,s2,s3。显然,我们应该在所有可能的句子中找最有可能性的一个。用数学语言来描述,就是在已知 o1,o2,o3,...的情况下,求使得条件概率

P (s1,s2,s3,...|o1,o2,o3....) 达到最大值的那个句子 s1,s2,s3,...

当然,上面的概率不容易直接求出,于是我们可以间接地计算它。利用贝叶斯公式并且省掉一个常数项,可以把上述公式等价变换成

P(o1,o2,o3,...|s1,s2,s3....) * P(s1,s2,s3,...)

其中

P(o1,o2,o3,...|s1,s2,s3....) 表示某句话 s1,s2,s3...被读成 o1,o2,o3,...的可能性, 而

P(s1,s2,s3,...) 表示字串 s1,s2,s3,...本身能够成为一个合乎情理的句子的可能性,所以这个公式的意义是用发送信号为 s1,s2,s3...这个数列的可能性乘以 s1,s2,s3...本身可以一个句子的可能性,得出概率。

(读者读到这里也许会问,你现在是不是把问题变得更复杂了,因为公式越写越长了。别着急,我们现在就来简化这个问题。)我们在这里做两个假设:

第一,s1,s2,s3,... 是一个马尔可夫链,也就是说,si 只由 si-1 决定 (详见系列一);

第二, 第 i 时刻的接收信号 oi 只由发送信号 si 决定(又称为独立输出假设, 即 P(o1,o2,o3,...|s1,s2,s3....) = P(o1|s1) * P(o2|s2)*P(o3|s3)...。

那么我们就可以很容易利用算法 Viterbi 找出上面式子的最大值,进而找出要识别的句子 s1,s2,s3,...。

满足上述两个假设的模型就叫隐含马尔可夫模型。我们之所以用“隐含”这个词,是因为状态 s1,s2,s3,...是无法直接观测到的。

隐含马尔可夫模型的应用远不只在语音识别中。在上面的公式中,如果我们把 s1,s2,s3,...当成中文,把 o1,o2,o3,...当成对应的英文,那么我们就能利用这个模型解决机器翻译问题; 如果我们把 o1,o2,o3,...当成扫描文字得到的图像特征,就能利用这个模型解决印刷体和手写体的识别

P (o1,o2,o3,...|s1,s2,s3....) 根据应用的不同而又不同的名称,在语音识别中它被称为“声学模型” (Acoustic Model), 在机器翻译中是“翻译模型” (Translation Model) 而在拼写校正中是“纠错模型” (Correction Model)。 而P (s1,s2,s3,...) 就是我们在系列一中提到的语言模型。

在利用隐含马尔可夫模型解决语言处理问题前,先要进行模型的训练。 常用的训练方法由伯姆(Baum)在60年代提出的,并以他的名字命名。隐含马尔可夫模型在处理语言问题早期的成功应用是语音识别。七十年代,当时 IBM 的 Fred Jelinek (贾里尼克) 和卡内基·梅隆大学的 Jim and Janet Baker (贝克夫妇,李开复的师兄师姐) 分别独立地提出用隐含马尔可夫模型来识别语音,语音识别的错误率相比人工智能和模式匹配等方法降低了三倍 (从 30% 到 10%)。 八十年代李开复博士坚持采用隐含马尔可夫模型的框架, 成功地开发了世界上第一个大词汇量连续语音识别系统 Sphinx。

我最早接触到隐含马尔可夫模型是几乎二十年前的事。那时在《随机过程》(清华“著名”的一门课)里学到这个模型,但当时实在想不出它有什么实际用途。几年后,我在清华跟随王作英教授学习、研究语音识别时,他给了我几十篇文献。我印象最深的就是贾里尼克和李开复的文章,它们的核心思想就是隐含马尔可夫模型。复杂的语音识别问题居然能如此简单地被表述、解决,我由衷地感叹数学模型之妙。

数学之美系列 4 -- 怎样度量信息?

前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使命。那么究竟每一条信息应该怎样度量呢?

信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年,香农提出了“信息熵”(shāng) 的概念,才解决了对信息的量化度量问题。

一条信息的信息量大小和它的不确定性有直接的关系。比如说,我们要搞清楚一件非常非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。相反,如果我们对某件事已经有了较多的了解,我们不需要太多的信息就能把它搞清楚。所以,从这个角度,我们可以认为,信息量的度量就等于不确定性的多少。

那么我们如何量化的度量信息量呢?我们来看一个例子,马上要举行世界杯赛了。大家都很关心谁会是冠军。假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”? 他不愿意直接告诉我,而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对了,那么我需要付给他多少

钱才能知道谁是冠军呢? 我可以把球队编上号,从 1 到 32, 然后提问: “冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了, 我会接着问: “冠军在 1-8 号中吗?” 假如他告诉我猜错了, 我自然知道冠军队在 9-16 中。 这样只需要五次,我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条消息的信息量只值五块钱。

当然,香农不是用钱,而是用 “比特”(bit)这个概念来度量信息量。一个比特是一位二进制数,计算机中的一个字节是八个比特。在上面的例子中,这条消息的信息量是五比特。(如果有朝一日有六十四个队进入决赛阶段的比赛,那么“谁世界杯冠军”的信息量就是六比特,因为我们要多猜一次。) 读者可能已经发现, 信息量的比特数和所有可能情况的对数函数 log 有关。 (log32=5, log64=6。)

有些读者此时可能会发现我们实际上可能不需要猜五次就能猜出谁是冠军,因为象巴西、德国、意大利这样的球队得冠军的可能性比日本、美国、韩国等队大的多。因此,我们第一次猜测时不需要把 32 个球队等分成两个组,而可以把少数几个最可能的球队分成一组,把其它队分成另一组。然后我们猜冠军球队是否在那几只热门队中。我们重复这样的过程,根据夺冠概率对剩下的候选球队分组,直到找到冠军队。这样,我们也许三次或四次就猜出结果。因此,当每个球队夺冠的可能性(概率)不等时,“谁世界杯冠军”的信息量的信息量比五比特少。香农指出,它的准确信息量应该是

= -(p1*log p1 + p2 * log p2 + ... +p32 *log p32),

其中,p1,p2 , ...,p32 分别是这 32 个球队夺冠的概率。香农把它称为“信息熵” (Entropy),一般用符号 H 表示,单位是比特。有兴趣的读者可以推算一下当 32 个球队夺冠概率相同时,对应的信息熵等于五比特。有数学基础的读者还可以证明上面公式的值不可能大于五。对于任意一个随机变量 X(比如得冠军的球队),它的熵定义如下:

变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。

有了“熵”这个概念,我们就可以回答本文开始提出的问题,即一本五十万字的中文书平均有多少信息量。我们知道常用的汉字(一级二级国标)大约有 7000 字。假如每个字等概率,那么我们大约需要 13 个比特(即 13 位二进制数)表示一个汉字。但汉字的使用是不平衡的。实际上,前 10% 的汉字占文本的 95% 以上。因此,即使不考虑上下文的相关性,而只考虑每个汉字的独立的概率,那么,每个汉字的信息熵大约也只有 8-9 个比特。如果我们再考虑上下文相关性,每个汉字的信息

熵只有5比特左右。所以,一本五十万字的中文书,信息量大约是 250 万比特。如果用一个好的算法压缩一下,整本书可以存成一个 320KB 的文件。如果我们直接用两字节的国标编码存储这本书,大约需要 1MB 大小,是压缩文件的三倍。这两个数量的差距,在信息论中称作“冗余度”(redundancy)。 需要指出的是我们这里讲的 250 万比特是个平均数,同样长度的书,所含的信息量可以差很多。如果一本书重复的内容很多,它的信息量就小,冗余度就大。

不同语言的冗余度差别很大,而汉语在所有语言中冗余度是相对小的。这和人们普遍的认识“汉语是最简洁的语言”是一致的。

在下一集中, 我们将介绍信息熵在信息处理中的应用以及两个相关的概念互信息和相对熵。

对中文信息熵有兴趣的读者可以读我和王作英教授在电子学报上合写的一篇文章

《语信息熵和语言模型的复杂度》

数学之美系列五 -- 简单之美:布尔代数和搜索引擎的索引

[建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。我们在介绍 Google Page Rank (网页排名) 时已经谈到了一些排序的问题,这里我们谈谈索引问题,以后我们还会谈如何度量网页的相关性,和进行网页自动下载。]

世界上不可能有比二进制更简单的计数方法了,也不可能有比布尔运算更简单的运算了。尽管今天每个搜索引擎都宣称自己如何聪明、多么智能化,其实从根本上讲都没有逃出布尔运算的框框。

布尔(George Boole) 是十九世纪英国一位小学数学老师。他生前没有人认为他是数学家。布尔在工作之余,喜欢阅读数学论著、思考数学问题。1854 年“思维规律” (An Investigation of the Laws of Thought, on which are founded the Mathematical Theories of Logic and Probabilities)一书,第一次向人们展示了如何用数学的方法解决逻辑问题。

布尔代数简单得不能再简单了。运算的元素只有两个1 (TRUE, 真) 和 0

(FALSE,假)。基本的运算只有“与”(AND)、“或” (OR) 和“非”(NOT) 三种(后来发现,这三种运算都可以转换成“与”“非” AND-NOT一种运算)。全部运算只用下列几张真值表就能完全地描述清楚。

AND | 1 0

-----------------------

1 | 1 0

0 | 0 0

这张表说明如果 AND 运算的两个元素有一个是 0,则运算结果总是 0。如果两个元素都是 1,运算结果是 1。例如,“太阳从西边升起”这个判断是假的(0),“水可以流动”这个判断是真的(1),那么,“太阳从西边升起并且水可以流动”就是假的(0)。

OR | 1 0

-----------------------

1 |

1 1

0 | 1 0

这张表说明如果OR运算的两个元素有一个是 1,则运算结果总是 1。如果两个元素都是 0,运算结果是 0。比如说,“张三是比赛第一名”这个结论是假的(0),“李四是比赛第一名”是真的(1),那么“张三或者李四是第一名”就是真的(1)。

NOT |

--------------

1 | 0

0 | 1

这张表说明 NOT 运算把 1 变成 0,把 0 变成 1。比如,如果“象牙是白的”是真的(1),那么“象牙不是白的”必定是假的(0)。

读者也许会问这么简单的理论能解决什么实际问题。布尔同时代的数学家们也有同样的问题。事实上在布尔代数提出后80 多年里,它确实没有什么像样的应用,直到 1938 年香农在他的硕士论文中指出用布尔代数来实现开关电路,才使得布尔代数成为数字电路的基础。所有的数学和逻辑运算,加、减、乘、除、乘方、开方等等,全部能转换成二值的布尔运算。

现在我们看看文献检索和布尔运算的关系。对于一个用户输入的关键词,搜索引擎要判断每篇文献是否含有这个关键词,如果一篇文献含有它,我们相应地给这篇文献一个逻辑值 -- 真(TRUE,或 1),否则,给一个逻辑值 -- 假(FALSE, 或0)。比如我们要找有关原子能应用的文献,但并不想知道如何造原子弹。我们可以这样写一个查询语句“原子能 AND 应用 AND (NOT 原子弹)”,表示符合要求的文献必须同时满足三个条件:

- 包含原子能

- 包含应用

- 不包含原子弹

一篇文献对于上面每一个条件,都有一个 True 或者 False 的答案,根据上述真值表就能算出每篇文献是否是要找的。

早期的文献检索查询系统大多基于数据库,严格要求查询语句符合布尔运算。今天的搜索引擎相比之下要聪明的多,它自动把用户的查询语句转换成布尔运算的算式。当然在查询时,不能将每篇文献扫描一遍,来看看它是否满足上面三个条件,因此需要建立一个索引。

最简单索引的结构是用一个很长的二进制数表示一个关键字是否出现在每篇文献中。有多少篇文献,就有多少位数,每一位对应一篇文献,1 代表相应的文献有这个关键字,0 代表没有。比如关键字“原子能”对应的二进制数是0100100001100001...,表示第二、第五、第九、第十、第十六篇文献包含着个关键字。注意,这个二进制数非常之长。同样,我们假定“应用”对应的二进制数是 0010100110000001...。那么要找到同时包含“原子能”和“应用”的文献时,只要将这两个二进制数进行布尔运算 AND。根据上面的真值表,我们知道运算结果是0000100000000001...。表示第五篇,第十六篇文献满足要求。

注意,计算机作布尔运算是非常非常快的。现

在最便宜的微机都可以一次进行三十二位布尔运算,一秒钟进行十亿次以上。当然,由于这些二进制数中绝大部分位数都是零,我们只需要记录那些等于1的位数即可。于是,搜索引擎的索引就变成了一张大表:表的每一行对应一个关键词,而每一个关键词后面跟着一组数字,是包含该关键词的文献序号。

对于互联网的搜索引擎来讲,每一个网页就是一个文献。互联网的网页数量是巨大的,网络中所用的词也非常非常多。因此这个索引是巨大的,在万亿字节这个量级。早期的搜索引擎(比如 Alta Vista 以前的所有搜索引擎),由于受计算机速度和容量的限制,只能对重要的关键的主题词建立索引。至今很多学术杂志还要求作者提供 3-5 个关键词。这样所有不常见的词和太常见的虚词就找不到了。现在,为了保证对任何搜索都能提供相关的网页,所有的搜索引擎都是对所有的词进行索引。为了网页排名方便,索引中还需存有大量附加信息,诸如每个词出现的位置、次数等等。因此,整个索引就变得非常之大,以至于不可能用一台计算机存下。大家普遍的做法就是根据网页的序号将索引分成很多份(Shards),分别存储在不同的服务器中。每当接受一个查询时,这个查询就被分送到许许多多服务器中,这些服务器同时并行处理用户请求,并把结果送到主服务器进行合并处理,最后将结果返回给用户。

不管索引如何复杂,查找的基本操作仍然是布尔运算。布尔运算把逻辑和数学联系起来了。它的最大好处是容易实现,速度快,这对于海量的信息查找是至关重要的。它的不足是只能给出是与否的判断,而不能给出量化的度量。因此,所有搜索引擎在内部检索完毕后,都要对符合要求的网页根据相关性排序,然后才返回给用户。

数学之美系列六 -- 图论和网络爬虫 (Web Crawlers)

[离散数学是当代数学的一个重要分支,也是计算机科学的数学基础。它包括数理逻辑、集合论、图论和近世代数四个分支。数理逻辑基于布尔运算,我们已经介绍过了。这里我们介绍图论和互联网自动下载工具网络爬虫 (Web Crawlers) 之间的关系。顺便提一句,我们用 Google Trends 来搜索一下“离散数学”这个词,可以发现不少有趣的现象。比如,武汉、哈尔滨、合肥和长沙市对这一数学题目最有兴趣的城市。]

我们上回谈到了如何建立搜索引擎的索引,那么如何自动下载互联网所有的网页呢,它要用到图论中的遍历(Traverse) 算法。

图论的起源可追溯到大数学家欧拉(Leonhard Euler)。1736 年欧拉来到德国的哥尼斯堡(Konigsberg,大哲学家康德的故乡,现在是俄罗斯的加里

宁格勒),发现当地市民们有一项消遣活动,就是试图将下图中的每座桥恰好走过一遍并回到原出发点,从来没有人成功过。欧拉证明了这件事是不可能的,并写了一篇论文,一般认为这是图论的开始。

图论中所讨论的的图由一些节点和连接这些节点的弧组成。如果我们把中国的城市当成节点,连接城市的国道当成弧,那么全国的公路干线网就是图论中所说的图。关于图的算法有很多,但最重要的是图的遍历算法,也就是如何通过弧访问图的各个节点。以中国公路网为例,我们从北京出发,看一看北京和哪些城市直接相连,比如说和天津、济南、石家庄、南京、沈阳、大同直接相连。我们可以依次访问这些城市,然后我们看看都有哪些城市和这些已经访问过的城市相连,比如说北戴河、秦皇岛与天津相连,青岛、烟台和济南相连,太原、郑州和石家庄相连等等,我们再一次访问北戴河这些城市,直到中国所有的城市都访问过一遍为止。这种图的遍历算法称为“广度优先算法”(BFS),因为它先要尽可能广地访问每个节点所直接连接的其他节点。另外还有一种策略是从北京出发,随便找到下一个要访问的城市,比如是济南,然后从济南出发到下一个城市,比如说南京,再访问从南京出发的城市,一直走到头。然后再往回找,看看中间是否有尚未访问的城市。这种方法叫“深度优先算法”(DFS),因为它是一条路走到黑。这两种方法都可以保证访问到全部的城市。当然,不论采用哪种方法,我们都应该用一个小本本,记录已经访问过的城市,以防同一个城市访问多次或者漏掉哪个城市。

现在我们看看图论的遍历算法和搜索引擎的关系。互联网其实就是一张大图,我们可以把每一个网页当作一个节点,把那些超链接(Hyperlinks)当作连接网页的弧。很多读者可能已经注意到,网页中那些蓝色的、带有下划线的文字背后其实藏着对应的网址,当你点下去的的时候,浏览器是通过这些隐含的网址转到相应的网页中的。这些隐含在文字背后的网址称为“超链接”。有了超链接,我们可以从任何一个网页出发,用图的遍历算法,自动地访问到每一个网页并把它们存起来。完成这个功能的程序叫做网络爬虫,或者在一些文献中称为后通过分析这个网页,可以找到藏在它里面的所有超链接,也就等于知道了这家门户网站首页所直接连接的全部网页,诸如雅虎邮件、雅虎财经、雅虎新闻等等。我们接下来访问、下载并分析这家门户网站的邮件等网页,又能找到其他相连的网页。我们让计算机不停地做下去,就能下载整个的互联网。当然,我们也要记载哪个网页下载过了,以免重复。在网络爬虫中,我们使用一个称为“哈希表”(Hash Table)的列表而不是一个记事本纪录网页是否下载过的信息。

现在的互联网非常巨大,不可能通过一台或几台计算机服务器就能完成下载任务。比如雅虎公司(Google 没有公开公布我们的数目,所以我这里举了雅虎的索引大小为例)宣称他们索引了 200 亿个网页,假如下载一个网页需要一秒钟,下载这 200 亿个网页则需要 634 年。因此,一个商业的网络爬虫需要有成千上万个服务器,并且由快速网络连接起来。如何建立这样复杂的网络系统,如何协调这些服务器的任务,就是网络设计和程序设计的艺术了。

数学之美 系列七 -- 信息论在信息处理中的应用

我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。

先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者会很自然地想到,既然语言模型能减少语音识别和机器翻译的错误,那么就拿一个语音识别系统或者机器翻译软件来试试,好的语言模型必然导致错误率较低。这种想法是对的,而且今天的语音识别和机器翻译也是这么做的。但这种测试方法对于研发语言模型的人来讲,既不直接、又不方便,而且很难从错误率反过来定量度量语言模型。事实上,在贾里尼克(Fred Jelinek)的人研究语言模型时,世界上既没有像样的语音识别系统,更没有机器翻译。我们知道,语言模型是为了用上下文预测当前的文字,模型越好,预测得越准,那么当前文字的不确定性就越小。

信息熵正是对不确定性的衡量,因此信息熵可以直接用于衡量统计语言模型的好坏。贾里尼克从信息熵出发,定义了一个称为语言模型复杂度 (Perplexity)的概念,直接衡量语言模型的好坏。一个模型的复杂度越小,模型越好。李开复博士在介绍他发明的 Sphinx 语音识别系统时谈到,如果不用任何语言模型(即零元语言模型)时,复杂度为997,也就是说句子中每个位置有 997 个可能的单词可以填入。如果(二元)语言模型只考虑前后词的搭配不考虑搭配的概率时,复杂度为 60。虽然它比不用语言模型好很多,但是和考虑

了搭配概率的二元语言模型相比要差很多,因为后者的复杂度只有 20。

信息论中仅次于熵的另外两个重要的概念是“互信息”(Mutual Information) 和“相对熵”(Kullback-Leibler Divergence)。

“互信息”是信息熵的引申概念,它是对两个随机事件相关性的度量。比如说今天随机事件北京下雨和随机变量空气湿度的相关性就很大,但是和姚明所在的休斯敦火箭队是否能赢公牛队几乎无关。互信息就是用来量化度量这种相关性的。在自然语言处理中,经常要度量一些语言现象的相关性。比如在机器翻译中,最难的问题是词义的二义性(歧义性)问题。比如 Bush 一词可以是美国总统的名字,也可以是灌木丛。(有一个笑话,美国上届总统候选人凯里 Kerry 的名字被一些机器翻译系统翻译成了。

对信息论有兴趣又有一定数学基础的读者,可以阅读斯坦福大学托马斯.科弗 (Thomas Cover) 教授的专著 克对语言学家的坏印象从此开始。加上后来他在 IBM 时发现语言学家们嘴上头头是道,干起活来高不成低不就,对语言学家从此深恶痛绝。他甚至说:贾里尼克也千方百计利用自己的影响力为学生的学习和事业创造方便。贾里尼克为组里的每一位学生提供从进组第一天到离开组最后一天全部的学费和生活费。他还为每一位学生联系实习机会,并保证每位学生在博士生阶段至少在大公司实习一次。从他那里拿到博士学位的学生,全部任职于著名实验室,比如IBM, 微软,AT&T 和 Google 的实验室。为了提高外国人的英语水平,贾里尼克用自己的经费为他们请私人英语教师。

贾里尼克生活俭朴,一辆老式丰田车开了二十多年,比组里学生的车都破。他每年都邀请组里的学生和教授到家里做客,很多毕业了的学生也专程赶来聚会。在那里,他不再谈论学术问题,而会谈些巩俐的电影(他太太是哥伦比亚大学电影专业的教授),或是某著名教授被拉斯韦加斯的赌馆定为不受欢迎的人等等。但是他聚会的食物实在难吃,无非是些生胡萝卜和芹菜。后来贾里尼克掏钱让系里另一个教授承办聚会,那个教授每次请专业大厨在家作出极丰盛的晚宴,并准备许多美酒,从此这种聚会就转移到那个教授家了。

除了巩俐的电影,贾里尼克对中国的了解就是清华大学和青岛啤酒了。他有时会把两个名字搞混,有两次被香港科技大学的 Pascale 冯教授抓住。

贾里尼克说话心直口快,不留余地。在他面前谈论学术一定要十分严谨,否则很容易被他抓住辫子。除了刚才提到的对语言学家略有偏见的评论,他对许多世界级的大师都有过很多“刻薄”但又实事求是的评论,这些评论在业界广为流传。贾里尼克在四十多年的学术生涯中居然没有得罪太多的人 ,可以说是一个奇迹。

注释一:

贾格布森的通信模型

1 上下文

2

信息

3

发送着 --------------- 4 接收者

5

信道

6 编码

数学之美 系列九 -- 如何确定网页和查询的相关性

[我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。]

我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任何一个搜索引擎都包含几十万甚至是上百万个多少有点关系的网页。那么哪个应该排在前面呢?显然我们应该根据网页和查询“原子能的应用”的相关性对这些网页进行排序。因此,这里的关键问题是如何度量网页和查询的相关性。

我们知道,短语“原子能的应用

”可以分成三个关键词:原子能、的、应用。根据我们的直觉,我们知道,包含这三个词多的网页应该比包含它们少的网页相关。当然,这个办法有一个明显的漏洞,就是长的网页比短的网页占便宜,因为长的网页总的来讲包含的关键词要多些。因此我们需要根据网页的长度,对关键词的次数进行归一化,也就是用关键词的次数除以网页的总字数。我们把这个商称为“关键词的频率”,或者“单文本词汇频率”(Term Frequency),比如,在某个一共有一千词的网页中“原子能”、“的”和“应用”分别出现了 2 次、35 次 和 5 次,那么它们的词频就分别是 0.002、0.035 和 0.005。 我们将这三个数相加,其和 0.042 就是相应网页和查询“原子能的应用”

相关性的一个简单的度量。概括地讲,如果一个查询包含关键词 w1,w2,...,wN, 它们在一篇特定网页中的词频分别是: TF1, TF2, ..., TFN。 (TF: term frequency)。 那么,这个查询和该网页的相关性就是:

TF1 + TF2 + ... + TFN。

读者可能已经发现了又一个漏洞。在上面的例子中,词“的”站了总词频的 80% 以上,而它对确定网页的主题几乎没有用。我们称这种词叫“应删除词”(Stopwords),也就是说在度量相关性是不应考虑它们的频率。在汉语中,应删除词还有“是”、“和”、“中”、“地”、“得”等等几十个。忽略这些应删除词后,上述网页的相似度就变成了0.007,其中“原子能”贡献了 0.002,“应用”贡献了 0.005。

细心的读者可能还会发现另一个小的漏洞。在汉语中,“应用”是个很通用的词,而“原子能”是个很专业的词,后者在相关性排名中比前者重要。因此我们需要给汉语中的每一个词给一个权重,这个权重的设定必须满足下面两个条件:

1. 一个词预测主题能力越强,权重就越大,反之,权重就越小。我们在网页中看到“原子能”这个词,或多或少地能了解网页的主题。我们看到“应用”一次,对主题基本上还是一无所知。因此,“原子能“的权重就应该比应用大。

2. 应删除词的权重应该是零。

我们很容易发现,如果一个关键词只在很少的网页中出现,我们通过它就容易锁定搜索目标,它的权重也就应该大。反之如果一个词在大量网页中出现,我们看到它仍然不很清楚要找什么内容,因此它应该小。概括地讲,假定一个关键词 w 在 Dw 个网页中出现过,那么 Dw 越大,w的权重越小,反之亦然。在信息检索中,使用最多的权重是“逆文本频率指数” (Inverse document frequency 缩写为IDF),它的公式为log(D/Dw)其中D是全部网页数。比如,我们假定中文网页数是D=10

亿,应删除词“的”在所有的网页中都出现,即Dw=10亿,那么它的IDF=log(10亿/10亿)= log (1) = 0。假如专用词“原子能”在两百万个网页中出现,即Dw=200万,则它的权重IDF=log(500) =6.2。又假定通用词“应用”,出现在五亿个网页中,它的权重IDF = log(2)

则只有 0.7。也就只说,在网页中找到一个“原子能”的比配相当于找到九个“应用”的匹配。利用 IDF,上述相关性计算个公式就由词频的简单求和变成了加权求和,即 TF1*IDF1 + TF2*IDF2 +... + TFN*IDFN。在上面的例子中,该网页和“原子能的应用”的相关性为 0.0161,其中“原子能”贡献了 0.0126,而“应用”只贡献了0.0035。这个比例和我们的直觉比较一致了。

TF/IDF(term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。在搜索、文献分类和其他相关领域有广泛的应用。讲起 TF/IDF 的历史蛮有意思。IDF 的概念最早是剑桥大学的斯巴克-琼斯[注:她有两个姓] (Karen Sparck Jones)提出来的。斯巴克-琼斯 1972年在一篇题为关键词特殊性的统计解释和她在文献检索中的应用的论文中提出IDF。遗憾的是,她既没有从理论上解释为什么权重IDF 应该是对数函数log(D/Dw)(而不是其它的函数,比如平方根),也没有在这个题目上作进一步深入研究,以至于在以后的很多文献中人们提到 TF/IDF时没有引用她的论文,绝大多数人甚至不知道斯巴克-琼斯的贡献。同年罗宾逊写了个两页纸的解释,解释得很不好。倒是后来康乃尔大学的萨尔顿(Salton)多次写文章、写书讨论 TF/IDF 在信息检索中的用途,加上萨尔顿本人的大名(信息检索的世界大奖就是以萨尔顿的名字命名的)。很多人都引用萨尔顿的书,甚至以为这个信息检索中最重要的概念是他提出的。当然,世界并没有忘记斯巴克-琼斯的贡献,2004年,在纪念文献学学报创刊 60 周年之际,该学报重印了斯巴克-琼斯的大作。罗宾逊在同期期刊上写了篇文章,用香农的信息论解释 IDF,这回的解释是对的,但文章写的并不好、非常冗长(足足十八页),把一个简单问题搞复杂了。其实,信息论的学者们已经发现并指出,其实 IDF 的概念就是一个特定条件下、关键词的概率分布的交叉熵(Kullback-Leibler Divergence)(详见上一系列)。这样,信息检索相关性的度量,又回到了信息论。

现在的搜索引擎对 TF/IDF 进行了不少细微的优化,使得相关性的度量更加准确了。当然,对有兴趣写一个搜索引擎的爱好者来讲,使用 TF/IDF 就足够了。 如果我们结合上网页排名(Page Rank),那么给

定一个查询,有关网页综合排名大致由相关性和网页排名乘积决定。

数学之美系列十:有限状态机和地址识别

地址的识别和分析是本地搜索必不可少的技术,尽管有许多识别和分析地址的方法,最有效的是有限状态机。

一个有限状态机是一个特殊的有向图(参见有关图论的系列),它包括一些状态(节点)和连接这些状态的有向弧。下图是一个识别中国地址的有限状态机的简单的例子。

每一个有限状态机都有一个启始状态和一个终止状态和若干中间状态。每一条弧上带有从一个状态进入下一个状态的条件。比如,在上图中,当前的状态是“省”,如果遇到一个词组和(区)县名有关,我们就进入状态“区县”;如果遇到的下一个词组和城市有关,那么我们就进入“市”的状态,如此等等。如果一条地址能从状态机的起始状态经过状态机的若干中间状态,走到终止状态,那么这条地址则有效,否则无效。比如说,“北京市双清路83号”对于上面的有限状态来讲有效,而 “上海市辽宁省马家庄”则无效(因为无法从市走回到省)。

使用有限状态机识别地址,关键要解决两个问题,即通过一些有效的地址建立状态机,以及给定一个有限状态机后,地址字串的匹配算法。好在这两个问题都有现成的算法。有了关于地址的有限状态机后,我们就可又用它分析网页,找出网页中的地址部分,建立本地搜索的数据库。同样,我们也可以对用户输入的查询进行分析,挑出其中描述地址的部分,当然,剩下的关键词就是用户要找的内容。比如,对于用户输入的“北京市双清路附近的酒家”,Google 本地会自动识别出地址“北京市双清路”和要找的对象“酒家”。

上述基于有限状态机的地址识别方法在实用中会有一些问题:当用户输入的地址不太标准或者有错别字时,有限状态机会束手无策,因为它只能进行严格匹配。(其实,有限状态机在计算机科学中早期的成功应用是在程序语言编译器的设计中。一个能运行的程序在语法上必须是没有错的,所以不需要模糊匹配。而自然语言则很随意,无法用简单的语法描述。)

为了解决这个问题,我们希望有一个能进行模糊匹配、并给出一个字串为正确地址的可能性。为了实现这一目的,科学家们提出了基于概率的有限状态机。这种基于概率的有限状态机和离散的马尔可夫链(详见前面关于马尔可夫模型的系列)基本上等效。

在八十年代以前,尽管有不少人使用基于概率的有限状态机,但都是为自己的应用设计专用的有限状态机的程序。九十年代以后,随着有限状态机在自然语言处理的广

泛应用,不少科学家致力于编写通用的有限状态机程序库。其中,最成功的是前 AT&T 实验室的三位科学家,莫瑞(Mohri), 皮瑞尔(Pereira) 和瑞利(Riley)。他们三人花了很多年时间,编写成一个通用的基于概率的有限状态机 C 语言工具库。由于 AT&T 有对学术界免费提供各种编程工具的好传统,他们三人也把自己多年的心血拿出来和同行们共享。可惜好景不长,AT&T 实验室风光不再,这三个人都离开了 AT&T,莫瑞成了纽约大学的教授,皮瑞尔当了宾西法尼亚大学计算机系系主任,而瑞利成了 Google 的研究员,AT&T 实验室的新东家不再免费提供有限状态机 C 语言工具库。虽然此前莫瑞等人公布了他们的详细算法,但是省略了实现的细节。因此在学术界,不少科学家能够重写同样功能的工具库,但是很难达到 AT&T 工具库的效率(即运算速度),这的确是一件令人遗憾的事。

数学之美系列十一:Google 阿卡 47 的制造者阿米特.辛格博士

枪迷或者看过尼古拉斯.凯奇(Nicolas Cage)主演的电影“战争之王”(Lord of

War)的人也许还记得影片开头的一段话:(在所有轻武器中,)最有名的是阿卡 47( AK47)冲锋枪(也就是中国的五六式冲锋枪的原型),因为它从不卡壳、从不损坏、可在任何环境下使用、可靠性好、杀伤力大并且操作简单。

我认为,在计算机中一个好的算法,应该向阿卡 47 冲锋枪那样简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该是故弄玄虚。Google 的杰出工程师阿米特.辛格博士 (Amit Singhal) 就是为 Google 设计阿卡 47 冲锋枪的人,在公司内部,Google 的排序算法便是以他的名字命名的。

从加入 Google 的第一天,我就开始了和辛格长期而愉快的合作,而他一直是我的一个良师益友。辛格、Matt Cutts(中国一些用户误认为他是联邦调查局特工,当然他不是)、马丁和我四个人当时一同研究和解决网络搜索中的作弊问题(Spam)。我们需要建一个分类器,我以前一直在学术界工作和学习,比较倾向找一个很漂亮的解决方案。我设计了一个很完美的分类器,大约要花三个月到半年时间来实现和训练,而辛格认为找个简单有效的办法就行了。我们于是尽可能简化问题,一、两个月就把作弊的数量减少了一半。当时我们和公司工程副总裁罗森打了个赌,如果我们能减少 40% 的作弊,他就送我们四个家庭去夏威夷度假,后来罗森真的履约了。这个分类器设计得非常小巧(只用很小的内存),而且非常快速(几台服务器就能处理全球搜索的分类),至今运行得很好。

后来我和辛格一起又完成了许多项目,包括对中、日、韩文排名算法的

改进。每一次,辛格总是坚持找简单有效的解决方案。这种做法在 Google 这个人才济济的公司常常招人反对,因为很多资深的工程师怀疑这些简单方法的有效性。不少人试图用精确而复杂的办法对辛格的设计的各种“阿卡47” 进行改进,后来发现几乎所有时候,辛格的简单方法都接近最优化的解决方案,而且还快得多。另一条选择简单方案的原因是这样设计的系统很容易查错(debug)。

当然,辛格之所以总是能找到那些简单有效的方法,不是靠直觉,更不是撞大运,而是靠他丰富的研究经验。辛格早年从师于搜索大师萨尔顿(Salton)教授,毕业后就职于 AT&T 实验室。在那里,他和两个同事半年就搭起了一个中等规模的搜索引擎,这个引擎索引的网页数量虽然无法和商用的引擎相比,但是准确性却非常好。在 AT&T,他对搜索问题的各个细节进行了仔细的研究,他的那些简单而有效的解决方案,常常是深思熟虑去伪存真的结果。

辛格非常鼓励年轻人不怕失败,大胆尝试。一次一位刚毕业不久的工程师因为把带有错误的程序推出到 Google 的服务器上而惶惶不可终日。辛格安慰她讲,你知道,我在 Google 犯的最大一次错误是曾经将所有网页的相关性得分全部变成了零,于是所有搜索的结果全部是随机的了。这位工程师后来为 Google 开发了很多好的产品。

辛格在 AT&T 时确立了他在学术界的地位,但是,他不是一个满足于做实验写论文的人,于是他离开了实验室来到了当时只有百、十人的 Google。在这里,他得以施展才智,重写了 Google 的排名算法,并且一直在负责改进它。辛格因为舍不得放下两个孩子,很少参加各种会议,但是他仍然被学术界公认为是当今最权威的网络搜索专家。2005年,辛格作为杰出校友被请回母校康乃尔大学计算机系在 40 年系庆上作报告,获得这一殊荣的还有大名鼎鼎的美国工程院院士,计算机独立磁盘冗余阵列(RAID)的发明人凯茨(Randy Katz) 教授。

数学之美系列十二:余弦定理和新闻的分类

当两条新闻向量夹角的余弦等于一时,这两条新闻完全重复(用这个办法可以删除重复的网页);当夹角的余弦接近于一时,两条新闻相似,从而可以归成一类;夹角的余弦越小,两条新闻越不相关。

余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有紧密的联系。具体说,新闻的分类很大程度上依靠余弦定理。

Google 的新闻是自动分类和整理的。所谓新闻的分类无非是要把相似的新闻放到一类中。计算机其实读不懂新闻,它只能快速计算。这就要求我们设计一个算法来算出任意两篇新闻的相似性。为了做到

这一点,我们需要想办法用一组数字来描述一篇新闻。

我们来看看怎样找一组数字,或者说一个向量来描述一篇新闻。回忆一下我们在“如何度量网页相关性” 一文中介绍的TF/IDF 的概念。对于一篇新闻中的所有实词,我们可以计算出它们的单文本词汇频率/逆文本频率值(TF/IDF)。不难想象,和新闻主题有关的那些实词频率高,TF/IDF 值很大。我们按照这些实词在词汇表的位置对它们的 TF/IDF 值排序。比如,词汇表有六万四千个词,分别为

单词编号 汉字词

------------------

1 阿

2 啊

3 阿斗

4 阿姨

...

789 服装

....

64000 做作

在一篇新闻中,这 64,000 个词的 TF/IDF 值分别为

单词编号 TF/IDF 值

==============

1 0

2 0.0034

3 0

4 0.00052

5 0

...

789 0.034

...

64000 0.075

如果单词表中的某个次在新闻中没有出现,对应的值为零,那么这 64,000 个数,组成一个64,000维的向量。我们就用这个向量来代表这篇新闻,并成为新闻的特征向量。如果两篇新闻的特征向量相近,则对应的新闻内容相似,它们应当归在一类,反之亦然。

学过向量代数的人都知道,向量实际上是多维空间中有方向的线段。如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角了。

余弦定理对我们每个人都不陌生,它描述了三角形中任何一个夹角和三个边的关系,换句话说,给定三角形的三条边,我们可以用余弦定理求出三角形各个角的角度。假定三角形的三条边为 a, b 和 c,对应的三个角为 A, B 和 C,那么角 A 的余弦 --

如果我们将三角形的两边 b 和 c 看成是两个向量,那么上述公式等价于

其中分母表示两个向量 b 和 c 的长度,分子表示两个向量的内积。举一个具体的例子,假如新闻 X 和新闻 Y 对应向量分别是

x1,x2,...,x64000 和

y1,y2,...,y64000,

那么它们夹角的余弦等于,

当两条新闻向量夹角的余弦等于一时,这两条新闻完全重复(用这个办法可以删除重复的网页);当夹角的余弦接近于一时,两条新闻相似,从而可以归成一类;夹角的余弦越小,两条新闻越不相关。

我们在中学学习余弦定理时,恐怕很难想象它可以用来对新闻进行分类。在这里,我们再一次看到数学工具的用途。

数学之美系列十三:信息指纹及其应用

任何一段信息文字,都可以对应一个不太长的随机数,作为区别它和其它信息的指纹(Fingerprint)。只要算法设计的好,任何两段信息的指纹都很难重复,就如同人类的指纹一样。信息指纹在加密、信息压缩和处理中有着广泛的应用。

我们在图论和网络爬虫一

文中提到,为了防止重复下载同一个网页,我们需要在哈希表中纪录已经访问过的网址(URL)。但是在哈希表中以字符串的形式直接存储网址,既费内存空间,又浪费查找时间。现在的网址一般都较长,比如,如果在 Google 或者百度在查找数学之美,对应的网址长度在一百个字符以上。下面是百度的链接

http:///s?ie=gb2312&bs=%CA%FD%D1%A7%D6%AE%C3%C0&sr=&z=&cl=3&f=8

&wd=%CE%E2%BE%FC+%CA%FD%D1%A7%D6%AE%C3%C0&ct=0

假定网址的平均长度为一百个字符,那么存贮 200 亿个网址本身至少需要 2 TB,即两千 GB 的容量,考虑到哈希表的存储效率一般只有 50%,实际需要的内存在 4 TB以上。即使把这些网址放到了计算机的内存中,由于网址长度不固定,以字符串的形式查找的效率会很低。因此,我们如果能够找到一个函数,将这 200 亿个网址随机地映射到128 二进位即 16 个字节的整数空间,比如将上面那个很长的字符串对应成一个如下的随机数:

893249432984398432980545454543

这样每个网址只需要占用 16 个字节而不是原来的一百个。这就能把存储网址的内存需求量降低到原来的 1/6。这个16 个字节的随机数,就称做该网址的信息指纹(Fingerprint)。可以证明,只要产生随机数的算法足够好,可以保证几乎不可能有两个字符串的指纹相同,就如同不可能有两个人的指纹相同一样。由于指纹是固定的 128 位整数,因此查找的计算量比字符串比较小得多。网络爬虫在下载网页时,它将访问过的网页的网址都变成一个个信息指纹,存到哈希表中,每当遇到一个新网址时,计算机就计算出它的指纹,然后比较该指纹是否已经在哈希表中,来决定是否下载这个网页。这种整数的查找比原来字符串查找,可以快几倍到几十倍。

产生信息指纹的关键算法是伪随机数产生器算法(prng)。最早的 prng 算法是由计算机之父冯诺伊曼提出来的。他的办法非常简单,就是将一个数的平方掐头去尾,取中间的几位数。比如一个四位的二进制数 1001(相当于十进制的9),其平方为 01010001 (十进制的 81)掐头去尾剩下中间的四位 0100。当然这种方法产生的数字并不很随机,也就是说两个不同信息很有可能有同一指纹。现在常用的 MersenneTwister 算法要好得多。

信息指纹的用途远不止网址的消重,信息指纹的的孪生兄弟是密码。信息指纹的一个特征是其不可逆性, 也就是说,无法根据信息指纹推出原有信息,这种性质,正是网络加密传输所需要的。比如说,一个网站可以根据用户的Cookie 识别不同用户,这个 cookie 就是信息指纹。但是网站无法根据信息指纹了解用户的身份,这样就可以保护用户的隐私。在互

联网上,加密的可靠性,取决于是否很难人为地找到拥有同一指纹的信息, 比如一个黑客是否能随意产生用户的 cookie。从加密的角度讲 MersenneTwister,算法并不好,因为它产生的随机数有相关性。

互联网上加密要用基于加密伪随机数产生器(csprng)。常用的算法有 MD5 或者 SHA1 等标准,它们可以将不定长的信息变成定长的 128 二进位或者 160 二进位随机数。值得一提的事,SHA1 以前被认为是没有漏洞的,现在已经被中国的王小云教授证明存在漏洞。但是大家不必恐慌,因为这和黑客能真正攻破你的注册信息是还两回事。

信息指纹的虽然历史很悠久,但真正的广泛应用是在有了互联网以后,这几年才渐渐热门起来。

数学之美十四:谈谈数学模型的重要性

[注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,今年七月份我在 Google 中国内部讲课时用了整整一堂课来讲这个问题,下面的内容是我讲座的摘要。]

在包括哥白尼、伽利略和牛顿在内的所有天文学家中,我最佩服的是地心说的提出者托勒密。虽然天文学起源于古埃及,并且在古巴比伦时,人们就观测到了五大行星(金、木、水、火、土)运行的轨迹,以及行星在近日点运动比远日点快。(下图是在地球上看到的金星的轨迹,看过达芬奇密码的读者知道金星大约每四年在天上画一个五角星。)

但是真正创立了天文学,并且计算出诸多天体运行轨迹的是两千年前古罗马时代的托勒密。虽然今天我们可能会嘲笑托勒密犯的简单的错误,但是真正了解托勒密贡献的人都会对他肃然起敬。托勒密发明了球坐标,定义了包括赤道和零度经线在内的经纬线,他提出了黄道,还发明了弧度制。

当然,他最大也是最有争议的发明是地心说。虽然我们知道地球是围绕太阳运动的,但是在当时,从人们的观测出发,很容易得到地球是宇宙中心的结论。从地球上看,行星的运动轨迹是不规则的,托勒密的伟大之处是用四十个小圆套大圆的方法,精确地计算出了所有行星运动的轨迹。(托勒密继承了毕达格拉斯的一些思想,他也认为圆是最完美的几何图形。)托勒密模型的精度之高,让以后所有的科学家惊叹不已。即使今天,我们在计算机的帮助下,也很难解出四十个套在一起的圆的方程。每每想到这里,我都由衷地佩服托勒密。一千五百年来,人们根据他的计算决定农时。但是,经过了一千五百年,托勒密对太阳运动的累积误差,还是差出了一星期。

地心说的示意图,我国天文学家张衡的浑天地动说其实就

是地心说。

纠正地心说错误不是靠在托勒密四十个圆的模型上再多套上几个圆,而是进一步探索真理。哥白尼发现,如果以太阳为中心来描述星体的运行,只需要 8-10 个圆,就能计算出一个行星的运动轨迹,他提出了日心说。很遗憾的事,哥白尼正确的假设并没有得到比托勒密更好的结果,哥白尼的模型的误差比托勒密地要大不少。这是教会和当时人们认为哥白尼的学说是邪说的一个原因,所以日心说要想让人心服口服地接受,就得更准确地描述行星运动。

完成这一使命的是开普勒。开普勒在所有一流的天文学家中,资质较差,一生中犯了无数低级的错误。但是他有两条别人没有的东西,从他的老师第谷手中继承的大量的、在当时最精确的观测数据,以及运气。开普勒很幸运地发现了行星围绕太阳运转的轨道实际是椭圆形的,这样不需要用多个小圆套大圆,而只要用一个椭圆就能将星体运动规律描述清楚了。只是开普勒的知识和水平不足以解释为什么行星的轨道是椭圆形的。最后是伟大的科学家牛顿用万有引力解释了这个问题。

故事到这里似乎可以结束了。但是,许多年后,又有了个小的波澜。天文学家们发现,天王星的实际轨迹和用椭圆模型算出来的不太符合。当然,偷懒的办法是接着用小圆套大圆的方法修正,但是一些严肃的科学家在努力寻找真正的原因。英国的亚当斯和法国的维内尔(Verrier)独立地发现了吸引天王星偏离轨道的海王星。

讲座结束前,我和 Google 中国的工程师们一同总结了这么几个结论:

1. 一个正确的数学模型应当在形式上是简单的。(托勒密的模型显然太复杂。)

2. 一个正确的模型在它开始的时候可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。(日心说开始并没有地心说准确。)

3. 大量准确的数据对研发很重要。

4. 正确的模型也可能受噪音干扰,而显得不准确;这时我们不应该用一种凑合的修正方法来弥补它,而是要找到噪音的根源,这也许能通往重大发现。

在网络搜索的研发中,我们在前面提到的单文本词频/逆文本频率指数(TF/IDF) 和网页排名(page rank)都相当于是网络搜索中的“椭圆模型”,它们都很简单易懂。

数学之美系列十五:繁与简 自然语言处理的几位精英

我在数学之美系列中一直强调的一个好方法就是简单。但是,事实上,自然语言处理中也有一些特例,比如有些学者将一个问题研究到极致,执著追求完善甚至可以说完美的程度。他们的工作对同行有很大的参考价值,因此我们在科研中很需要这

样的学者。在自然语言处理方面新一代的顶级人物麦克尔 · 柯林斯 (Michael Collins) 就是这样的人。

柯林斯:追求完美

柯林斯从师于自然语言处理大师马库斯 (Mitch Marcus)(我们以后还会多次提到马库斯),从宾夕法利亚大学获得博士学位,现任麻省理工学院 (MIT) 副教授(别看他是副教授,他的水平在当今自然语言处理领域是数一数二的),在作博士期间,柯林斯写了一个后来以他名字命名的自然语言文法分析器 (sentence parser),可以将书面语的每一句话准确地进行文法分析。文法分析是很多自然语言应用的基础。虽然柯林斯的师兄布莱尔 (Eric Brill) 和 Ratnaparkhi 以及师弟 Eisnar 都完成了相当不错的语言文法分析器,但是柯林斯却将它做到了极致,使它在相当长一段时间内成为世界上最好的文法分析器。柯林斯成功的关键在于将文法分析的每一个细节都研究得很仔细。柯林斯用的数学模型也很漂亮,整个工作可以用完美来形容。我曾因为研究的需要,找柯林斯要过他文法分析器的源程序,他很爽快地给了我。我试图将他的程序修改一下来满足我特定应用的要求,但后来发现,他的程序细节太多以至于很难进一步优化。柯林斯的博士论文堪称是自然语言处理领域的范文。它像一本优秀的小说,把所有事情的来龙去脉介绍的清清楚楚,对于任何有一点计算机和自然语言处理知识的人,都可以轻而易举地读懂他复杂的方法。

柯林斯毕业后,在 AT&T 实验室度过了三年快乐的时光。在那里柯林斯完成了许多世界一流的研究工作诸如隐含马尔科夫模型的区别性训练方法,卷积核在自然语言处理中的应用等等。三年后,AT&T 停止了自然语言处理方面的研究,柯林斯幸运地在 MIT 找到了教职。在 MIT 的短短几年间,柯林斯多次在国际会议上获得最佳论文奖。相比其他同行,这种成就是独一无二的。柯林斯的特点就是把事情做到极致。如果说有人喜欢“繁琐哲学”,柯林斯就是一个。

布莱尔:简单才美

在研究方法上,站在柯林斯对立面的典型是他的师兄艾里克 · 布莱尔 (Eric Brill) 和雅让斯基,后者我们已经介绍过了,这里就不再重复。与柯林斯从工业界到学术界相反,布莱尔职业路径是从学术界走到工业界。与柯里斯的研究方法相反,布莱尔总是试图寻找简单得不能再简单的方法。布莱尔的成名作是基于变换规则的机器学习方法 (transformation rule based machine learning)。这个方法名称虽然很复杂,其实非常简单。我们以拼音转换字为例来说明它:

第一步,我们把每个拼音对应的汉字中最常见的找出来作为第一遍变换的结果,当然结果有不少错误。

比如,“常识”可能被转换成“长识”;

第二步,可以说是“去伪存真”,我们用计算机根据上下文,列举所有的同音字替换的规则,比如,如果 chang 被标识成“长”,但是后面的汉字是“识”,则将“长”改成“常”;

第三步,应该就是“去粗取精”,将所有的规则用到事先标识好的语料中,挑出有用的,删掉无用的。然后重复二三步,直到找不到有用的为止。

布莱尔就靠这么简单的方法,在很多自然语言研究领域,得到了几乎最好的结果。由于他的方法再简单不过了,许许多多的人都跟着学。布莱尔可以算是我在美国的第一个业师,我们俩就用这么简单的方法作词性标注 (part of speech tagging),也就是把句子中的词标成名词动词,很多年内无人能超越。(最后超越我们的是后来加入 Google 的一名荷兰工程师,用的是同样的方法,但是做得细致很多)布莱尔离开学术界后去了微软研究院。在那里的第一年,他一人一年完成的工作比组里其他所有人许多年做的工作的总和还多。后来,布莱尔又加入了一个新的组,依然是高产科学家。据说,他的工作真正被微软重视要感谢 Google,因为有了 Google,微软才对他从人力物力上给于了巨大的支持,使得布莱尔成为微软搜索研究的领军人物之一。在研究方面,布莱尔有时不一定能马上找到应该怎么做,但是能马上否定掉一种不可能的方案。这和他追求简单的研究方法有关,他能在短时间内大致摸清每种方法的好坏。

由于布莱尔总是找简单有效的方法,而又从不隐瞒自己的方法,所以他总是很容易被包括作者我自己在内的很多人赶上和超过。好在布莱尔很喜欢别人追赶他,因为,当人们在一个研究方向超过他时,他已经调转船头驶向它方了。一次,艾里克对我说,有一件事我永远追不上他,那就是他比我先有了第二个孩子 :)

在接下来了系列里,我们还会介绍一个繁与简结合的例子。

数学之美系列十六:不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵

[我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为最大熵原理(the maximum entropy principle)。这是一个非常有意思的题目,但是把它讲清楚要用两个系列的篇幅。]

前段时间,Google 中国研究院的刘骏总监谈到在网络搜索排名中,用到的信息有上百种。更普遍地讲,在自然语言处理中,我们常常知道各种各样的但是又不完全确定的信息,我们需要用一个统一的模型将这些信息综合起来。如何综合得好,是一门很大的学问。

让我们看一个拼音转

汉字的简单的例子。假如输入的拼音是布的信息熵最大,所以人们称这种模型叫“最大熵模型”。我们常说,不要把所有的鸡蛋放在一个篮子里,其实就是最大熵原理的一个朴素的说法,因为当我们遇到不确定性时,就要保留各种可能性。

回到我们刚才谈到的拼音转汉字的例子,我们已知两种信息,第一,根据语言模型,wang-xiao-bo 可以被转换成王晓波和王小波;第二,根据主题,王小波是作家,《黄金时代》的作者等等,而王晓波是台湾研究两岸关系的学者。因此,我们就可以建立一个最大熵模型,同时满足这两种信息。现在的问题是,这样一个模型是否存在。匈牙利著名数学家、信息论最高奖香农奖得主希萨(Csiszar)证明,对任何一组不自相矛盾的信息,这个最大熵模型不仅存在,而且是唯一的。而且它们都有同一个非常简单的形式 -- 指数函数。下面公式是根据上下文(前两个词)和主题预测下一个词的最大熵模型,其中 w3 是要预测的词(王晓波或者王小波)w1 和 w2 是它的前两个字(比如说它们分别是“出版”,和“”),也就是其上下文的一个大致估计,subject 表示主题。

我们看到,在上面的公式中,有几个参数 lambda 和 Z ,他们需要通过观测数据训练出来。

最大熵模型在形式上是最漂亮的统计模型,而在实现上是最复杂的模型之一。我们在将下一个系列中介绍如何训练最大熵模型的诸多参数,以及最大熵模型在自然语言处理和金融方面很多有趣的应用。

数学之美系列十六(下)- 不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型

上面用最大熵模型可以将各种信息综合在一起。我们留下一个问题没有回答,就是如何构造最大熵模型。我们已经所有的最大熵模型都是指数函数的形式,现在只需要确定指数函数的参数就可以了,这个过程称为模型的训练。

最原始的最大熵模型的训练方法是一种称为通用迭代算法 GIS(generalized iterative scaling) 的迭代 算法。GIS 的原理并不复杂,大致可以概括为以下几个步骤:

1. 假定第零次迭代的初始模型为等概率的均匀分布。

2. 用第 N 次迭代的模型来估算每种信息特征在训练数据中的分布,如果超过了实际的,就把相应的模型参数变小;否则,将它们便大。

3. 重复步骤 2 直到收敛。

GIS 最早是由 Darroch 和 Ratcliff 在七十年代提出的。但是,这两人没有能对这种算法的物理含义进行很好地解释。后来是由数学家希萨(Csiszar)解释清楚的,因此,人们在谈到这个算法时,总是同时引用 Darroch 和Ratcliff 以及希萨的两篇论文。GIS 算法每次迭代的时间都很长,需要迭代很多次才能收敛,而且不太稳定,即使在 64 位计算

机上都会出现溢出。因此,在实际应用中很少有人真正使用 GIS。大家只是通过它来了解最大熵模型的算法。

八十年代,很有天才的孪生兄弟的达拉皮垂(Della Pietra)在 IBM 对 GIS 算法进行了两方面的改进,提出了改进迭代算法 IIS(improved iterative scaling)。这使得最大熵模型的训练时间缩短了一到两个数量级。这样最大熵模型才有可能变得实用。即使如此,在当时也只有 IBM 有条件是用最大熵模型。

由于最大熵模型在数学上十分完美,对科学家们有很大的诱惑力,因此不少研究者试图把自己的问题用一个类似最大熵的近似模型去套。谁知这一近似,最大熵模型就变得不完美了,结果可想而知,比打补丁的凑合的方法也好不了多少。于是,不少热心人又放弃了这种方法。第一个在实际信息处理应用中验证了最大熵模型的优势的,是宾夕法尼亚大学马库斯的另一个高徒原 IBM 现微软的研究员拉纳帕提(Adwait Ratnaparkhi)。拉纳帕提的聪明之处在于他没有对最大熵模型进行近似,而是找到了几个最适合用最大熵模型、而计算量相对不太大的自然语言处理问题,比如词性标注和句法分析。拉纳帕提成功地将上下文信息、词性(名词、动词和形容词等)、句子成分(主谓宾)通过最大熵模型结合起来,做出了当时世界上最好的词性标识系统和句法分析器。拉纳帕提的论文发表后让人们耳目一新。拉纳帕提的词性标注系统,至今仍然是使用单一方法最好的系统。科学家们从拉纳帕提的成就中,又看到了用最大熵模型解决复杂的文字信息处理的希望。

但是,最大熵模型的计算量仍然是个拦路虎。我在学校时花了很长时间考虑如何简化最大熵模型的计算量。终于有一天,我对我的导师说,我发现一种数学变换,可以将大部分最大熵模型的训练时间在 IIS 的基础上减少两个数量级。我在黑板上推导了一个多小时,他没有找出我的推导中的任何破绽,接着他又回去想了两天,然后告诉我我的算法是对的。从此,我们就建造了一些很大的最大熵模型。这些模型比修修补补的凑合的方法好不少。即使在我找到了快速训练算法以后,为了训练一个包含上下文信息,主题信息和语法信息的文法模型(language model),我并行使用了 20 台当时最快的 SUN 工作站,仍然计算了三个月。由此可见最大熵模型的复杂的一面。最大熵模型快速算法的实现很复杂,到今天为止,世界上能有效实现这些算法的人也不到一百人。有兴趣实现一个最大熵模型的读者可以阅读我的论文。

最大熵模型,可以说是集简与繁于一体,形式简单,实现复杂。值得一提的是,在Google的很多产品中,比

如机器翻译,都直接或间接地用到了最大熵模型。

讲到这里,读者也许会问,当年最早改进最大熵模型算法的达拉皮垂兄弟这些年难道没有做任何事吗?他们在九十年代初贾里尼克离开 IBM 后,也退出了学术界,而到在金融界大显身手。他们两人和很多 IBM 语音识别的同事一同到了一家当时还不大,但现在是世界上最成功对冲基金(hedge fund)公司----文艺复兴技术公司 (Renaissance Technologies)。我们知道,决定股票涨落的因素可能有几十甚至上百种,而最大熵方法恰恰能找到一个同时满足成千上万种不同条件的模型。达拉皮垂兄弟等科学家在那里,用于最大熵模型和其他一些先进的数学工具对股票预测,获得了巨大的成功。从该基金 1988 年创立至今,它的净回报率高达平均每年 34%。也就是说,如果 1988 年你在该基金投入一块钱,今天你能得到 200 块钱。这个业绩,远远超过股神巴菲特的旗舰公司伯克夏哈撒韦(Berkshire Hathaway)。同期,伯克夏哈撒韦的总回报是 16 倍。

值得一提的是,信息处理的很多数学手段,包括隐含马尔可夫模型、子波变换、贝叶斯网络等等,在华尔街多有直接的应用。由此可见,数学模型的作用。

数学之美系列十七:闪光的不一定是金子 谈谈搜索引擎作弊问题

自从有了搜索引擎,就有了针对搜索引擎网页排名的作弊(SPAM)。以至于用户发现在搜索引擎中排名靠前的网页不一定就是高质量的,用句俗话说,闪光的不一定是金子。

搜索引擎的作弊,虽然方法很多,目的只有一个,就是采用不正当手段提高自己网页的排名。早期最常见的作弊方法是重复关键词。比如一个卖数码相机的网站,重复地罗列各种数码相机的品牌,如尼康、佳能和柯达等等。为了不让读者看到众多讨厌的关键词,聪明一点的作弊者常用很小的字体和与背景相同的颜色来掩盖这些关键词。其实,这种做法很容易被搜索引擎发现并纠正。

在有了网页排名(page rank)以后,作弊者发现一个网页被引用的连接越多,排名就可能越靠前,于是就有了专门卖链接和买链接的生意。比如,有人自己创建成百上千个网站,这些网站上没有实质的内容,只有到他们的客户网站的连接。这种做法比重复关键词要高明得多,但是还是不太难被发现。因为那些所谓帮别人提高排名的网站,为了维持生意需要大量地卖链接,所以很容易露马脚。(这就如同造假钞票,当某一种假钞票的流通量相当大以后,就容易找到根源了。)再以后,又有了形形色色的作弊方式,我们就不在这里一一赘述了。

几年前,我加入Google做的第一件事就是消除网络作弊。在Google最早发现

搜索引擎作弊的是Matt Cutts,他在我加入Google前几个月开始研究这个问题,后来,辛格,马丁和我先后加入进来。我们经过几个月的努力,清除了一半的作弊者。(当然,以后抓作弊的效率就不会有这么高了。)其中一部分网站从此是自动的一样。一个网站要想长期排名靠前,就需要把内容做好,同时要和那些作弊网站划清界限。

数学之美 系列十八 - 矩阵运算和文本处理中的分类问题

我在大学学习线性代数时,实在想不出它除了告诉我们如何解线性方程外,还能有什么别的用途。关于矩阵的许多概念,比如特征值等等,更是脱离日常生活。后来在数值分析中又学了很多矩阵的近似算法,还是看不到可以应用的地方。当时选这些课,完全是为了混学分的学位。我想,很多同学都多多少少有过类似的经历。直到后来长期做自然语言处理的研究,我才发现数学家们提出那些矩阵的概念和算法,是有实际应用的意义的。

在自然语言处理中,最常见的两类的分类问题分别是,将文本按主题归类(比如将所有介绍亚运会的新闻归到体育类)和将词汇表中的字词按意思归类(比如将各种体育运动的名称个归成一类)。这两种分类问题都可用通过矩阵运算来圆满地、同时解决。为了说明如何用矩阵这个工具类解决这两个问题的,让我们先来来回顾一下我们在余弦定理和新闻分类中介绍的方法。

分类的关键是计算相关性。我们首先对两个文本计算出它们的内容词,或者说实词的向量,然后求这两个向量的夹角。当这两个向量夹角为零时,新闻就相关;当它们垂直或者说正交时,新闻则无关。当然,夹角的余弦等同于向量的内积。从理论上讲,这种算法非常好。但是计算时间特别长。通常,我们要处理的文章的数量都很大,至少在百万篇以上,二次回标有非常长,比如说有五十万个词(包括人名地名产品名称等等)。如果想通过对一百万篇文章两篇两篇地成对比较,来找出所有共同主题的文章,就要比较五千亿对文章。现在的计算机一秒钟最多可以比较一千对文章,完成这一百万篇文章相关性比较就需要十五年时间。注意,要真正完成文章的分类还要反复重复上述计算。

在文本分类中,另一种办法是利用矩阵运算中的奇异值分解(Singular Value Decomposition,简称 SVD)。现在让我们来看看奇异值分解是怎么回事。首先,我们可以用一个大矩阵A来描述这一百万篇文章和五十万词的关联性。这个矩阵中,每一行对应一篇文章,每一列对应一个词。

在上面的图中,M=1,000,000,N=500,000。第 i 行,第 j 列的元素,是字典中第 j 个词在第 i 篇文章中出现的加权词频(比如,TF/IDF)。读者可能已经注意到了,这个矩阵非常大,有一百万乘以五十万,即五千亿个元素。

奇异值分解就是把上面这样一个大矩阵,分解成三个小矩阵相乘,如下图所示。比如把上面的例子中的矩阵分

解成一个一百万乘以一百的矩阵X,一个一百乘以一百的矩阵B,和一个一百乘以五十万的矩阵Y。这三个矩阵的元素总数加起来也不过1.5亿,仅仅是原来的三千分之一。相应的存储量和计算量都会小三个数量级以上。

三个矩阵有非常清楚的物理含义。第一个矩阵X中的每一行表示意思相关的一类词,其中的每个非零元素表示这类词中每个词的重要性(或者说相关性),数值越大越相关。最后一个矩阵Y中的每一列表示同一主题一类文章,其中每个元素表示这类文章中每篇文章的相关性。中间的矩阵则表示类词和文章雷之间的相关性。因此,我们只要对关联矩阵A进行一次奇异值分解,w 我们就可以同时完成了近义词分类和文章的分类。(同时得到每类文章和每类词的相关性)。

现在剩下的唯一问题,就是如何用计算机进行奇异值分解。这时,线性代数中的许多概念,比如矩阵的特征值等等,以及数值分析的各种算法就统统用上了。在很长时间内,奇异值分解都无法并行处理。(虽然 Google 早就有了MapReduce 等并行计算的工具,但是由于奇异值分解很难拆成不相关子运算,即使在 Google 内部以前也无法利用并行计算的优势来分解矩阵。)最近,Google 中国的张智威博士和几个中国的工程师及实习生已经实现了奇异值分解的并行算法,我认为这是 Google 中国对世界的一个贡献。

数学之美 系列十九 - 马尔可夫链的扩展 贝叶斯网络 (Bayesian Networks)

我们在前面的系列中多次提到马尔可夫链 (Markov

Chain),它描述了一种状态序列,其每个状态值取决于前面有限个状态。这种模型,对很多实际问题来讲是一种很粗略的简化。在现实生活中,很多事物相互的关系并不能用一条链来串起来。它们之间的关系可能是交叉的、错综复杂的。比如在下图中可以看到,心血管疾病和它的成因之间的关系是错综复杂的。显然无法用一个链来表示。

我们可以把上述的有向图看成一个网络,它就是贝叶斯网络。其中每个圆圈表示一个状态。状态之间的连线表示它们的因果关系。比如从心血管疾病出发到吸烟的弧线表示心血管疾病可能和吸烟有关。当然,这些关系可以有一个量化的可信度 (belief),用一个概率描述。我们可以通过这样一张网络估计出一个人的心血管疾病的可能性。在网络中每个节点概率的计算,可以用贝叶斯公式来进行,贝叶斯网络因此而得名。由于网络的每个弧有一个可信度,贝叶斯网络也被称作信念网络 (belief networks)。

和马尔可夫链类似,贝叶斯网络中的每个状态值取决于前面有限个状态。不同的是,贝叶斯网络比马尔可夫链灵活,它

不受马尔可夫链的链状结构的约束,因此可以更准确地描述事件之间的相关性。可以讲,马尔可夫链是贝叶斯网络的特例,而贝叶斯网络是马尔可夫链的推广。

使用贝叶斯网络必须知道各个状态之间相关的概率。得到这些参数的过程叫做训练。和训练马尔可夫模型一样,训练贝叶斯网络要用一些已知的数据。比如在训练上面的网络,需要知道一些心血管疾病和吸烟、家族病史等有关的情况。相比马尔可夫链,贝叶斯网络的训练比较复杂,从理论上讲,它是一个 NP-complete 问题,也就是说,对于现在的计算机是不可计算的。但是,对于某些应用,这个训练过程可以简化,并在计算上实现。

值得一提的是 IBM Watson 研究所的茨威格博士 (Geoffrey Zweig) 和西雅图华盛顿大学的比尔默 (Jeff Bilmes) 教授完成了一个通用的贝叶斯网络的工具包,提供给对贝叶斯网络有兴趣的研究者。

贝叶斯网络在图像处理、文字处理、支持决策等方面有很多应用。在文字处理方面,语义相近的词之间的关系可以用一个贝叶斯网络来描述。我们利用贝叶斯网络,可以找出近义词和相关的词,在 Google 搜索和 Google 广告中都有直接的应用。

数学之美 系列二十 -自然语言处理的教父 马库斯

我们在前面的系列中介绍和提到了一些年轻有为的科学家,迈克尔·柯林斯,艾里克·布莱尔,大卫·雅让斯基,拉纳帕提等等,他们都出自宾夕法尼亚计算机系米奇·马库斯(Mitch Marcus)名下。就像许多武侠小说中描写的,弟子都成了各派的掌门,师傅一定了不得。的确,马库斯虽然作为第一作者发表的论文并不多,但是从很多角度上讲,他可以说是自然语言处理领域的教父。

马库斯教授长期当任宾夕法尼亚大学计算机系主任,直到他在几年前从 AT&T 找到皮耶尔替代他为止。作为一个管理者,马库斯显示出在自然处理和计算机科学方面的卓识的远见。在指导博士生时,马库斯发现语料库在自然语言处理中的重要性。马库斯呕心沥血,花了十几年工夫建立了一系列标准的语料库,提供给全世界的学者使用。这套被称为 LDC 的语料库,是当今全世界自然语言处理的所有学者都使用的工具。我们在以前的系列中讲到,当今的自然语言处理几乎都是使用给予统计的方法。要做统计,就需要大量有代表性的数据。利用这些数据开发一个自然语言处理系统的过程,可以统称为训练。比如,我们要训练一个汉语分词系统,我们需要一些已经分好词的中文句子。当然这些句子需要有代表性。如果想知道一个分词系统的准确性,我们也需要一些人工分好词的句子进行测试。这些人工处理好的文

字数据库,成为语料库 (corpus)。如果每个研究室都人工建立几个语料库,不仅浪费时间精力,而且发表文章时,数据没有可比性。因此,马库斯想到了建立一系列标准的语料库为全世界的学者用。他利用自己的影响力让美国自然科学基金会和 DARPA 出钱立项,联络的多所大学和研究机构,建立的数百个标准的语料库。其中最著名的是 PennTree

Bank 的语料库。PennTree Bank 覆盖多种语言(包括中文)。每一种语言,它有几十万到几百万字的有代表性的句子,每个句子都有的词性标注,语法分析树等等。LDC 语料库如今已成为全世界自然语言处理科学家共用的数据库。如今,在自然语言处理方面发表论文,几乎都要提供基于 LDC 语料库的测试结果。

马库斯给予他的博士生研究自己感兴趣的课题的自由,这是他之所以桃李满天下的原因。马库斯对几乎所有的自然语言处理领域有独到的见解。和许多教授让博士生去做他拿到基金的项目,马库斯让博士生提出自己有兴趣的课题,或者用他已有的经费支持学生,或者为他们的项目区申请经费。马库斯高屋建瓴,能够很快的判断一个研究方向是否正确,省去了博士生很多 try-and-error 的时间。因此他的学生有些很快地拿到的博士学位。

作为系主任,马库斯在专业设置方面显示出卓识的远见。我有幸和他在同一个校务顾问委员会任职,一起讨论计算机系的研究方向。马库斯在几年前互联网很热门、很多大学开始互联网研究时,看到 bioinformatics (生物信息学)的重要性,在宾夕法利亚大学设置这个专业,并且在其他大学还没有意识到时,开始招聘这方面的教授。马库斯还建议一些相关领域的教授,包括后来的系主任皮耶尔把一部分精力转到生物信息学方面。马库斯同时向他担任顾问的其他一些大学提出同样的建议。等到网络泡沫破裂以后,很多大学的计算机系开始向生物信息学转向,但是发现已经很难找到这些方面好的教授了。我觉得,当今中国的大学,最需要的就是马库斯这样卓有远见的管理者。

过几天我又要和马库斯一起开顾问委员会的会议了,不知道这次他对计算机科学的发展有什么见解。

数学之美系列二十一 - 布隆过滤器(Bloom Filter)

在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断它是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直接的方法就是将集合中全部的元素存在计算机中,遇到一个新元

素时,将它和集合中的元素直接比较即可。一般来讲,计算机中的集合是用哈希表(hash table)来存储的。它的好处是快速准确,缺点是费存储空间。当集合比较小时,这个问题不显著,但是当集合巨大时,哈希表存储效率低的问题就显现出来了。比如说,一个象 Yahoo,Hotmail 和 Gmai 那样的公众电子邮件(email)提供商,总是需要过滤来自发送垃圾邮件的人(spamer)的垃圾邮件。一个办法就是记录下那些发垃圾邮件的 email 地址。由于那些发送者不停地在注册新的地址,全世界少说也有几十亿个发垃圾邮件的地址,将他们都存起来则需要大量的网络服务器。如果用哈希表,每存储一亿个 email 地址, 就需要 1.6GB 的内存(用哈希表实现的具体办法是将每一个 email 地址对应成一个八字节的信息指纹 googlechinablog.com/2006/08/blog-post.html,然后将这些信息指纹存入哈希表,由于哈希表的存储效率一般只有 50%,因此一个 email 地址需要占用十六个字节。一亿个地址大约要 1.6GB, 即十六亿字节的内存)。因此存贮几十亿个邮件地址可能需要上百 GB 的内存。除非是超级计算机,一般服务器是无法存储的。

今天,我们介绍一种称作布隆过滤器的数学工具,它只需要哈希表 1/8 到 1/4 的大小就能解决同样的问题。

布隆过滤器是由巴顿.布隆于一九七零年提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。我们通过上面的例子来说明起工作原理。

假定我们存储一亿个电子邮件地址,我们先建立一个十六亿二进制(比特),即两亿字节的向量,然后将这十六亿个二进制全部设置为零。对于每一个电子邮件地址 X,我们用八个不同的随机数产生器(F1,F2, ...,F8) 产生八个信息指纹(f1, f2, ..., f8)。再用一个随机数产生器 G 把这八个信息指纹映射到 1 到十六亿中的八个自然数 g1, g2, ...,g8。现在我们把这八个位置的二进制全部设置为一。当我们对这一亿个 email 地址都进行这样的处理后。一个针对这些 email 地址的布隆过滤器就建成了。(见下图)

现在,让我们看看如何用布隆过滤器来检测一个可疑的电子邮件地址 Y 是否在黑名单中。我们用相同的八个随机数产生器(F1, F2, ..., F8)对这个地址产生八个信息指纹 s1,s2,...,s8,然后将这八个指纹对应到布隆过滤器的八个二进制位,分别是 t1,t2,...,t8。如果 Y 在黑名单中,显然,t1,t2,..,t8 对应的八个二进制一定是一。这样在遇到任何在黑名单中的电子邮件地址,我们都能准确地发现。

布隆过滤器决不会漏掉任何一个在黑名单中的可疑地址。但是,它有一条不足之处。也就是它有极小的可能将一个不在

黑名单中的电子邮件地址判定为在黑名单中,因为有可能某个好的邮件地址正巧对应个八个都被设置成一的二进制位。好在这种可能性很小。我们把它称为误识概率。在上面的例子中,误识概率在万分之一以下。

布隆过滤器的好处在于快速,省空间。但是有一定的误识别率。常见的补救办法是在建立一个小的白名单,存储那些可能别误判的邮件地址。

数学之美系列二十二 由电视剧《暗算》所想到的 — 谈谈密码学的数学原理

前一阵子看了电视剧《暗算》,蛮喜欢它的构思和里面的表演。其中有一个故事提到了密码学,故事本身不错,但是有点故弄玄虚。不过有一点是对的,就是当今的密码学是以数学为基础的。

密码学的历史大致可以推早到两千年前,相传名将凯撒为了防止敌方截获情报,用密码传送情报。凯撒的做法很简单,就是对二十几个罗马字母建立一张对应表,比如说

A B

C E

B A

这样,如果不知道密码本,即使截获一段信息也看不懂,比如收到一个的消息是 EBKTBP,那么在敌人看来是毫无意义的字,通过密码本解破出来就是 CAESAR 一词,即凯撒的名字。这种编码方法史称凯撒大帝。当然,学过信息论的人都知道,只要多截获一些情报,统计一下字母的频率,就可以解破出这种密码。柯蓝道尔在他的“福尔摩斯探案集”中“跳舞的小人”的故事里已经介绍了这种小技巧。在很长时间里,人们试图找到一些好的编码方法使得解密者无法从密码中统计出明码的统计信息,但是,基本上靠经验。有经验的编码者会把常用的词对应成多个密码,使得破译者很难统计出任何规律。比如,如果将汉语中的“是”一词对应于唯一一个编码 0543,那么破译者就会发现 0543 出现的特别多。但如果将它对应成十个密码 0543,3737,2947 等等,每次随机的挑一个使用,每个密码出现的次数就不会太多,而且破译者也无从知道这些密码其实对应一个字。这里面虽然包含着朴素的概率论的原理,但是并不科学化。另外,好的密码必须做到不能根据已知的明文和密文的对应推断出新的密文的内容。历史上有很多在这方面设计得不周到的密码的例子。在第二次世界大战中,日本军方的密码设计就很成问题。美军破获了日本很多密码。在中途岛海战前,美军截获的日军密电经常出现 AF 这样一个地名,应该是太平洋的某个岛屿,但是美军无从知道是哪个。于是,美军就逐个发表自己控制的每个岛屿上的假新闻。当美军发出“中途岛供水系统坏了” 这条假新闻后,从截获的日军情报中又看到 AF 供水出来问题的电文,美军就断定中途岛就是 AF。事实证明判

断正确,美军在那里成功地伏击了日本主力舰队。

事实上,在第二次世界大战中,很多顶尖的科学家包括提出信息论的香农都在为美军情报部门工作,而信息论实际上就是情报学的直接产物。香农提出信息论后,为密码学的发展带来了新气象。根据信息论,密码的最高境界是使得敌人在截获密码后,对我方的所知没有任何增加,用信息论的专业术语讲,就是信息量没有增加。一般来讲,当密码之间分布均匀并且统计独立时,提供的信息最少。均匀分布使得敌人无从统计,而统计独立能保证敌人即使看到一段密码和明码后,不能破译另一段密码。这也是《暗算》里传统的破译员老陈破译的一份密报后,但无法推广的原因,而数学家黄依依预见到了这个结果,因为她知道敌人新的密码系统编出的密文是统计独立的。有了信息论后,密码的设计就有了理论基础,现在通用的公开密钥的方法,包括《暗算》里的“光复一号”密码,就是基于这个理论。

公开密钥的原理其实很简单,我们以给上面的单词 Caesar 加解密来说明它的原理。我们先把它变成一组数,比如它的 Ascii 代码 X=099097101115097114(每三位代表一个字母)做明码。现在我们来设计一个密码系统,对这个明码加密。

1,找两个很大的素数(质数)P 和 Q,越大越好,比如 100 位长的, 然后计算它们的乘积 N=P×Q,M=(P-1)×(Q-1)。

2,找一个和 M 互素的整数 E,也就是说 M 和 E 除了 1 以外没有公约数。

3,找一个整数 D,使得 E×D 除以 M 余 1,即 E×D mod M = 1。

现在,世界上先进的、最常用的密码系统就设计好了,其中 E 是公钥谁都可以用来加密,D 是私钥用于解密,一定要自己保存好。乘积 N 是公开的,即使敌人知道了也没关系。

现在,我们用下面的公式对 X 加密,得到密码 Y。

X k mod N=Y

好了,现在没有密钥 D,神仙也无法从 Y 中恢复 X。如果知道 D,根据费尔马小定理,则只要按下面的公式就可以轻而易举地从 Y 中得到 X。

Y d mod N=X

这个过程大致可以概况如下:

公开密钥的好处有:

1.简单。

2. 可靠。公开密钥方法保证产生的密文是统计独立而分布均匀的。也就是说,不论给出多少份明文和对应的密文,也无法根据已知的明文和密文的对应来破译下一份密文。更重要的是 N,E 可以公开给任何人加密用,但是只有掌握密钥 D 的人才可以解密, 即使加密者自己也是无法解密的。这样,即使加密者被抓住叛变了,整套密码系统仍然是安全的。(而凯撒大帝的加密方法有一个知道密码本的人泄密,整个密码系统就公开了。)

3.灵活,可以产生很多的公开密钥E和私钥D的组

合给不同的加密者。

最后让我们看看破解这种密码的难度。首先,要声明,世界上没有永远破不了的密码,关键是它能有多长时间的有效期。要破公开密钥的加密方式,至今的研究结果表明最好的办法还是对大字 N 进行因数分解,即通过 N 反过来找到 P 和 Q,这样密码就被破了。而找 P 和 Q 目前只有用计算机把所有的数字试一遍这种笨办法。这实际上是在拼计算机的速度,这也就是为什么 P 和 Q 都需要非常大。一种加密方法只有保证 50 年计算机破不了也就可以满意了。前几年破解的 RSA-158 密码是这样因数分解的

395058745832651445264197678006144819960207764603049364541393760515793556265294

50683609727842468219535093544305870490251995655335710209799226484977949442955603

= 3388495837466721394368393204672181522815830368604993048084925840555281177 ×11658823406671259903148376558383270818131012258146392600439520994131344334162924536139

现在,让我们回到《暗算》中,黄依依第一次找的结果经过一系列计算发现无法归零,也就是说除不尽,我猜她可能试图将一个大数 N 做分解,没成功。第二次计算的结果是归零了,说明她找到的 N=P×Q 的分解方法。当然,这件事能不能用算盘完成,我就不知道了,但我觉得比较夸张。另外我对该电视剧还有一个搞不懂的问题就是里面提到的“光复一号”密码的误差问题。一个密码是不能有误差的,否则就是有的密钥也无法解码了。我想可能是指在构造密码时,P 和 Q 之一没找对,其中一个(甚至两个都)不小心找成了合数,这时密码的保密性就差了很多。如果谁知道电视剧里面讲的“误差”是指什么请告诉我。另外,电视剧里提到冯?诺依曼,说他是现代密码学的祖宗,我想是弄错了,应该是香农。冯?诺依曼的贡献在发明计算机和提出博弈论(game theory)。

不管怎么样,我们今天用的所谓最可靠的加密方法的数学原理其实就这么简单,一点也不神秘,无非是找几个大素数做一些乘除和乘方运算就可以了。

数学之美系列 二十三 输入一个汉字需要敲多少个键 — 谈谈香农第一定律

今天各种汉字输入法已经很成熟了,随便挑出一种主要的输入法比十几年前最好的输入法都要快、要准。现在抛开具体的输入法,从理论上分析一下,输入汉字到底能有多快。

我们假定常用的汉字在二级国标里面,一共有 6700 个作用的汉字。如果不考虑汉字频率的分布,用键盘上的 26 个字母对汉字编码,两个字母的组合只能对 676 个汉字编码,对 6700 个汉字编码需要用三个字母的组合,即编码长度为三。当然,聪明的读者马上发现了我们可以对常见的字用较短的编码对不常见的字用较长的编

码,这样平均起来每个汉字的编码长度可以缩短。我们假定每一个汉字的频率是

p1, p2, p3, ..., p6700

它们编码的长度是

L1, L2, L3, ..., L6700

那么,平均编码长度是

p1×L1 + p2×L2 + ... + p6700×L6700

香农第一定理指出:这个编码的长度的最小值是汉字的信息熵,也就是说任何输入方面不可能突破信息熵给定的极限。当然,香农第一定理是针对所有编码的,不但是汉字输入编码的。这里需要指出的是,如果我们将输入法的字库从二级国标扩展到更大的字库 GBK,由于后面不常见的字频率较短,平均编码长度比针对国标的大不了多少。让我们回忆一下汉字的信息熵(见 http:///2006/04/4.html),

H = -p1 * log p1 - ... - p6700 log p6700。

我们如果对每一个字进行统计,而且不考虑上下文相关性,大致可以估算出它的值在十比特以内,当然这取决于用什么语料库来做估计。如果我们假定输入法只能用 26 个字母输入,那么每个字母可以代表 log26=

4.7 比特的信息,也就是说,输入一个汉字平均需要敲 10/4.7= 2.1 次键。

聪明的读者也许一经发现,如果我们把汉字组成词,再以词为单位统计信息熵,那么,每个汉字的平均信息熵将会减少。这样,平均输入一个字可以少敲零点几次键盘。不考虑词的上下文相关性,以词为单位统计,汉字的信息熵大约是8比特作用,也就是说,以词为单位输入一个汉字平均只需要敲 8/4.7=1.7 次键。这就是现在所有输入法都是基于词输入的内在原因。当然,如果我们再考虑上下文的相关性,对汉语建立一个基于词的统计语言模型(见http:///2006/04/blog-post.html),我们可以将每个汉字的信息熵降到 6 比特作用,这时,输入一个汉字只要敲 6/4.7=1.3 次键。如果一种输入方法能做到这一点,那么汉字的输入已经比英文快的多了。

但是,事实上没有一种输入方法接近这个效率。这里面主要有两个原因。首先,要接近信息论给的这个极限,就要对汉字的词组根据其词频进行特殊编码。事实上像王码这类的输入方法就是这么做到,只不过它们第一没有对词组统一编码,第二没有有效的语言模型。这种编码方法理论上讲有效,实际上不实用。原因有两个,第一,很难学;第二,从认知科学的角度上讲,人一心无二用,人们在没有稿子边想边写的情况下不太可能在回忆每个词复杂的编码的同时又不中断思维。我们过去在研究语言识别时做过很多用户测试,发现使用各种复杂编码输入法的人在脱稿打字时的速度只有他在看稿打字时的一半到四分之一。因此,虽然每个字平均敲键次数少,但是打键盘的速度也慢了很多,总

的并不快。这也就是为什么基于拼音的简单输入法占统治地位的原因。事实上,汉语全拼的平均长度为 2.98,只要基于拼音的输入法能利用上下文彻底解决一音多字的问题,平均每个汉字输入的敲键次数应该在三次左右,每分钟输入 100 个字完全有可能达到。

另外一个不容易达到信息论极限的输入速度的原因在于,这个理论值是根据一个很多的语言模型计算出来的。在产品中,我们不可能占有用户太多的内存空间,因此各种输入方法提供给用户的是一个压缩的很厉害的语音模型,而有的输入方法为了减小内存占用,根本没有语言模型。拼音输入法的好坏关键在准确而有效的语言模型。

另一方面,由于现有输入方法离信息论给的极限还有很大的差距,汉语输入方法可提升的空间很大,会有越来越好用的输入方法不断涌现。当然,输入速度只是输入法的一项而不是唯一的衡量标准。我们也会努力把谷歌的输入法做的越来越好。大家不妨先试试现在的版本,http://tools.google.com/pinyin/,半年后再看看我们有没有提高。

数学之美系列 二十四 从全球导航到输入法——谈谈动态规划

今年九月二十三日,Google、T-Mobile 和 HTC 宣布了第一款基于开源操作系统 Android 的 3G 手机,其中一个重要的功能是利用全球卫星定位系统实现全球导航。这个功能在其它手机中早已使用,并且早在五六年前就已经有实现这一功能的车载设备出售。其中的关键技术只有两个:第一是利用卫星定位;第二根据用户输入的起终点,在地图上规划最短路线或者最快路线。后者的关键算法是计算机科学图论中的动态规划(Dynamic Programming)的算法。

在图论(请见拙著《图论和网络爬虫》)中,一个抽象的图包括一些节点和连接他们的弧。比如说中国公路网就是一个很好的“图”的例子:每个城市一是个节点,每一条公路是一个弧。图的弧可以有权重,权重对应于地图上的距离或者是行车时间、过路费金额等等。图论中很常见的一个问题是要找一个图中给定两个点之间的最短路径(shortest path)。比如,我们想找到从北京到广州的最短行车路线或者最快行车路线。当然,最直接的笨办法是把所有可能的路线看一遍,然后找到最优的。这种办法只有在节点数是个位数的图中还行得通,当图的节点数(城市数目)有几十个的时候,计算的复杂度就已经让人甚至计算机难以接受了,因为所有可能路径的个数随着节点数的增长而成呈指数增长(或者说几何级数),也就是说每增加一个城市,复杂度要大一倍。显然我们的导航系统中不会用这种笨办法。

所有的导航系统采用

的都是动态规划的办法(Dynamic Programming),这里面的规划(programming)一词在数学上的含义是“优化”的意思,不是计算机里面编程的意思。它的原理其实很简单。以上面的问题为例,当我们要找从北京到广州的最短路线时,我们先不妨倒过来想这个问题:假如我们找到了所要的最短路线(称为路线一),如果它经过郑州,那么从北京到郑州的这条子路线(比如是北京-> 保定->石家庄->郑州,称为子路线一),必然也是所有从北京到郑州的路线中最短的。否则的话,我们可以假定还存在从北京到郑州更短的路线(比如北京->济南->徐州->郑州,称为子路线二),那么只要用这第二条子路线代替第一条,我们就可以找到一条从北京到广州的全程更短的路线(称为路线二),这就和我们讲的路线一是北京到广州最短的路线相矛盾。其矛盾的根源在于,我们假设的子路线二或者不存在,或者比子路线一还来得长。

在实际实现算法时,我们又正过来解决这个问题,也就是说,要想找到从北京到广州的最短路线,先要找到从北京到郑州的最短路线。当然,聪明的读者可能已经发现其中的一个“漏洞”,就是我们在还没有找到全程最短路线前,不能肯定它一定经过郑州。不过没有关系,只要我们在图上横切一刀,这一刀要保证将任何从北京到广州的路一截二,如下图。

那么从广州到北京的最短路径必须经过这一条线上的某个城市(图中蓝色的菱形)。我们可以先找到从北京出发到这条线上所有城市的最短路径,最后得到的全程最短路线一定包括这些局部最短路线中的一条,这样,我们就可以将一个“寻找全程最短路线”的问题,分解成一个个小的寻找局部最短路线的问题。只要我们将这条横切线从北京向广州推移,直到广州为止,我们的全程最短路线就找到了。这便是动态规划的原理。采用动态规划可以大大降低最短路径的计算复杂度。在我们上面的例子中,每加入一条横截线,线上平均有十个城市,从广州到北京最多经过十五个城市,那么采用动态规划的计算量是 10×10×15,而采用穷举路径的笨办法是 10 的 15 次方,前后差了万亿倍。

那么动态规划和我们的拼音输入法又有什么关系呢?其实我们可以将汉语输入看成一个通信问题,而输入法则是一个将拼音串到汉字串的转换器。每一个拼音可以对应多个汉字,一个拼音串就可以对应图论中的一张图,如下:

其中,Y1,Y2,Y3,……,YN 是使用者输入的拼音串,W11,W12,W13 是第一个音 Y1 的候选汉字,W21,W22,W23,W24 是对应于 Y2 的候选汉字,以此类推。从第一个字到最后一个字可以组成很

多很多句子,我们的拼音输入法就是要根据上下文找到一个最优的句子。如果我们再将上下文的相关性量化,作为从前一个汉字到后一个汉字的距离,那么,寻找给定拼音条件下最合理句子的问题就变成了一个典型的“最短路径”问题,我们的算法就是动态规划。

上面这两个例子导航系统和拼音输入法看似没什么关系,但是其背后的数学模型却是完全一样的。数学的妙处在于它的每一个工具都具有相当的普遍性,在不同的应用中都可以发挥很大的作用。

我们在下一个系列将详细介绍专门针对拼音输入法的“维特比算法”。

篇六:数学之美_10000字1/120

德谋克利特 :生活需要美的享受 马 克 思 :社会的进步就是人类

对美的追求的结晶

2/120

数学是壮丽多彩,千姿百态, 引人入胜的 --华罗庚

“正确地说,数学不仅拥有真理, 而且还拥有至高的美。

著名数学 3/120 家罗素

美是自然,数学作为书写宇宙 的文字,反映着自然,数学中 当然存在着美

伽利略

大数学家 克莱茵

而 数 学 能 给 予 以 上 的 一 切

科 学 可 改 变 物 质 生 活

哲 学 使 人 获 得 智 慧

诗 歌 能 动 人 心 弦

绘 画 使 人 赏 心 悦 目

音 乐 能 激 发 情 怀

也 是 人 类 心 灵 最 独 特 的 创 作 ,

数 学 是 人 类 最 高 超 的 智 力 成 4/120 就

然而,有些数学系的同学认为 上大学是走对了路, 到数学系是进错了门… ; 数学枯燥,难学,想起来都害怕. 数学何美之有?

这一点非常重要。

5/120

一、从曼德伯罗伊特图说起

先看看这个图像。

它是用一个2次的复数叠代出来的 一个图形。 令

P c c ( z)  z

2

曼 德 伯 罗 伊 特 图

这里可以看到一个像葫芦形的东西,外面有些须须; 可是我们如果从任何一个地方进去的话,  你看它的形象, 它的局部和整体非常相像,

像这样的图形, 它已经把数学跟艺术都连在一起了。

…是曼德伯罗伊特 用计算机来做了之后, 就慢慢地发现了原来自相似性。 数学就不再是几条公式,定理, 它 跟我们人类的生活, 跟信息时代, 我们的一些欣赏习惯等等都可以有 密切的联系。

这仅仅只是外在的美,而数 学之美更多的是在于其内在 的美;这也是数学之美的实 6/120 质所在。

我们说数学之美:是我们能看到

它的美,

能体会它的美;

会欣赏它的美;

否则,“数学是枯燥的”

7/120

7

比如,对于数字e和  ,不同的人会有截然不同的看法:

1、枯燥,无味,难记;

2、通过观察发现, 美极了!

因为这两个似乎风马牛不

相及的常数,会有那么多

令人不解的数字现象。

把数学中最重要的5个数 1 、0、 e 、i 、 联系在了一起

    e 漂亮!

4 5 6

(五虎大将,五朵金花)

e

i

 1  0. 美极了!

曾获得“最美的数学定理”称号。 这 个等式被评为2003年全世界自然科 学界十大最美公式中的第一名。它 美在哪儿?

“1”是自然数中最基本的正整数,“0”是复 数系中最关键的整数,“π、e”是最常用、 最重要的无理数,“i”却是虚数单位。这样 几个复数系中最重要、最特殊的数又简洁、 又和谐、又奇异地统一在同一个等式中,多 么奇妙、多么精彩、多么迷人,大有“神来 之笔”之感,令人拍案叫绝。这不仅仅是数 学家的一个伟大发现,而是数学本身

所具有 8/120 的内在美,这就是数学美。

  3.1415926

前六位有效数字314159是个素数, 把它反过来 951413 还是素数; 314159恰好是三个素数31、41、59连写而成,这三个 素数的和,它们的立方和,以及五次方和也都是素数.

关于  的记忆

我国桥梁专家茅以升少年时记忆100位 一日本人3小时内背诵15151位,达20页

9/120

二、数字美学欣赏

奇妙无穷的数字世界 毕达哥拉斯学派:对于数字的崇拜达到“神 话”的程度;

他们崇拜“4”,因为它代表四种元素:火,水,气,土; 他们把“10”看成是“圣数”,因为10是由前四个自然数1, 2, 3,4 结合而成。

他们还认为: “1”表示理性,因为理性是不变的; “2”表示意见; “4”代表公平,因为它是第一个平方数; “5”代表婚姻,因为它是第一个阴数2与第一个阳数3的结合。

10/120

…人们喜欢数字“8”,是因为它意味着“发”,也 有人喜欢“6”,因为那意味着“六六大顺”。 人们不惜出高价抢注末尾是“8”或“6”的汽车牌 号、移动电话号码等。

11/120

上海市出租汽车公司的电话号码为25800000,该 公司的宣传广告语“让我拨五个零”。就是借助上 海方言对数的谐声让能牢记住这个号码。

美国纽约的火警电话号码为“911”, 恐怖分子制造了“9.11事件“, 就是利用这个号码来统一行动。 可见,数字中蕴涵着丰富的文化、蕴涵着美。

12/120

(一) 亲和数(相亲数)的奇妙性质

1. (284,220)的美丽传说——远古部落的故事

2. 《圣经》中的数字文化——以扫与雅各的故事

这里的220和284实际 是雅各在向哥哥传递 和好的信号,以提醒 以扫念及手足之情。

又是一个 284 与 220

13/120

也许有人认为,这样的“吻合”极其偶然,抹 去迷信的色彩,很难有什么规律蕴涵于其中。

恰恰相反,这偶然的“吻合”引起了数学家们极大的

关注,他们花费了大量的精力进行研究、探索,终于 发现这种数对“不是唯一的。它们在自然数中构成了 一个独特的数系。人们称具有这种性质的两个数为亲 和数(或相亲数对)。

14/120

两个数被称为亲和数对,如果其中任意一个数的所有约数 之和等于另外一个数。 这里,220和284就是一对亲和数。

该学派宣称人之间讲友谊,数之间也有“相亲相爱”。 据说,一个门徒向毕达哥拉斯提出这样一个问题: “我结交朋友时,存在着数的作用吗?” 毕达哥拉斯毫不犹豫地回答: “朋友是你的灵魂的倩影,就是你中有我、我中有你,

要象220和284一样亲密。”

15/120

正是由于亲和数对这种“你中有我,我中有你,水乳交融”

的特殊性质,教会初期的几百年间有一个习惯:

是为了表达两个人的友谊,每人各佩戴220和284这两个数

字中的一个。

关于亲和数的研究是数论研究的一个重要内容 是否还有别的亲和数

(当然:找亲和数不是一件容易的事),

两千多年后: 第二对相亲数(17296,18416)于1636年由法国天才数

学家费马找到了 ,当时只有16岁;

第三对相亲数(9363548 , 9437056)于1638年被法国 数学家笛卡儿发现;

16/120

1750年,伟大数学家欧拉 一个人就找到了 59个相亲

数对.(2620,2924)是其中最小的一对。 迄今为止,人们已经找到了1200对“亲和

数”,他们要么两个都是偶数,要么两个都

是奇数, 是否存在一奇一偶的亲和数呢?

17/120

到1974年为止,人们所知的一对最大的亲和数是: 34×5×11×528119×29×89× (2×1291×528116-1),

如果….

34×5×11×528119×(23×33×52×1291×52 8119-1);

更有趣的是亲和数链:

(1) ﹛2115324,3317740,3649556, 2797612 ﹜; (2) ﹛1264460,1547860,1727636, 1305184﹜. 第一个问题是:

您是否还会认为数字很枯燥 ?

18/120

(二) 下面两组数字现象让您看后会为其中的奥妙赞 叹不已

122=144 1022=10404 1122=12544 轮换一下 1222=14884 1132=12769

更一般的(100…02)2 =

212=441 2012=40401 2112=44521 2212=48841 3112=96721

倒一下

10…040…04 (200…01)2 = 40…040…01

第二个问题是:您能否回答这是为什么?

19/120

(三)神奇的“无8数”

“无8数” ,即由1、2、3、4、5、6、7、9八个数

字组成的一个八位数——12345679。

“无8数”虽然是由普通的八个数字组成的,但是 它具有许多奇特的功能。它与几组性质相同的数 相乘,会产生意想不到的结果。

20/120

它若是与9、18、27、36、45、54、63、72、 81相乘,结果会由清一色的数字组成。

(问:这些数有什么特点?) 9的倍数

12345679×9=111111111

12345679×18=222222222 12345679×27=333333333 12345679×36=444444444 …… 12345679×81=999999999

21/120

21

“无8数”不仅能乘出清一色的积, 而且还能与12、15、21、24…… (3的倍数,其中9的倍数除外)相乘,得 出由3个数字组成的“三位一体” 这种特殊的结果:

12345679×12=148148148 12345679×15=185185185 12345679×21=259259259 12345679×24=296296296 ……

22/120

22

还有更精彩的:

它若是与10、11、13、14、16、17相乘,乘得的积会让 8、7、5、4、2、1轮流休息(3、6、9是3的倍数,就轮 不到它们休息了)。

12345679×10=123456790(数字“8”休息) 12345679×11=135802469(数字“7”休息) 12345679×13=160493827(数字“5”休息) 12345679×14=172839506(数字“4”休息) 12345679×16=197530864(数字“2”休息) 12345679×17=209876543(数字“1”休息)

23/120

23

“无8数,真奇妙!” 然而,它与10、19、28、37、46、55、 64、73

相乘,其积会让1、2、3、4、5、6、7、9 八个数字轮 流做开路先锋,

12345679×10=123456790 12345679×19=234567901 12345679×28=345679012 12345679×37=456790123 12345679×46=567901234 12345679×55=679012345 12345679×64=790123456 12345679×73=901234567

第三个问题是:

看了“无8数”的展示, 你是否会说: 数字其实其乐无穷! ?

随着人们对“无8数”研究的 深入,这种有趣的性质会越来 越多地被发现。 在神奇的数学王国里,有无数 的“宝藏”等待着我们去挖掘。 24/120

(五) 金字塔内神奇的数字

据百度上的调查结果显示 史上最神奇的数字是发现于金字塔内的

25/120

(六)还有更奇妙的精灵: 幻方

(魔方)

女娲与伏羲

龙马

河图

神龟 洛书

26/120

“洛书的奇妙性质”

河图、洛书的神秘之 处就是其上的九宫图

92+27+76+61+18+83+34+49= 94+43+38+81+16+67+72+29 (440) 922+272+762+612+182+832+342+492=

942+432+382+812+162+672+722+292 (29460)

923+273+763+613+183+833+343+493=

943+433+383+813+163+673+723+293

(2198900)

27/120

这种蕴涵在大千世界中的“自 然美”是何其对称,和谐. 幻方:行、列、斜线上的和均相等 由于幻方中蕴涵奇妙的数学美, 从而引起人们极大的兴趣 做一个幻方不是一件容易的事

28/120

4

9

2

3

8

5

1

7

6

幻方是数学按照一种规律布局成的一种体系,每个幻方不仅 是一个智力成就,而且还是一个艺术佳品,都以整齐划一, 均衡对称,和谐统一的特性,并发出耀人的数学美的光辉。 如今,幻方被利用于军事、中医、天文、气象等: 日本飞机驾驶学校第一堂课上的就是幻方知识; 在人类寻找外星文明的过程中; 幻方也承担起传递人类智慧信息的重任, 著名数学家华罗庚曾建议,为沟通地球与其 他星球的信息,地球人最好带去两个图形: 幻方—代表数;勾股图—代表数形关系。 美国1977年发射的寻求外星文明的宇宙飞船 旅行者1号、2号上就带有一张四阶幻方图。 1990年,在合肥召开的国际组合数学学术 会议上,就有大量的幻方研究论文。

29/120

海上漂浮建筑。 首先要解决的问 题就是要将建筑 面分割成方阵格, 每格的建筑质量 的确定。需要像 构造幻方一样巧 妙布局。 因为只有各线各 方向上的质量处 处均衡才不至于 倾斜。

30/120

31/120

(七) 黑洞数之谜

从数学游戏开始:请闭上眼晴,想一个三 (或 四)位数 ( 三(或 四)位数字不完全相同的任意三 (或 四)位数) 第一步:按照数字从大到小的顺序,把三位数字重新排 列,得到一个新数。 第二步:接下来,再把所得的数的数字顺序颠倒一下,又 得到一个新数。 第三步: 把这两个新数的差作为一个新的三位数, 第四步: 再重复上

述的步骤。 (最多重复8次),

让我猜猜您的结果!

32/120

(八) 神奇的0.618 (黄金数、黄金比 、黄金分割)

1.外内比线段:将线段分为两段,使其中较短 线段与较长线段的比等于较长线段与整个线段的比.

A x C 1-x B

x

1

x =

=

1- x

x

或x 2 + x - 1 = 0

-1 + 5 -1 - 5 ≈ 0. 618 , 另有 x = < 0 ( 舍去) 2 2

33/120

1)黄金数(0.618)竟然与斐波纳契数列(兔生小兔问题 )有关 如果每对兔子(一雌一雄)每月能生殖一对 小兔子(也是一雌一雄,下同),每对兔子 第一个月没有生殖能力,但从第二个月以后 便能每月生一对小兔。假定这些兔子都不发 生死亡现象,那么从一对刚出生的兔子开始, 一年之后会有多少对兔子呢?

兔年说兔

月份 总数

1 1

2 1

3 4 2 3

5 5

6 8

7 8 9 10 13 21 34 55

11 12 13 89 144 233

Fn =

1

1 + 5 n+1 1 - 5 n+1 [( ) -( ) ] 2 2 5

\

Fn -1 Fn

2 1+ 5

=

5 -1 2

0.618

34/120

2) 黄金分割与建筑

古埃及的金字塔 —斜边137米与高227米之比为0.629

所谓“黄金比”,它具有黄金 一样宝贵的性质; 艺术上;建筑 上. 巴黎圣母院, 利用黄金分割率的紫禁城 印度泰姬陵, 加拿大多伦多电视 发射塔, 都有不少与黄金比 有关的数据.

世界七大奇迹之一的帕特农神庙

法国的埃菲尔铁塔;

人们发现,这种比 例用于建筑上,可 除去人们视觉上的 凌乱.加强建筑形体 上的美感.

35/120

古埃及的金字塔, 古希腊的巴特农神庙,

人们发现,这种比例用

于建筑上,可除去人们

巴黎圣母院, 视觉上的凌乱.加强建筑 印度泰姬陵, 形体上的美感. 法国的埃菲尔铁塔; 加拿大多伦多电视发射塔。

都有不少与黄金比有关的数据.

美观矩形的 宽长比

如国旗和其它用到矩形的 地方(建筑、家具)

风景照片中,

地平线位置的安排

36/120

3)黄金分割与(绘画)艺术

黄金分割比,即0.61803398„被达·芬奇称为 “神圣 比例”.他认为“美感完全建立在各部分之间神圣的比例关系 上”。 还把黄金分割引入了绘画艺术之中.其名画《蒙娜丽莎》、 《最后的晚餐》等就是按黄金矩形来构图的. 维纳斯的美被所有人所公认,她的身材比也恰恰是黄金分割比

37/120

4)人体中也有许多黄金分割点:

 人的肚脐是人体长的黄金分割点.  而膝盖又是人体肚脐以下部分体长的黄金分割点.  而咽喉则是上肢的黄金分割点

。(达到此的认为是最美的)

• 生活中人们最舒适的环境温度为22℃-24℃,为什么? • 源于体温36℃-37℃与0.618的乘积恰好是22.4℃-22.8℃。

38/120

芭蕾舞演员为什么用脚尖跳舞 就是因为这样能使观众感到演员 的腿长与身高的比例更加符合黄 金

分割的法则.舞姿显得更加优美.

39/120

5) 黄金分割与消费——黄金一样的价值

小康型购物公式

………. 小康型消费价格= 0.618×(高档消费价格-低档消费价格)+低档消费价格 图示如下:

低档消费 ● · 小康消费价 ● ● 高档消费价

0.618

40/120

举例来说:若你需要购买一台手提电脑,据调查,得知高

档价格在12800元左右,低档价格在2800元左右,那么您 的小康消费水准为:(12800-2800)×0.618+2800=

8980元.

换句话说,价格为8900元左右为宜.这正是大多数电脑爱 好者喜欢且接受的档次. 上述公式对指导商品生产等也有实际价值.(你不妨试一试, 黄金数在投资中的应用 )

第六个问题是:

您是否觉得数字其实很惊奇? 41/120

三、 数学的抽象之美

抽象美是数学的美感的一个重要组 成部分,数学的简洁美很大程度上

来源于数学的抽象性,有些难以解

决的实际问题经过数学抽象会变的

容易.

42/120

42

(一) 想象不到的问题

抽象有两种:1、我们不容易想象的; 2、我们无法体会到的

第七个问题是: 下面的结论您能想象的到吗?

有一根很长的绳子,恰好 可绕地球赤道一周,如果 把绳子再接长15米后,绕 着赤道一周悬在空中后 (如果可能的话),一个身高 2.39米的人可以从绳子下 的任何地方自由的穿过。

43/120

(二)哥尼斯堡七桥 问题:

能否从任一陆地出发 通过每座桥恰好一次 而回到出发点?

布勒格尔河

C

哥尼斯堡市

A

B

D 哥尼斯堡七桥示意图

44/120

44

欧拉毕竟是一位 伟大的数学家 A D

C

B

欧拉:能够一笔画出的图形 奇点个数只能是0或2

B A A

B

能一笔画

45/120

45

两个卓越而奇妙的等式: 1 、 e  i +1=0 ,漂亮!(可以用完美来形容)

 联系在了一起 把数学中最重要的5个数 1 、0、 e 、i 、

2、V+F-E=2 ,

V 表示多面体顶点数,F表示多面体面数 E表示多面 体 边数 多面体太多,要多少就有多少,而欧拉确能将其众多的 多面体中对顶点、边、面得到如此简洁的关系式,怎么能不 让人为之叹服!

46/120

(三) 著名的“国王奖赏”问题:

有些数字看起来并不起眼,但是它表示的数字之大几乎让人感到吃惊

麦子总数为: 1+2+22+23+…+263=264-1 体积 12×1012

(25位:208925819614629174706176)

47/120

折纸中的学问

一张薄纸,不断对折,折30次后,纸叠得 有多厚?

第一次 1 2 第三十次

……

48/120

第二次 2×2=2

30个

2

第三次

……

2×2×2=2

30 3

2×2×2×…×2=2 =1073741824

梵塔中的学问

增加

印度北部的圣城贝拿勒斯城 的一座神庙里,佛像前面有一块 黄铜板,板上插着三根宝石针, 其中一根针自上而下放着从小到大的64片圆形金 片(在当地被称为

“梵塔”).按教规,每天由值班僧 侣把金片都移到另一根宝石针上,每次只能移动 一片,且小片必须放在大片上——当所有的金片 都移到另一根针上时,所谓的“世界末日”就到了

2

64

-1

585亿年

200亿年

49/120

四、数学符号的简洁美

数学中的许多符号均有其独特的含义,使用它们不仅方便、 简洁、且看上去优美。 • 体现数学符号的内在美,简洁的符号,丰富的内涵

n!  n  ( n  1 )   2  1

a

i 1

n

i

 a1  a2    an

a

i 1 n i

 an  a( n1 ) 

 a2  a1

50/120

五. 对称美 何等的 对称啊

x y  2 1 2 a b 2 2 x y  2 1 2 a b  2 2 x  y 1

2 2

x2 y2 z2   1 2 2 a b c2 x2 y2 z2  2  2 1 2 a b c 

x  y  z 1

2 2 2

51/120

(u, v)  a1b1  a2b2 在空间: (u , v )  a b  a b  a b 1 1 2 2 3 3 在n维空间:(u , v )  a b  a b    a b 1 1 2 2 n n

在平面:

内积

漂亮的结论:矩阵的行秩等于列秩

一个优美的公式:  f ( x) dx = F( b) - F( a)

a b

2  2  4  4  6  6  8  8  的无穷乘积 2 1  3  3  5  5  7  7  9  9

52/120

数学美推动了创造、发现

我认为数学家无论是选择题材还是判 断成功的标准,主要地都是美学的。 ——冯. 诺依曼 如果一个物理方程在数学上看上去不 美,那么这个方程的正确性是可疑的。 —— 狄拉克 自然律必须满足审美要求。 —— 爱因斯坦

53/120

谷神星的发现

星名 水星 金星 地球 火星 木星 土星 天王星 离太阳 4 7 10 16 52 100 192 的距离

距离减4 后

0

3

6

12

48

96

54/120

七. 统一美

I 型曲线积分

见(1)

I 型曲面积分 II型曲面积分 三重积分

II型曲线积分

 Pdx  qdy  rdx   p cos  Q cos   R cosds

AB AB

 pdydz  Qdxdz  Rdxdy   p cos  Q cos   R cos )dA



p Q R pdydz  Qdzdx  Rdxdy   (   )dxdydz x y z 55/120 R

55

撕托克撕公式

 pdx  qdy  Rdz  

c

dydz  x p

dxdz  y Q

dxdy  z R

R Q P R Q P   (  )dydz  (  )dzdx  (  )dxdy y z z x x y S

特别,z = 0 , 得格林公式

c

Q p pdx  Qdy   (  ) dxdy x y D

56/120

56

九. 文学中的数字之美

历代诗人都喜欢用数字写诗 1.宋代邵康节写的数字诗:

不仅可以增加感染力, 还能留给读者深刻的印 象和美的享受。带来引 人入胜的趣味和情韵。

• 一去二三里, • 烟村四五家。 • 亭台六七座, • 八九十枝花。

古代把这首诗作 为描红帖,给学 生练字、学诗用, 现在编入了小学 语文课本。

57/120

2. 台

湾人民的数字诗---中秋诗

一国两制盼三通, 四海五湖人心同。 六亲相会期有日, 七夕牛郎逢织女。 八方共赏团圆月, 九州十亿是弟兄。 百年之计须好合, 千秋万载颂统一。

这首诗表达了台湾人民热切期盼海峡两岸和平

58/120

4.《秀才进京赶考》

一叶孤舟, 坐着二三个骚客, 启用四桨五帆, 经过六滩七湾, 历尽八颠九簸, 可叹十分来迟。

十年寒窗, 进了九八家书院, 抛却七情六欲, 苦读五经四书,

考了三番二次, 今天一定要中。

59/120

5、《文君复书》

说的是司马相如赴长安赶考,并官拜中郎将。 从此,他沉湎于声色犬马、纸醉金迷,觉得妻 子卓文君配不上他了,于是就处心积虑想休妻, 另娶名门千金. 转眼五年时间过去了。一天卓文君暗自垂泪, 忽然京城来了一名差官,交给她一封信,说 司马相如大人吩咐,立等回书。卓文君接过 信又惊又喜,拆开信一看,寥寥数语:

60/120

一、二、三、四、五、六、七、 八、九、十、百、千、万。

61/120

十. 生活中的数学之美

长期以来,三角形、正方形和矩形曾经在建筑设计

中起过重大的作用。因为三角形和直角是当时所知

道的最稳定的形状,这些形状就被用在像埃及和尤 卡坦的金字塔这样的结构中。

62/120

3800多年前的玛雅人在他们的金 字塔中对方形和三角形情有独钟 ,如今金字塔已成为这个已消失 文明的象征

63/120

• 后来,建筑设计与计算机建模结合起 来的数学知识已大为丰富,对作用在 一个结构上的各种物理力的全面理解 ,也已大为增进。然而建筑的形状和 形式仍旧是三维数学对象。许多对象 来自欧几里得几何,例如矩形的或正 方形的立体、角锥、圆锥、球、圆柱 。另外一些则用曲面立体、帐篷结构 和网格球顶等更奇异的形式。所有这 些对象被建筑师既用来充填空间又用 来创造居住空间。 64/120

2)祝福短信里的数学

(1)祝一帆风顺,二龙腾 飞,三羊开泰,四季平安, 五福临门,六六大顺,七星 高照,八方来财,九九同心, 十全十美。 (2)一斤花生二斤枣,好运经 常跟你跑;三斤苹果四斤梨,吉 祥和你不分离;五斤橘子六斤桃, 年年招财又进宝;七斤葡萄八斤 橙,愿你心想事就成;九斤芒果 十斤瓜,愿你天天乐开花!65/120

*结束语

在本讲座即将结束之时,非常感谢同 学们能坚持听下来,为了表示感谢之 情,总想给同学们送点什么,又不打 算送的太多,就送你们六千万:

千万要快乐!

千万要健康! 千万要平安! 千万要知足! 千万要感恩! 千万不要忘记我!

,美

哉!

66/120

篇七:数学之美____1400字數學之美

一個有趣又可愛的方法可看 到「數學之美」以及「你」 的爱所给予我的力量

Wonderful World

1x8+1=9 12 x 8 + 2 = 98 123 x 8 + 3 = 987 1234 x 8 + 4 = 9876 12345 x 8 + 5 = 98765 123456 x 8 + 6 = 987654 1234567 x 8 + 7 = 9876543 12345678 x 8 + 8 = 98765432 123456789 x 8 + 9 = 987654321

1 x 9 + 2 = 11 12 x 9 + 3 = 111 123 x 9 + 4 = 1111 1234 x 9 + 5 = 11111 12345 x 9 + 6 = 111111 123456 x 9 + 7 = 1111111 1234567 x 9 + 8 = 11111111 12345678 x 9 + 9 = 111111111 123456789 x 9 +10= 1111111111

9 x 9 + 7 = 88 98 x 9 + 6 = 888 987 x 9 + 5 = 8888 9876 x 9 + 4 = 88888 98765 x 9 + 3 = 888888 987654 x 9 + 2 = 8888888 9876543 x 9 + 1 = 88888888 98765432 x 9 + 0 = 888888888

很炫,是不是?

再看看這個對稱式

1x1=1 11 x 11 = 121 111 x 111 = 12321 1111 x 1111 = 1234321 11111 x 11111 = 123454321 111111 x 111111 = 12345654321 1111111 x 1111111 = 1234567654321 11111111 x 11111111 =

123456787654321

111111111 x 111111111 =

12345678987654321

現在,注意看這個

101% 從一個嚴密的數學觀點 什麼等於 100%? 給你超過 100%代表什麼意思? 有些人說他們付出超過100%,可能嗎? 我們都曾經有過這種境遇,就是別人要求要你去 付出超過 100% 甚至要求達到 101%? 生活中什麼等於100%?

這裡有一個小小的數學公式 或許能幫忙解答這些問題

如果 英文字母 ABCDEFGHIJKLMNOPQR STUVWXYZ 依序代表 下列相對數字 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26.

如果 努力工作 H-A-R-D-W-O-R- K 8+1+18+4+23+15+18+11 = 98% 還有 知識 K-N-O-W-L-E-D-G-E 11+14+15+23+12+5+4+7+5 = 96%

而態度 A-T-T-I-T-U-D-E 1+20+20+9+20+21+4+5 = 100%

那麼看看「你的愛」能達到多少 L-O-V-E-O-F-Y-O-U 12+15+22+5+15+6+25+15+21 = 136%

因此我們從以上數學運算 得到一個確定的結論 那就是 努力工作和知識只能讓你接近 目標,而態度能讓你達成目標

唯「你的愛」能讓我超越顛峰

Have a great day… and that God bless you!

篇八:数学之美_5800字

数学之美

摘要:提到数学跟美的关系,很多人表示不解。但艺术的美感跟数学是分开的。其实,数学关于美术中的重要性,想来就被一些科学家和艺术家所肯定。一个艺术品能否成功有一个重要因素———是不是和谐美。所谓和谐美就是满足了数学上的黄金分割。另一方面,音乐之美也是跟数学紧密联系着的。理性的数学中也存在着感性的音乐.由一段三角函数图像出发,我们只要对它进行适当的分段,形成适当的小节, 并在曲线上选取适当的点作为音符的位置所在,那么就可以作出一节节的乐曲

关键词:数学之美,艺术,黄金分割,音乐

正文:美是人类创造性实践活动的产物,是人类本质力量的感性显现。通常我们所说的美以自然美、社会美以及在此基础上的艺术美、科学美的形式存在。数学美是自然美的客观反映,是科学美的核心[1]。简言之数学美就是数学中奇妙的有规律的让人愉悦的美的东西。历史上许多学者、数学家对数学美从不同的侧面作过生动的阐述。 普洛克拉斯早就断言:“哪里有数,哪里就有美。”亚里士多德也曾讲过:“虽然数学没有明显地提到善和美,但善和美也不能和数学完全分离。因为美的主要形式家是“秩序、匀称和确定性”,这些正是数学研究的原则。”以上的论述可见,数学中充满着美的因素,数学美是数学科学的本质力量的感性和理性的呈现,它

不是什么虚无飘渺、不可捉摸的东西,而是有其确定的客观内容。数学美有别与其它的美,它没有鲜艳的色彩,没有美妙的声音,没有动感的画面,它却是一种独特的美。

美国数学家克莱因曾对数学美作过这样的描述:“音乐能激发或抚慰情怀,绘画使人赏心悦目,诗歌能动人心弦,哲学使人获得智慧,科技可以改善物质生活,但数学却能提供以上一切。” 数学美与其它美的区别还在于它是蕴涵在其中的美。打个比方来说,大家一定都有这种感觉,绝大部分同学对音体美容易产生兴趣,而对数学感兴趣的不多。我认为,这主要有两个方面的原因:一是音体美中所表现出来的美是外显的,这种美同学们比较容易感受、认识和理解;而数学中的美虽然也有一些表现在数学对象的外表,如精美的图形、优美的公式、巧妙的解法等等,但总的来说数学中的美还是深深地蕴藏在它的基本结构之中,这种内在的理性美学生往往难以感受、认识和理解,这也是数学区别于其它学科的主要特征之一。二是长期以来,我们的数学教材过分强调逻辑体系和逻辑推演,忽视数学美感、数学直觉的作用,长此以往,学生将数学与逻辑等同起来。一味注重数学的逻辑性而忽视了数学本身的美,学习的过程中就会感到枯燥无味缺乏兴趣。

大多数的数学家会由他们的工作及一般数学里得出美学的喜悦。他们形容数学是美丽的来表示这种喜悦。有时,

数学家会形容数学是一种艺术的形式,或至少是一个创造性的活动。通常拿来和音乐和诗歌相比较。 数学之美还在于其对生活的精确表述、对逻辑的完美演绎。可以说正是这种精确性才成就了现代社会的美好生活。

它的最美之处莫过于在无形之中就让你思维变得敏

捷.考虑事情时,不在那么偏激,那么单一.作为一个公民来说了不了解它是一个后话,至少应该不否定它.尤其是学生.

让我们先来看看看下面的算式:

1 x 8 + 1= 9

12 x 8 + 2= 98

123 x 8 + 3= 987

1234 x 8 + 4= 9876

12345 x 8 + 5= 98765

123456 x 8 + 6= 987654

1234567 x 8 + 7= 9876543

12345678 x 8 + 8= 98765432

123456789 x 8 + 9= 987654321

1 x 9 + 2= 11

12 x 9 + 3= 111

123 x 9 + 4= 1111

1234 x 9 + 5= 11111

12345 x 9 + 6= 111111

123456 x 9 + 7= 1111111

1234567 x 9 + 8= 11111111

12345678 x 9 + 9= 111111111

123456789 x 9 +10= 1111111111

9 x 9 + 7= 88

98 x 9 + 6= 888

987 x 9 + 5= 8888

9876 x 9 + 4= 88888

98765 x 9 + 3= 888888

987654 x 9 + 2= 8888888

9876543 x 9 + 1= 88888888

98765432 x 9 + 0= 888888888

1 x 1= 1

11 x 11= 121

111 x 111= 12321

1111 x 1111= 1234321

11111 x 11111= 123454321

111111 x 111111= 12345654321

1111111 x 1111111= 1234567654321

11111111 x 11111111= 123456787654321

111111111 x 111111111= 12345678987654321

3 x 4=12

33 x 34=1122

333 x 334=111222

3333 x 3334=11112222

33333 x 33334=1111122222

333333 x 333334=111111222222

142857 x1=142857

142857x 2=285714

142857x 3=428571

142857x 4=571428

142857x 5=714285

142857x 6=857142

142857x 7=999999

看看数字之和表示什么

现在让我们研究一下其他的问题吧!

从数学角度出发,101%>1是毋庸置疑的。然而当一个人说想要付出101%的努力又意味着什么呢?

我们都曾经历过这样的画面:有人站在你面前,信誓旦旦的说要付出超过100%的努力。然而这可能吗?

这里有一个小小的数学公式可以帮助你回答这个问题:

如果用1% 2% 3% 4% 5% 6% 7% 8% 9% 10% 11%

12% 13% 14% 15% 16% 17% 18% 19% 20% 21% 22% 23% 24% 25% 26%

来代替A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

那么单词 H A R D W O R K(努力工作)

即为 8%+1%+18%+4%+23%+15%+18%+11%= 98%

然后单词 K N O W L E D G E (知识)

即为

11%+14%+15%+23%+12%+5%+4%+7%+5%= 96%

单词 A T T I T U D E(态度)

即为 1%+20%+20%+9%+20%+21%+4%+5%= 100%

短语 L-O-V-E-O-F-G-O-D(上帝之爱)

即为

12%+15%+22%+5%+15%+6%+7%+15%+4%= 101%

因此,由数字得出的结论是:努力工作和知识可以让你离成功很近,态度可以助你成功,而上帝之爱才可以真正的推你到顶峰。

数学美的内容

随着数学的发展和人类文明的进步,数学美的概念会有所发展,分类也不相同,但它的基本内容是相对稳定的,

这就是:对称美、简洁美、统一美和奇异美。

对称美

所谓对称性,既指组成某一事物或对象的两个部分的对等性,从古希腊的时代起,对称性就被认为是数学美的一个基本内容。毕达哥拉斯就曾说过:“一切平面图形中最美的是圆,在一切立体图形中最美的是球形。”这正是基于这两种形体在各个方向上都是对称的。

中国的建筑就很好的应用了数学的对称美,有许多的园林建筑都应用了这一点。

数学中的这种对称处处可见:几何中具有的对称性(中心对称、轴对称、镜象对称等)的图形很多,都给我们一种舒适优美的感觉。几何变换也具有对称性。

杨辉三角更组成美丽的对称图案

1 1

1 2 1

1 3 3 1

1 4 6 4 1

1 5 10 10 5 1

1 6 15 20 15 6 1

……

分析:在杨辉三角的图案中每一行的除了首尾的数字是1以外,其他的数字是左上角和右上角的数字的和。这

样就构成了有规律的并且是成对称的形状的三角图案了。

数学的解题中也体现对称美:

例1、

解:原式=111111111×111111111

=12345678987654321

分析:分式的分子是九个九乘以九个九,分母是九个数字的和并且成对称的,结果也是九个数字组成的对称的结构,真是太出人意料了太美妙了

例2、 0×9+1=1

1×9+2=11

12×9+3=111

123×9+4=1111

1234×9+5=11111

…………………

此外代数中的对称多项式,有理系数的多项式方程无理根成对出现,实系数的多项式方程虚根成对出现,函数及其反函数图象的关系,线性方程组的距阵表示及克莱姆法则等都呈现出对称性。

还有一个类似对称的词匀称。“匀称性”的概念可以看成“对称性”的概念的自然发展。线段的黄金分割就是一个典型的例子,主要是因为由此构成的长方形给人以“匀称美”

的 感觉。黄金分割比 …也被誉为“人间最巧的比例”。世界上许多著名的建筑广泛采用黄金分割的比例。一些名画的主题,电影画面的主题大多放在画面的0.618处,给人以舒适的美感。乐曲中较长一段一般是总长度的0.618,弦乐器的声码放在琴弦的0.618处会使声音更甜美。另外,黄金分割比在优选法中有着重要的作用。

简洁美

汉语的语言要求言简意赅,同样数学作为逻辑性很强的学科它的语言表达也是简洁的。

简单性(或称简洁性)也是数学美的一个基本内容。数学的简洁性是人类思想表达经济化要求的反映,它同样给人以美感。爱因斯坦说过:“美在本质上终究是简单性。”

数学语言本身就是最简洁的文字,同时反映客观规律极其深刻,许多复杂的客观现象,总结为一定的规律时,往往呈现为十分简单的公式。

欧拉给出的公式:V-E+F=2,堪称“简单美”的典范。世间的多面体有多少没有人能说清楚。但它们的顶点数V、棱数E、面数F,都必须服从欧拉给出的公式,一个如此简单的公式,概括了无数种多面体的共同特性,令人惊叹不已。在数学中,像欧拉公式这样形式简洁、内容深刻、作用很大的定理还有许多。

比如:圆的周长公式:C=2πR 任意一个圆它的周

长都满足这样的公式。勾股定理:

数学中绝大部分公式都体现了“形式的简洁性,内容的丰富性”。正如伟大的希而伯特曾说过:“数学中每一步真正的进展都与更有力的工具和更简单的方法的发现密切联系着”。

统一美

所谓统一美,是指部分与部分、部分与整体之间的和谐一致。

在数学中有好多数学统一性的例子。例如,引入负数,有了相反数的概念之后,有理数的加法和减法得到统一,它们可以统一为代数和的形式。有了倒数的概念,除以一个不等于零的数等于乘上它的倒数,于是乘法与除法得到了统

一。例如平面几何中的相交弦定理、割线定理、切割线定理和切线长定理均可统一到圆幂定理之中。统一美反映的是审美对象在形式或内容上的某种共同性、关联性或一致性,它能给人一种整体和谐的美感。数学对象的统一性通常表现为数学概念、规律、方法的统一,数学理论的统一,数学和其它科学的统一。

奇异美

人们提起数学的时候通常会说“奇妙的数学”,数学的学习和解题中也有一些非常规的奇妙的解法等等。这些就是我们通常说的数学的奇异性。

弗兰西斯·培根曾说:“没有一个极美的东西不是在匀称中有着某种奇异。”这句话的意思是:奇异存在于美的事物之中,奇异是相对于我们所熟悉的事物而言。一个事物十分工整对称、十分简洁或高度统一,都给人一种奇异感,一个新事物、新规律、新现象的被揭示,总是使人们感到一种带有奇异的美感,令人产生一种惊奇的愉快。数学审美对象的奇异性有以下几种典型表现形式。奇异性是数学美的一个重要特征,它反映了显示世界中非常规现象的一个侧面,也是数学发现中的重要美学因素。数学领域中的一些新的观念的产生,就是来自对奇异美的追求。

关于数学的奇异性,接下来讲一个蒲丰用投针求圆周率的近似值的试验也是数学方法奇异性的一个典型例子。有一天蒲丰邀请许多宾朋来家做了一个奇特的实验。他事先在白纸上画好了一条条有等距离的平行线,将纸铺在桌上,又拿出一些质量匀称长度为平行线间距离之半的小针,请客人把针一根根随便仍到纸上,蒲丰则在一旁计数,结果共投2212次,其中与任意平行线相交的有704次,蒲丰又做了一简单的除法 ,然后他宣布这就是圆周率的近似值,还说投的次数越多越精确。这个实验使人震惊,圆周率和一个表面看来毫不相干的随便投针实验沟通在一起。然而,这确实是有理论根据的。计算圆周率的这一方法新颖、奇妙而让人叫绝,充分显示了数学方法的奇异美。

在教学“奇妙的9”时,举了一些式子也是数学奇妙性的反映

2×9=18 1+8=9

13×9=117 1+1+7=9

26×9=234 2+3+4=9

56×9=504 5+0+4=9

78×9=702 7+0+2=9

通过观察,他们发现任意的一个自然数乘9,乘的的积的各个数位上的和均为9,这是多么美妙的发现,学生在体验到成功的喜悦的同时,也体会到了数学的神奇美。

奇巧的东西给人以奇异、巧妙之感,高度的奇巧更是令人赏心悦目。数学中充满着奇巧的符号、公式、算式、图形和方法。欧拉给出的著名公式eip+1=0,将最基本的代数数0,1,i和超越数p,e用最基本的运算符号,通过最方便的方式巧妙的组合在一起,可谓数学创造的艺术精品。欧拉求无穷级数 1/n2和的方法、蒲丰投针求p值的方法、希尔伯特解决果尔丹问题的存在性证明方法,都以其巧妙而赢得学术界的高度赞美。

神秘的东西都带有某种奇异色彩,使人产生幻想和揭示其奥妙的欲望。某些数学对象的本质在没有充分暴露之前,往往会使人产生神秘或不可思议感。比如,在历史上,

虚数曾一度被看作是“幻想中的数”、“介于存在和不存在之间的两栖物”;无穷小量dx曾长期被蒙上神秘的面纱,被英国大主教贝克莱称为“消失了量的鬼魂”;彭加勒把集合论比喻为“病态数学”,外尔则称康托尔关于基数的等级是“雾上之雾”;非欧几何在长达半个世纪的时间内被人称为“想象的几何”、“虚拟的几何”等等。当然,当人们认识到这些数学对象的本质后,其神秘性也就自然消失了。

。 比例美

黄金分割又称黄金律,是指事物各部分间一定的数学比例关系,即将整体一分为二,较大部分与较小部分之比等于整体与较大部分之比,其比值为1∶0.618或1.618∶1,即长段为全段的0.618。0.618被公认为最具有审美意义的比例数字。上述比例是最能引起人的美感的比例,因此被称为黄金分割。

条上凝聚了多少形象的数学……真可谓哪里有数学,哪里就有美。

篇九:数学之美_3200字

数学,我们心中的一泓清泉爱美之心,人皆有之,人们执著地追求美。什么是“美”?晓风残月是美,大漠黄沙是美,桃红柳绿是美,草原戈壁是美,富丽堂皇是美,古朴雅致是美,可是除了大自然的美、艺术的美之外,人们是否想过数学也有美呢。每天埋头苦读微积分,数学分析,高等数学等数学书籍,我们总是感觉到头疼脑胀;写着拉格朗日,专研泰勒公式,对着罗尔定律发呆,我们总是埋怨数学虽博大精深,但却晦涩难懂,引起许多同学的有苦难言。然而我们却没有从数学的本质上去挖掘,去细心品味,他在我们的游戏中,经济中,自然中,生活中,甚至音乐中,会给我们带来多少美的享受。

经济中的数学之美

数学是意境深远的经济,让你惊叹不已。

经济学的发展离不开数学的推动,尤其是数学思想的巨大应用,使得经济学从某种意义上成为了一门真正的科学。数学在经济学领域中的发展取得了空前的成果,体现在所运用的数学知识的广度和深度上。于是,就产生了一些规范运用数学方法分析经济现象的学科,如计量经济学、数理经济学,博弈论的应用等。伴随着这些学科的不断发展,归纳演绎的方法也被越来越多地作为一种重要的方法来进行经济现象的分析和经济理论的论证,从而经济学的结论也变得越来越具有说服力。早期,马歇尔建立微观经济学起,导数的思想就被大量的引入;之后的瓦尔拉斯建立一般均衡理论更是运用到了导数分析的思想和方法。

下面就简要分析一下。对于一个理性人来说,总是追求自身利益的最大化,同时付出的投入最小化。这在资源稀缺而人欲望无限的假设前提下是合理的,牵涉到数学中的最优化问题,关键是如何刻画这种最优化的条件,如何使之满足最优化,这个问题的解决运用的便是导数的思想。假设市场上有许多中商品X 1, X 2„Xn ,对应的价格为P1 ,P2 „P n ,其次对于一消费者来说,收入是既定的I,再次对于同一种商品来说,多的总比少的要好,即同一种商品,数量越大,越能使消费者得到满足。为了精确地描述消费者从消费产品中得到的满足程度的大小,我们引入效用函数的概念,效用函数是与消费品的数量有关的,即

U=U( X1 , X2 „X n )又基于收入的既定性,那么购买一定数量的产品所消耗的金钱数必定限制在收入范围以内,即∑Xi*Pi=<I.那么我们的问题如果用现在的角度来看就变得简单了,用一个纯粹的数学观点来看,不过是一道非常普通的微积分最优化问题。 MaxU=U( X1 , X2 „X n )

S.T. ∑Xi*Pi=I

经过简单的推导,可以得到最终的结果:为了使得消费者效用最大化,只需满足 аU/аXi=λ(常数)

音乐中的数学之美

数学是旋律优美的音乐让你听之动容。

音乐的悠远清扬点缀的是文化的感性美,数学的深沉厚重诠释的是文化的理性美,二者有着各自不同的学术领域,然而在这感性和理性之间,不只为着其自身存在的价值,还在冥冥之中有着千丝万缕的联系。其实在跳动的音符之中数学美也融在了其中。

最早将音乐与数学联系起来的研究要追溯到公元前6世纪的毕达哥拉斯学派,他们用比例把二者有机结合了起来。乐声的协调与所联系的整数之间有着密切的关系,拨动一根弦发出的声音取决于绷紧的弦的长度。协和音由长度与原弦长的比为整数比得弦给出。另外被拨动的每一种和谐的结合,都能表示为整数比,由增大成整数比的弦的长度,能够产生全部的音阶。除了乐声的协调与所联系的整数之间有着密切的关系之外,乐理中也存在着有趣的数学规律。例如在音程转位方面,对单音程而言,原音程及其转位音程的度数之和为9。在音符方面,小于全音符的诸音符由除法确定,如二分音符为全音符的1/2,四分音符为全音符

的1/4。拍子是拍的分组,如3/4拍子是以全音符的1/4为一拍,每小节有3拍,即3*1/4=3/4,而6/8拍子可认为以全音符的1/8为一拍,每小节有6拍,即6*1/8=6/8。这样说3/4拍子=6/8拍子了?明显不是,数学推动了音程转位的发明。再说乐曲结构与黄金分割之间也存在着一种和谐美。懂音乐的人如果分析一下乐曲的结构会发现它显然受斐波拉契数列的制约。另外和声还可以用傅里叶函数来分析。根据傅里叶定理,每个乐音都可以分解为一次谐波与一系列整数倍频率谐波叠加。假设do的频率是f,那么它可以分解成频率f,2f,3f,4f„.的谐波的叠加,即f1(t)=sinx+sin2x+„+sinnx+...;同理,高音do的频率是2f,同样可以分解为频率2f,4f,6f,8f„.的谐波的叠加,即f1(t)=sin2x+sin4x+„+sin2nx+....。这两列谐波的频率有一半是相同的,所以do和高音do是最和谐的。

自然中的数学美

数学是自然中色彩斑斓的花园,让你流连忘返。

数学并非只是我们在学校所学的计算方法和各种数字、公式,而是构成大自然和谐有机的基础。在大自然中,无论动物、植物、矿物甚至雨滴、雪花,均有自己的数学模式或数字形式。数学的美构成了大自然奇异的美。每当太阳从地平线上升起时,蜜蜂中的侦查蜂就会飞出去侦查蜜源,回来后用独特的“舞蹈语言”报告花蜜的方位、距离和数量,于是蜂王便分派工蜂去采蜜。奇怪的是,它们的“模糊数学”相当的精确,派出去的工蜂不多不少恰好都能吃饱,保证回巢酿蜜。此外,工蜂的蜂巢也十分奇妙。它有严密的角棱柱体,其一端是六角形开口,另一端则是封闭的六角棱锥体的底和三个相同的菱形。18世纪初,法国学者马拉尔迪曾经测量过蜂巢的尺寸:组成底盘的菱形的所有钝角等于129°28′,所有的锐角等于70°32′。后来经瑞士数学家柯尼希和苏格兰数学家马克劳林通过理论计算,如果要消耗最少的材料,制成最大的菱形容器正是这样大小的角度。

大自然不仅创造了一些简单的图形 ,而且还创造了一些种类复杂的数学设计图样 ,这其中就包括各种螺旋线 .例如 ,鹦鹉螺壳便是一种等角螺线 ,也叫对数螺线 .这可从鹦鹉螺壳的剖面图得知 .从图上可以看到一个个间隔 ,显然在任何给定时刻只有最外面的间隔才是这动物的家 .而这些小房间的间隔所形成的射线与螺壳的外边缘总是交成定角 .另外 ,从象的牙齿、野山羊的角、甚至金丝雀的脚爪里也可以看到对数螺线 .在植物中向日葵的小花、延命菊花心的小花、松果的鳞片、菠萝的瘤状物等都呈现出近似于完善的两族螺旋线 ,且转向相反 .令人惊奇的是它们与一个著名的数列斐波那奇数列有着密切的关系 .斐波那奇数列为 1,1,2 ,3,5 ,8,13,2 1,34 ,5 5 ,„ .可以看到 ,该数列自第三项起 ,其数值等于紧接在其前面的两个数之和 .而松果中的两族螺线数的比为5∶8,菠萝中的比为 8∶13,延命菊花的比为 2 1∶34 ,向日葵花的比为 34∶5 5 ,可见其比值对应于两个相邻的斐波那奇数 ,且逐渐趋于“黄金比”0 .6 18.

游戏中的数学之美

对于三国杀,相信大家并不陌生。这一新型而又好玩的游戏,遍布整个校园。这个游戏中一共有四种角色,分别是:主公,忠臣,反贼,内奸。想必大家都知道他们是干啥的吧,没错,主公于忠臣是杀光反贼与内奸,反贼是杀掉主公推翻暴政,内奸是杀光自己人以外的所有人,首先,给每人抽一张身份牌,在发给五张将卡,任选一个,将卡上面有血量,各自拿到相应的血卡,便开始紧张的游戏了。游戏过程中如何使自己胜算更大,概率论告诉你。 三国杀一共有108张,用p*表示某次摸牌摸到无中生有的概率,有p*=a*/s, a*是无中生有的张数,s是总张数,在某次无中生有摸到的两张牌中至少有一张无中生有的概率是1-(1-p*)×(1-p*),由于p*很小,尽似取为 2p*。实际情况a*=4,s=109,p*=0.037. 定义n次无中生有的牌中还有无中生有的情况为n+1阶无中生有,于是从上面的推理中我们得到: 高阶无中生有可以忽略。

下面我们开始计算黄月英附加摸牌张数的期望a。在这里也要做一个假设,黄月英会将所有

篇十:数学之美_20200字

数学的应用

概率论的一些应用

梁博

(数学院 计算数学专业 0410144)

概率论是一门与现实生活紧密相连的学科,不过大多数人对这门学科的理解还是很平凡的:投一枚硬币,0.5的概率正面朝上,0.5的概率反面朝上,这就是概率论嘛。学过概率论的人又多以为这门课较为理论化,特别是像母函数,极限定理等内容与现实脱节很大,专业性很强。其实如果我们用概率论的方法对日常生活中的一些看起来比较平凡的内容做些分析,常常会得到深刻的结果。

在谈及应用之前,先澄清一下多数人在概率方面的一个误解。大部分人认为一件事概率为0即为不可能事件。这是不对的,比如甲乙玩一个游戏,甲随机地写出一个大于0小于1的数,乙来猜。①乙一次猜中这个数②乙每秒猜一次,一直猜下去,“最终”猜中这个数。这两件事发生的概率都是0,但显然它们都有可能发生,甚至可以“直观”的讲②发生的可能性大些。这说明概率为0的事也是有可能发生的。不过在我看来,这样的可能性实在是太小了,在实际的操作中认为不可能也是有道理的,但不管怎么说,它们确是可能事件。

来看一个赌博的例子。在我国南方流行一种称为“捉水鸡”的押宝,其规则如下:由庄家摸出一只棋子,放在密闭的盒中,这只棋子可以是红的或黑的将、士、象、车,马、炮之一。赌客们把钱押在一块写有上述12个字(6个红字、6个黑字)的台面的某个字上。押定后,庄家揭开盒子露出原来的棋子。凡押中者(字和颜色都对)以1比10得到赏金,不中者其押金归庄家

通过简单计算便知,当一个赌徒押上1元之后,其期望所得(即平均所

元。因此这是不公平的赌博。当然了,多数

得)为元,也就是说,其净收益的期望为

赌徒即使不懂概率论,也应该明白自己参与的是不公平赌博,不过他们由于的侥幸心理,抱着寻求刺激的想法,还是会义无反顾地参与进去。但由概率论的原理我们知道,长期负期望的累积,其结果必然为负,也就是说,长期的赌博,结果必然会输,那种“万一运气好”的侥幸心理是不科学的。所以说,我们不仅从社会要求上不应参与赌博,从结果上看,我们也不应赌博。

再看一个应用:在12只金属球中,混有一只假球,并且不知道它是比真球重或轻,用没有砝码的天平来称这些球,试问至少需要多少次称量才能找出这个假球,并确定它是比真球轻或重

为了讲清概率论在这个问题中的应用,先讲一下熵的概念。熵是概率论的分支

学科--信息论中的概念,它是一个实验不确定程度的量度,熵越大,说明该实验的不确定性越高。比方说,扔一枚硬币是一个实验,扔一枚色子也是一个实验,直观地讲,我们说前者的不确定性要小些;计算结果,前者的熵为

后者的熵为

,我们要在若干次称量后将其不确定性降为

0,也就是要其熵降为0。每用天平称量一次(随便怎样称),天平都有3种结果,于是最多获得

也就是

的信息。令

至少进行3次实验才能完成要求。当然,这是理论上最少的结果,我们还要找到一

个现实可行的方案,实际上,这样的方案也是有的,所以说得到的解是正确的结果。这种方法将看似是智力测验的题目用数学方法解决了。其实用这种方法还可解决4次使用天平,能判断最多多少个球的真假轻重情况的问题。关于这点,可以这样考虑:第一次称量时,所有的球只有两种可能:要么在天平上,要么没有在天平上,且在天平上的球数须是偶数,否则进行的称量是得不到有用的信息的。设在天平上的球数为

,不在天平上的球数为

个球中,且其轻重已知(若假球是左盘上的一

只则假球比真球重,否则比真球轻)。判断这熵为

个球中哪个球为假球(轻重已判)的实验的

最大值是13,于是4次使用天平,最多可判断38枚

球的真假及轻重情况,具体办法也是有的,由于比较繁琐,这里就不列举了。实际上,把这种方法通过观察、归纳、总结,可得更一般的结论:球的真假和轻重状况

数学与彩票

闫楠

(数学学院 数学与应用数学 0510114)

我们经常听到这样的消息“××市中出500万大奖”。现在,购买彩票渐渐成为普通老百姓经济生活的重要组成部分,许多人都梦想可以一夜暴富,而彩票就提供了这种梦想实现的舞台。彩票与数学有着天然的联系,尤其与数学的一个分支——概率密不可分。而概率学本身就来源于古代博彩游戏。看来,彩票的出现也促进了数学的发展。

英国《不列颠百科全书》解释彩票为“通过抽签摇奖,凭机会在一定范围内的人们中分配奖品或奖金”。当今世界共有110多个国家在发行彩票,按特征分类主要有传统型彩票,即开型彩票,乐统型彩票和透透型彩票。前两者为被动型的,传统型事先在彩票上印好顺序号码,不能有彩民自己选择号码,彩票销售结束后由发行部门摇奖,这种彩票简单明了,不需研究概率对策,全凭运气。即开型,顾名思义,“即开即兑彩票”。本文不讨论这两种被动型彩票,主要讨论其余三者主动型彩票与数学的关系。

各种彩票对自己的当期设奖金额,调节基金都有规定。设奖金额包括当期金额和调节基金。奖金调节基金用于浮动奖奖金保底、派发特别奖、支付各种不可预见情况下的奖金支出等。有的彩票只有固定奖,有的彩票奖金分为固定奖和浮动奖。固定奖按固定金额兑付,一般被称为是低等奖;浮动奖按确定的比例分配,这样的等级一般称为高等奖。当期奖金总额减去奖金调节基金和固定奖总额后剩余部分,构成浮动奖

接下来本文从三个方面来研究彩票与数学的关系。 1 彩票的玩法介绍及概率

现在全国范围内发行的彩票分为中国福利彩票和中国体育彩票两种。全国范围内发行的中国福利彩票主要有双色球,七乐彩,3D。体彩有七星彩,排列三,排列五,足彩胜负,半全场/进球,篮球彩票,22选5。彩票概率的计算基本上是古典概率的计算。

Ⅰ 乐透型彩票 乐透型彩票主要特征为

第一、 投注者在m个数中选出n个数码,奖金依所选号码猜中多少,不论顺序如何,自成等级。由于乐透彩票中奖号码不排序,是一种组合式游戏,所以又称为组合式玩法的彩票。

第二、 往往采用一个从r个数中选取一个附加号码,用于二等奖以下的奖级,作用是调整奖级结构,提高中奖比例。

双色球,七乐彩,22选5都是乐透型彩票。具体设置如下表:

m n r

双色球 33 6 16

七乐彩 30 7 1

22选5 22 5 0

1、双色球中奖条件为

奖级

中奖条件

红色球号码

蓝色球号码

说明

一等奖 二等奖 三等奖 四等奖

●●●●●● ●●●●●● ●●●●● ●●●●● ●●●●

●●●● ● ●

选6+1中6+1 选6+1中6+0 选6+1中5+1 选6+1中5+0或中4+1

五等奖 ●●●● ●●●

选6+1中4+0或中3+1

六等奖 ●● ●

选6+1中2+1或中1+1或中0+1

注:一等奖二等奖被称为是高等奖,奖金是浮动的。一等奖奖金为当期高等奖奖金的70%和奖池中累积的奖金之和。二等奖奖金为当期高等奖奖金的30%。二等奖以下的奖

是低等奖,奖金是固定的金额的。三、四、五、六等奖的奖金依次为3000、200、10、5.

将所有概率之和相加,可得中奖总概率为6.740×10。高等奖中奖概率为9.59×10。

−2

−7

中奖总概率为3.31×10−2 3、22选5 总概率为5.49×10−2

Ⅱ 数字型彩票

七星彩,排列三,排列五,3D都是数字型彩票。

数字型彩票是每个号码是一个n位数,每个数字从0-9中选出。上面四种玩法的位数分别对应各自叫法的数字,七星彩对应7个数字,排列三与3D对应三个数字,排列五对应五个数字。且排列三与3D玩法完全一样,但前者是体彩的,后者是福彩的。

1、排列三(3D)

排列三的每一期的摇出的一个号码对应了三种不同的小玩法及兑奖方式,分别为

中奖条件为:

(1)

(2)“组选 3”:中奖号码中任意两位数字相同,所选号码与中奖号码相同且顺序不限,则该注彩票中奖。例如,中 奖号码为 544 ,则中奖结果为: 544 、 454 、 445 之一均可。

(3)

实际上,直选投注只是一个数字的排列问题,“组选 3”

显然,直选投注的中奖概率为0.001,“组选 3”中奖概率为0.003,

2、排列五

排列五与排列三的直选投注完全相似,只是三个数字变成了五个数字,也是一个固定奖,中奖奖金为100000。他的中奖概率为10−5。

3、七星彩

七星彩的中奖条件就比较复杂一点。中奖级别分为6个级别。

彩票7位数号码与中奖号码排列相同的叫特等奖。剩下的n等奖对应彩票号码中连续(7-n)位数号码与中奖号码相同位置的连续(7-n)位数相同,例如五等奖就是彩票号码中连续2位数号码与中奖号码相同位置的连续2位数相同,如彩票12□□□□□、□23□□□□、□□34□□□、□□□45□□、□□□□56□、□□□□□67。

特等奖至二等奖被称做是高等奖,奖金浮动。三、四、五等奖为固定金额,分别为300,20,5元。

特等奖奖金为总奖金减去固定奖总额后的75%,加上期滚存的奖金; 一、二等奖奖金为总奖金减去固定奖总额后的15%和10%;

等级

中奖形式

计算概率有可能重复的形式

特 一

abcdefg abcdef× ×bcdefg

abcde×× ×bcde× ××cdefg

abcd××× bcde××× ×cdef×× ×××defg

abc×××× ×bcd××× ××cde×× ×××def× ××××efg

ab××××× ×bc×××× ××cd××× ×××de×× ××××ef× ×××××fg

ab×de×× ab××ef× ab×××fg ×bc×ef× ×bc××fg ××cd×fg

423

9×10×2+9×10×

概率的分子的计算式子

1 9×2

概率

10−7

1.8×10−6

9×10+9×9+9×10

2.61×10−5

9×102+92×10+10×3.4×10−4

92+9×102

abc×efg

9×103+92×102+92×102+92×102+9×

4.239×10−3

103-9

4.994×10−2

4—92×10—93—9×10×9—9—9×10

注:概率计算式子的分母一律为107。 可得中奖总概率为5.45×10−2 Ⅲ、透透型彩票

这是一种有奖竞猜方式的彩票,常见于配合赛马、足球等体育比赛而发行的体育彩票。足彩胜负,半全场/进球,篮球彩票都属于透透型彩票。作为数学问题我们不考虑现实比赛中的弱队强队的因素,只单纯考虑纯数学计算的概率。

1、胜负游戏

由购买者从中国足球彩票胜负玩法选择的所有竞猜场次每场比赛在全场90分钟(含伤情补时)比赛的胜平负的结果进行投注。

一等奖猜中全部14场比赛的胜平负结果;奖金为当期奖金总额的70%,及奖池和调节基金转入部分;

二等奖猜中其中13场比赛的胜平负结果。奖金为当期奖金总额的30%。

11

13−7−61413C

易得中一等奖概率为3=2.09×10,中二等奖概率为14×3=2.93×10.中奖总概

率为3.139×10

2、任选九场

购买者从中国足球彩票胜负玩法选择的所有竞猜场次中的任意9场竞猜场次中每场比赛在全场90分钟(含伤情补时)比赛的胜平负的结果进行投注,全部猜中即中得唯一的奖项,为当期奖金额的100%,及奖池和调节基金转入部分。

−6

−59

显然,中奖概率为3=5.08×10。

3篮球每场

投注者猜出主客两支队伍在上半场结束和全场结束时得分的个位各是多少。因数字是从0到9。故中奖概率为10,只设一个奖项,奖金为9800。

4六场半

由购买者对6场比赛中每场比赛上半场和全场结束时胜平负结果进行投注,全部正确即中唯一的奖项。奖金为浮动奖金,为当期奖金额的100%,及奖池和调节基金转入部分。因

−4

−612

此,中奖概率为3=1.88×10。

5四场进球

由购买者对4场比赛8支球队在全场的进球数量(0、1、2、3+)进行投注,投注结果与实际比赛结果全部相同,即中唯一的一个奖项,奖金为当期奖金额的100%,及奖池和调节基金转入部分。

−58

因此,中奖概率为4=1.53×10。

2 彩票的期望

双色球、七星彩、排列三、排列五,篮球每场设奖金额为当期销售总额的50%,其中当期奖金为49%,调节基金为1%。剩下的几种透透型彩票设奖金额都为当期销售总额的65%,其中当期奖金为64%,调节基金为1%。因此从表面上看,所有的设奖基金都发送给了彩民,无论你何时中奖。因此,前面几种玩法的中奖期望为1元,后面几种的期望为1.3元。 3 彩票的设置

从我们计算出的各种彩票的中奖概率来看,概率越小,奖金越大,这是彩票发行设计合理的一个基本标准。奖金的数额是根据已确定的设奖金额及玩法的概率来确定。最明显的就是排列三的设置。他的设奖金额都是固定的,十分容易看出。设奖金额为销售总额的50%,而一张彩票2元,故1元要通过设奖返还给彩民。因单注中奖概率为0.001,故每注奖金为

11

=1000元。“组选三”中奖概率为0.003,故奖金为=333元左右。“组选六”0.0010.003

中奖概率为0.006,故奖金为

=166元左右。而计算结果与实际略有微小的误差,则0.006

是将金额投入奖池中,确保以后每期中奖不至于无钱可出。由此可见,美种玩法设置奖金数额与中奖概率密切相关。 4 彩民的选择(透透型除外)

彩民中经常会流行一些所谓的彩票号码的潜规则,这一般都是人们对彩票号码最原始的反应反应,是一个感性认识,我们来分析一下这些说法在数学上站不站的住脚。

Ⅰ、绝对不选像“1234567”“5555555”之类特征极其明显的号码。

分析:这是一个误区。很简单一句话,所有的号码概率都是一样的,都是彩票号码样本容量分之一。感觉他们不可能出现的原因是没规律的号码要比有规律的号码多的多,因此感觉没规律的更容易中奖。但归结到单注号码上,所有号码的中奖概率是一样的。

Ⅱ购买彩票时,要对号码进行大小,奇偶,区间的分布预测。例如,大号小号应该各占一半,,奇偶数应该各占一半。

分析:在样本容量很大时,上面的说法是符合数学原理的。但事实上,中奖号码才区区几个数字,根本就不适用于这个方法。因此,这样的说法也没什么科学性。

Ⅲ、每次购买同一个号码,可以提高中奖率。

分析:这也没什么科学性。彩票是彩民买的,而彩民买彩票时,每一注概率都相等,假

n

(1−P)如中奖概率为P,买了n注彩票,则中奖概率为,与选什么样的号码是无关的。

Ⅳ、买彩票应该细水长流,每次买的注数不多,要比孤注一掷花很多钱中奖机率大。

分析:假设某彩民准备用2n元买n注彩票。他分k次买彩票,每次买ak注。即

a1+a2+a3+...+ak−1+ak=n

我们来计算中t注奖,当k, a1--ak分别多少时,中奖概率大。设第i次有bi注中奖。则bi≦ai,且b1+b2+b3+...+bk−1+bk=t。设单注中奖概率为p,则中奖概率为

P= p1(1−p)

b

a1−b1

×p2(1−p)

b

a2−b2

×p3(1−p)

b

a3−b3

×…×pk(1−p)

b

ak−bk

=Pt(1−P)n−t

因此,只要是花同样的钱,细水长流与一次购买中奖概率是一样的。

由此,我们也可以看到,彩票是绝对不可以预测的。如果中奖号码真如一些所谓的专家或软件所说的可以预测。那么,他们完全没有必要靠出书,买软件赚几个小钱,可以直接买

彩票中大奖。不可预测,不可能有增大概率的方法,这才体现出了彩票的公平性。我们通过数学的方法可以看出那些整日寄希望于买彩票一夜暴富而花大力气研究彩票的人则是十分可悲的。毕竟彩票只是一种游戏,一是自己娱乐,而是可以为社会做贡献。能中奖必是好事,不能中奖也无所谓,不可为了研究彩票而耽误工作,费了大功夫,完全没有效果,那样就得不偿失了。

通过上文的分析,我们可以看出彩票与数学的紧密联系。彩票推动了大众对数学研究的乐趣,许多彩民为了买彩票而研究概率问题,倒是为概率学习的普及做出了贡献。而数学也给了彩票发行者设奖依据。

参考文献:

[1]《彩票方案的数学模型》(赵永辉 薛 鋆 李 洪) [2] 中国体彩网 [3] 中彩网

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

从择近原则看数学在中医中的应用

张远

(化学院 药学 0511039)

摘要:祖国传统医学受中国古代哲学思想的影响和指导,经过长期的医疗实践积累,逐渐形成了自己独特的医学理论体系。模糊数学中的模式识别、聚类分析、综合评判等均适用于中医的辨证论治。本文尝试以模糊数学论述中医的辨证论治。现结合中医辨证论治介绍模糊模式识别中按“择近原则”归类的群体模型的识别方法。

关键词:模糊数学;择近原则;中医;医学数学化;应用

1 择近原则用于中医的辨证论治 1.1模糊数学方法

1965年,美国学者扎德(Zadeh L A)提出了模糊数学的概念,在此后短短的几十年中,已在几乎所有科技领域(包括自然、技术、社会科学等)获得普遍的应用和发展,给许多学科研究带来了新的思路和发展契机。这使得利用现代数学所取得的成果促进中医学的发展已成为

可能。它的创立突破了明晰数学的禁区,扩展了数学的研究领域和应用范围,使数学从清晰现象扩展到模糊现象,使本来排斥不确定性的数学转而高度关注不确定性事物。

所谓模糊,一般是指事物在质上没有确切的含义,在量上没有明确的界限。事物在过渡过程中对一定质的隶属程度不断变化,正是模糊概念存在的基础。模糊性、模糊现象是客观存在的,是客观事物的一种属性,它的根源在于事物(包括人类思维)的发展变化,即动态性。事物的变化遵循质量互变规律,在质量互变过程中,都存在中介过渡过程,即存在亦此亦彼的模糊性,这便是模糊数学成立的客观根据和哲学基础。模糊性包括事物性质的模糊性和关系的模糊性。目前模糊数学研究的主要内容为模糊关系、模糊逻辑、模糊语言、模糊综合评判、聚类分析、模糊自动控制、模糊决策等等,并已广泛应用于科学技术各个领域。

模糊数学主要是为处理自然界及人类思维中普遍存在的模糊性现象而提出和建立的,是用数学方法研究和处理具有模糊性现象的科学,模糊数学方法的基础是模糊集合、隶属度函数和模糊算子。设给定论域U,U到[0,1]闭区间的任一映射UA:U→[0,1]|u→uA(u),都确定U的一个模糊子集A,U称为模糊集合的隶属度函数,UA(U)称为U对于A的隶属度,UA(U)的大小反映了模糊变量U对于模糊集合A的从属程度。模糊算子主要是指建立在集合论基础上的模糊集合的运算方法,如集合的代数运算和逻辑运算,模糊推理主要是利用模糊集合的运算来完成的。

1.2 择近原则在中医中的应用

中医学虽然没有模糊概念、模糊集合、隶属度、权系数等词句,但却是在自觉的巧妙的运用了模糊数学。中医学里的模糊概念和模糊量词,如寒、热、温、凉,其中虽未精确量化,但已有程度上的不同。模糊数学的出现使得这类概念的量化成为可能,也就使得用数学方法处理某些中医问题成为可能。

描述中医症候的语言:疼痛、隐痛、刺痛、绞痛、胀痛,微热、高热、潮热、烦热、寒热往来,面色萎黄及苔腻、脉浮等均带有模糊性。中医诊治是以望、闻、问、切四诊方法获取病人的症状与体征的。显然,这些症状与体征来自两个方面:一是病人的自我感觉(问诊获取),二是医生的感知(望、问、切获取)。然后,分析病因、病机、病位、属性,进行辨证论治。同时,任一疾病的全过程,病人的体征有所差异,还将要求医生对疾病的不同阶段给予辨证论治。

由临床实践表明:

(1)首先是在病人症状与体征的获取中或多或少带有病人和医生的主观因素以及获取的某些症状程度上无法精确量化而具有模糊性。

(2)在诊断为某一疾病时,不少的症状既可出现在A病也可现出在B病;

(3)某一疾病的典型症状,有的出现,有的可能不出现;

(4)即使已确认为某一疾病,但在辨证分型的过程中,各医生依据其临床经验可将该疾病辨证分为m个型或n个型等;

(5)在处方的选药与药量上也存在很大的差异。

上述反映了辨证论治的错综复杂性,也反映了模糊性贯穿于中医辨证论治的整个过程中。

模糊数学中的模式识别、聚类分析、综合评判等均适用于中医的辨证论治。现结合中医辨证论治介绍模糊模式识别中按“择近原则”归类的群体模型的识别方法。

根据集合论的要求,一个对象对应于一个集合,要么属于,要么不属于,二者必居其一,且仅居其一.这样的集合论本身并无法处理具体的模糊概念.为处理这些模糊概念而进行的种种努力,催生了模糊数学.模糊数学的理论基础是模糊集.

对于一个普通的集合A,空间中任一元素x,要么x属于A,要么x不属于A,二者必居其一.这一特征可用一个函数表示为:A(x)即为集合A的特征函数.将特征函数推广到模糊集,在普通集合中只取0,1两值推广到模糊集中为[0, 1]区间.若A为X上的任一模糊集,对任意0 1,记A={x|xX, A(x)},称A为A的截集。A是普通集合而不是模糊集。由于模糊集的边界是模糊的, 如果要把模糊概念转化为数学语言,需要选取不同的置信水平 (0,1) 来确定其隶属关系。截集就是将模糊集转化为普通集的方法.模糊集A 是一个具有游移边界的集合,它随值的变小而增大,即当1 <2时,有A1∩A2。

设:U为某病的一组典型症候群论域。

U={a,b,c,d,e}

a,b,c,d,e为U论域中的元素,表示该疾病的一组典型症候。它可通过大量病例资料 筛选而定。

Ⅰ、Ⅱ、Ⅲ为U论域上的三个模糊子集,对应为该疾病的三个型。

现对Ⅰ模糊子集中的每一个元素给定一个隶属度:

a|→0.8,b|→0.2,c|→0.1,d|→0.5,e|→0.3

上述隶属度的确定,通常可采取多位中医专家根据该症候在诊断中的重要程度打分, 然后取其平均值,或依据大量病历统计后给定。

这样就确定了一个模糊子集Ⅰ。

Ⅰ=(0.8,0.2,0.1,0.5,0.3)

同理解定义模糊子集Ⅱ、Ⅲ。

Ⅱ=(0.6,0.5,0.8,0.4,0)

Ⅲ=(0,1,0.5,0.3,0.8)

又设:A为某病人症候群的模糊子集。

A=(0.5,0.3,0.6,0.8,0)

A集中各元素的隶属度反映相应症候的轻重程度,若该症状不出现,则取零。现分别计算贴近度N(A,Ⅰ),N(A,Ⅱ),N(A,Ⅲ)。

A○Ⅰ=(0.5∧0.8)∨(0.3∧0.2)∨(0.6∧0.1)∨(0.8∧0.5)∨(0∧0.3)

=0.5∨0.2∨0.1∨0.5∨0

=0.5

A⊙Ⅰ=(0.5∨0.8)∧(0.3∨0.2)∧(0.6∨0.1)∧(0.8∨0.5)∧(0∨0.3)

=0.8∧0.3∧0.6∧0.8∧0.3

=0.3

模糊子集A与Ⅰ的贴近度N(A,Ⅰ)计算如下:

N(A,Ⅰ)=0.5[(A○Ⅰ)+(1- A⊙Ⅰ)]

=0.5[0.5+(1-0.3)]

=0.6

同理可得:

N(A,Ⅱ)=0.8

N(A,Ⅲ)=0.5

按“择近原则”判别,A归类为Ⅱ。

上述按模糊数学方法进行辨证分型,反映了多位中医专家的辨证水平。显然在诊断 上避免了单一医生的主观因素而更趋客观。

当然,这种辩证分型方法也可以用于西医的诊断中。

此外,这种判断方法也只是各种贴近度计算公式中的一种。上述使用的是格贴近度,在 实际使用中还有汉明贴近度,Euclid贴近度等。

尽管使用的贴近度公式可能各有不同,但利用择近原则进行模式识别的基本步骤是相同的:

1 提取特征,从而获得子集元素 ○

2 建立标准集和模糊子集 ○

3 利用判决法则(即贴近度公式)判定归属 ○

2 传统医学数学化

2.1 医学数学化发展简况

现代医学发展的一大趋势是从定性研究走向定量研究,经历着数学化的发展进程。但是,20 世纪前的情况并非如此,当时的医学与数学联系远远不如物理学与数学的联系那样密切,在自然科学和社会科学中,物理学率先与数学相结合,在数学化道路上首先迈出了第一步,并取得了丰硕成果,在十八、十九世纪成为带头学科,给其它学科以重要启示。天文学、工程学、化学等学科紧随物理学后尘,走与数学相结合的道路,也取得了重大发展。 生物学、医学等生命科学要发展,要取得重大突破,必须也要走数学化道路。

事实证明,走数学化道路是一切科学发展的必由之路,正如马克思所说的:“一种科学只有在成功地应用数学时,才算达到真正完善的地步”。生物学、医学是从二十世纪初开始走数学化道路的,尽管起步较晚,但发展讯速,颇有后来居上的趋势。注意:这里的所说的数学,并不是仅仅是有定量的测量,统计和数字化,而是指在实验现象的背后有数学模型作解释和指导。

目前,以圣塔菲学派为首的一大批科学家已经成功地使很多学科数学化。在经济领域,已经有了经济物理学这样的学科出现,在生物领域,生物数学已经是非常成熟的学科。人们

已经在运用数学模型去预测动物的行为,解释进化论的机制。在政治社会学领域,诸如博弈理论等新方法已经非常数学化。甚至在语言学,历史学这种传统的所谓人文科学领域,人们都已经开始运用抽象的数学模型去作分析研究,比如,大物理学家盖尔曼(因提出夸克理论而获得诺贝尔奖)这些年来就在以数学的方法研究语言学,并取得了很多成果。

2.2 医学数学化的基本特征

从医学实验发现规律,再用数学探讨模型,把科学实验的研究转化为数学模型的模拟分析,是医学数学化的基本特征。

医学数学化的一般模式可概括为:医学实际问题→数学化(定量分析) →数学模型(定量化公式或定性指标) →反馈修正(实践检验) →定性理论。

医学数学化的模式在计算机出现后又有新的发展,这个现代化的医学科研模式,集医学、数学、计算机于一体,提示了医学现代化的发展方向——医学、数学、计算机三结合。

当前,数学的概念和方法不断渗透到医学科学中,医学科学的数量化、精确化的步伐大大加快。一些好的医学著作(如外文著作) 大部分已用数学来描述,数学基础的好坏在一定程度上影响着医学院科研的进展。另外,目前一些新兴医学分支,如数理诊断学、细胞动力学、病理过程的模拟及决策分析等不断地涌现,它们的一大特点是都要用到较多的数学知识。医学实例,如生物种群生长模型、肿瘤生长模型、药物动力学模型、血流量模型、临床计量诊断模型等。

从一段数学史可看出这种趋势:

1901 年Peanson 创办生物统计学,开创了统计数学在生物学的应用研究,打破数学在生物学上应用等于零的局面,以后概率统计在医学的应用非常广泛,如显著性检验、回归分析、方差分析、全概公式、Bayes公式、计量诊断模型、最大似然模型、决策树概率分布、微生物检测等。

1931 年, Volterra 在研究食物链的基础上,应用微分方程组研究动态平衡完成了《生态竞争的数学原理》,开创了一门新型分支生物数学。1935 年,Mott ram 对小白鼠皮肤癌生长规律进行了研究, 认为肿瘤细胞总数N 随时间的变化速度与N成正比,且获得了体瘤在较短时间内符合指数生长规律的研究成果。本世纪30 年代,Blair 等人对神经兴奋理论进行了研究,并应用微分方程建模,将医学问题数学化,取得了著名的神经刺激理论型。 值得一提的是:

1965年美国加利福尼亚大学控制论专家扎德(Zadeh L A)教授在《Information and Control》杂志上发表了一篇开创性论文“Fuzzy Sets”,这标志着模糊数学的诞生。四年后,1969年Zadeh 发表了著名论文《模糊集和系统在生物学中的应用》,率先把模糊数学与生物医学联系了起来,以后模糊数学在生物医学上应用取得了许多成果。

2.3 传统医学数学化

中医是中华民族数千年同疾病作斗争的经验结晶。中医把人体作为一个整体,认为组成人体的各个部分在结构上是不可分割的,在功能上是相互协调的,病理上是相互影响的。同

时,将人与自然界看成一体,人体的生理功能和病理变化不断地受自然界的影响,人类在能动地改造和适应自然的斗争中,保持体内阴阳平衡,从而维持机体的正常生命活动。万物一体,五脏一体,天人相应的整体观,使中医在诊治疾病中显示了它的优势。

在中西医结合发展日益蓬勃的今天,模糊数学等数学方法更为中西医结合的发展提供了一条更为广阔的途径。例如,在规范中医胃癌辨证分型的基础上,借助模糊数学,可以使对胃癌的转移、复发概率判断更加精确化,从而可以得出胃癌中医证型与转移复发概率之间的相关性,以利于临床医生根据辨证的结果对病人的预后做出及时、准确的判断,并指导临床治疗个体化的具体实施,推动中西结合的进一步发展。中医临床用药的主要形式是中药复方,它是中医理法方药的具体运用,体现了中医治疗重视扶正祛邪,标本兼治等整体观、系统论和辨证施治的法则,是多系统、多靶点和多层次发挥全方位药效作用的治疗方法,所有这些都非单一成分所能概括达到的。根据中医理论和临床经验,开发中药复方的有效部位能较好地显示这种优势和特色。

现代数学的特点就是清晰性、准确性,定量和微观分析是它的长处,这正好弥补中医学描述模糊、不确定,以及主观性较强、不易把握等问题。其实中医学在发展的过程中在很大程度上受到古代数学的影响,只是由于我国的古代数学主要用来解决生活中的天文、历法、土地测量等问题,在发展过程中呈现出实用性的特点,并且在长期的发展过程中没有形成数学符号、仍以语言描述为主。受其影响,中医学理论重视功能性、不强调构造性,没有走上实验科学的道路,从而缺乏定量精确性认识,停留在经验科学的层面上。

随着中医学的不断发展,中医学的量化、标准化是大势所趋,数学在这个过程中将会起到重要作用。随着医学统计学在数据及资料处理上的应用、中医概念及理论数学模型的建立以及数学方法在中药研究中的运用,中医学已经开始走出困境并飞速发展。当然,数学在中医学中应用的研究才刚刚开始,一切都还处于起步阶段:中医数学模型的建立仅仅是一些较为基本的模拟,还无法应用数学方法去揭示其内在规律;数学方法在临床上的应用研究也不尽人意。但是,毕竟数学方法已经开始进入中医,并逐渐得到人们的重视,中医学数学化将是一个不可避免的趋势。

2.4小结与展望

在科学技术迅猛发展的今天,在中医中药现代化的过程中,引入模糊数学方法,用数学语言的结构描述中医学的理论内容,用数学方法探讨和处理中医诊断方法中所具有的广泛的模糊现象,用数学方法对药物及方剂中的模糊现象、模糊概念进行量化描述,使中医学的研究数学化、定量化,从而促进中医学客观化、现代化是非常重要的。

参考文献:

[1]魏威,魏欣甫 模糊数学与中医辨证论治[J] 中医教育,1999,18(4):54-55

[2]孔凡让,周红平,严如强 模糊数学及其在中医药学中的应用[J] 山东生物医药工程,2001,20(4):11-14

[3]蒋泽军 模糊数学教程[M] 北京:国防工业出版社,2001.4

[4]王琦 实用模糊数学[M] 上海:科学技术文献出版社, 1992.9

[5]杨伦标,高英仪 模糊数学原理及应用[M] 广州: 华南理工大学出版社,1993

[6]曾照芳 医学应用生物数学[M] 重庆:重庆大学出版社,1994.104.

[7]张继增 模糊数学在中医学中的可能应用[M] 天津:中国中西医结合杂

志,2002,22(2):148-149

[8]刘亚娴 论模糊数学在中医临床的应用[J] 陕西中医学院学报,2000,23(6):5-6

[9]马红,刘苏中,王咏梅 模糊数学方法在中药方剂研究中的应用[J] 中国实验方剂学杂志,2000,6(2):56-58

[10]王咏梅,马红,刘苏中 方剂配伍的模糊数学特性研究[J] 中国实验方剂学杂志,2000,6(6):59-61

[11]陈荣山,陈东汉 模糊数学在中医脉象模式识别中应用[J] 医学信息,1998,11(3):20-21

[12]孙益鑫 论模糊数学与中医学[J] 中国医药学报,1996,11(1):19-20

[13]汪培庄 模糊集合论及其应用[M] 上海:上海科学技术出版社,1983 30

[14]庞士统,庞怡然 用模糊数学筛选抗癌中药方法的探讨[J] 中国药

房,1998,9(5):210-211

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

广告评估中的数学方法

杨维

(物理学院物理学 0410313)

关键词:广告效果;数学评估

几何学精神适用于那些可以精确分析——可以被分解为它们的最初组成成分的学科。它从某些公理出发,并且从这些公理推论出真理,这种真理可以被普遍的逻辑法则所证实。这种精神的优点在于它的原理的明晰性和它的演绎的必然性。但是并不是所有的对象都可以做这样的处理。有些事物由于它们的微妙性和无限多样性,使得对之进行逻辑分析的一切尝试都会落空。而如果世界上有什么东西我们不得不用这第二种方法来处理的话,这种东西就是人的心灵。人之为人的特性就在于他的本性的丰富性,微妙性,多样性和多面性。广告就与人的心理因素相关,不过,我们下面要做这样的尝试:用数学去分析广告所产生的效果。

所谓广告效果,通常认为广告主把广告作品通过媒体披露之后,该广告作品对于消费者

的影响。其中包括广告心理效果和广告销售效果。消费者接触广告之后,首先对广告诉求表示同感,之后对广告产品产生感情,广告经过各方面的评价,就会有动机的产生。

这里我们只讨论事后广告效果测定的数学方法,不讨论数据的获取方法。

1 广告效果评估的方法

1.1 纵向对比法

即把今年的广告效果与去年的广告效果比

较,具体方法可比较去年销售量与今年销售量,

扣除销售量自然增长率,即可得出广告促销的作

用有多大。

自然增长率可从公布的统计数据中查得,也

可通过调查广告力度较小或不做广告的—个竞争

对手的销售增长率来判断自然增长率的大小。

1.2 横向实验对比法

即选择两个规模、容量、人口、销货率、居民收入水平基本相当的城市作为试点城市,一个做广告,一个不做,对比其效果。比如,下表为某冰箱厂的广告对比实验:

广告前销售量

广告后销售量

广告效果(E):(B-A)-A*(D-C)/C=(4000-3000)-3000*(3650-2950)/2950=288.1台。相对广告效果(RE)=E/A*100%=9.60%,即投入广告后销售量比未投广告增加9.60%。

1.3 盈亏平衡点法

企业做广告就会构成相应的费用支出, 这部分支出可以看成是一定时期内企业固定成本中的一部分, 因此我们可以从盈亏平衡的角度来进行分析。成本、收益及销售量的关系可以用右图表示:

图中: F为广告前企业的固定成本支出; I为企业的广告费支出;TR为企业的销售收入曲线; TC 为企业的总成本曲线。

从图中可以看出, 由于广告费支出的发生, 使得企业的盈亏平衡点, 由Q1变为Q2。 ΔQ=Q2-Q1=[(F+I)/P-V)]-F/(P-V)

其中: I为广告费支出, P为单位产品价格, V为单位产品变动成本。

分析评价: 当

企业做广告后增加的销售量大于ΔQ , 可认为在经济效益方面, 该广告是成功的;当企业做广告后增加的销售量小于ΔQ , 则可认为, 起码在短期内, 该广告是有损企业整体经济效益的。

投放广告城市 A=3000台 B=4000台 不投放广告城市 C=2950台 D=3650台

2 广告效果评估的常用参数

2.1 广告效果指数(主力方法):

购买组

不买组

合计 广告组 a c a+c 频数 对照组 b d b+d 合计 a+b c+d a+b+c+d=n

其中:a=看过广告而购买的人数;b=未看过广告而购买的人数;c=看过广告而末购买的人数;d=未看过广告亦未购买的人数。

所有未看过或听过广告的人数:b+d;

受非广告因素影响而购买新产品人数比率:b/(b+d);

如果不做广告, 可能的产品购买人数:N×b/(b+d);

做广告后实际增加的购买者人数:ΔQ=(a+b)-N×b/(b+d);

广

告效果指数(AEI)=做广告后实际增加的购买者人数/全体被调查人数=ΔQ/ N。

2.2 “广告—购买”的相关分析 其基本统计思想是: 利用相关系数对表-1中的广告―购买数据之间的相关性进行测算, 正相关系数越高, 则认为广告对购买的促进作用

越大。常用的统计量

如下:

ψ=

2 −1≤ψ≤1 (1-1) (ad−bc)2

r=, 0≤r2≤1(1-2) (a+b)(c+d)(a+c)(b+d)

p== 0≤p≤1(1-3)

以上系数都可以用来刻划广告―购买之间关联性的强弱,取值越大,说明广告对公众购买行为的劝导效果越成功。

3 广告效果的综合评价

首先需要知道模型M(∧,∨)合成运算法则。

两个模糊集合A,B的并,交运算:

并运算,若C=AUB,则 µc(x)=µA(x)∨µB(x)=max[µA(x),µB(x)]; 交运算:若C=AIB,则 µc(x)=µA(x)∧µB(x)=min[µA(x),µB(x)]。 这里我们用多级模糊综合评价模型对广告效果进行评估,按以下步骤就可以得到结论。

3.1建立广告效果模糊综合评价因素集

设U={广告输入,消费者处理,市场输出}。再由广告的特点将U={广告输入,消费者处理,市场输出}分为三组:U={U1,U2,U3},即:U1={接触(可及性),注意(吸引力),

理解(可读性)},U2={情感(感染力),欲望(诱惑力),行为(影响力)},U3={品牌选择,购买强度,合计指标}。

3.2建立广告效果模糊综合评价的评价集

因评价的目的是评价广告效果的好坏,因此,设V=(V1,V2,V3,V4),其中:V1表示好;V2表示较好;V3表示一般;V4表示差。

3.3建立广告效果模糊综合评价的权重集

假设采用Delphi 法(专家调查法)确立权重,经对专家调查结果的统计,得出各因素的权重假设为:

A=(0.20,0.35,0.45),

A1=(0.30,0.42,0.28),A2=(0.20,0.50,0.30),A3=(0.30,0.30,0.40)。

3.4进行一级模糊综合评价

我们仍然采用 Delphi 法(专家调查法),请有关专家评价小组对单因素层的各个指标进行评价(打分或投票),对评价结果统计后假设得到如下三个评价矩阵:

0.300.360.240.130.27R1=0.200.320.250.23,R2=0.26

0.400.220.260.120.220.280.360.420.240.120.160.180.20, 0.10

0.38R3=0.34

0.400.240.250.280.080.300.300.200.11。 0.18

为了突出主要因素,采用模型M(∧,∨)进行合成运算“用Ο表示”,计算一级综合模糊评价结果。

0.360.240.130.27B1=A1ΟR1=(0.30,0.42,0.28)0.200.320.250.230.400.220.260.12

=((0.30∧0.36)∨(0.42∧0.20)∨(0.28∧0.40),

(0.30∧0.24)∨(0.42∧0.32)∨(0.28∧0.22),

(0.30∧0.13)∨(0.42∧0.25)∨(0.28∧0.26),

(0.30∧0.27)∨(0.42∧0.23)∨(0.28∧0.12))

=(0.30,0.32,0.26,0.27)

0.300.280.240.18B2=A2ΟR2=(0.20,0.50,0.30)0.260.360.120.200.220.420.160.10



=(0.26,0.36,0.20,0.20)

0.380.240.080.20B3=A3ΟR3=(0.30,0.30,0.40)0.340.250.300.110.400.280.300.18



=(0.30,0.28,0.30,0.20)

3.5进行二级模糊综合评价

显而易见,二级模糊综合评价时的单因素评价应为相应的一级模糊综合评价。因此,二级模糊综合评价的单因素评价矩阵应为一级模糊综合评价矩阵。

令总单因素评价矩阵为:

B10.30R=B2=0.26

B0.223

则广告效果的综合评价集为: 0.280.240.360.120.420.160.180.20, 0.10

0.300.280.240.18B=AΟR=(0.20,0.35,0.45)0.260.360.120.200.220.420.160.10。



=(0.30,0.35,0.30,0.20)

3.6综合评价结论

按最大隶属度原则,广告效果较好。因为在B=(0.30,0.35,0.30,0.20)中,0.35最大,而0.35对应的评价是较好。

广告学其实是一门集经济学、心理学等许多知识于一体的复杂学科,对其进行数学分析的模型还处于不成熟阶段,有待进一步研究。

参考文献

[1]孙文清,企业经济,2006年第8期,广告效果的多级模糊综合评价.

[2]徐风兰,广告策划学,杭州:浙江大学出版社,2003年3月.

[3]王敬, 广告效果的测试内容与阶段,商场现代化,2005年18期.

[4]郝艳如, 广告效果的统计测定与分析,统计与决策,2000年第8期.

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

计算机局部光照模型中的数学应用

曹家音

(软件学院,软件工程专业,0412642)

摘要:本文简单介绍数学在计算机图形学中光照模型的应用,介绍了Lambert,Phong等经典算法,并且对其提出了自己的看法。

关键词:光照模型;镜面反射;漫反射

1 引言:

随着计算机产业的飞速发展,计算机图形已经应用到了虚拟现实、医疗、军事、娱乐等各个方面,它对人们的生产与生活产生了不可估量的影响。

5年前的SGI会议上,GPU的概念的第一次引入,使得很多理论的算法从离线渲染中脱离出来,并且可以实时运行在PC机上。这次革命性的改变后,计算机图形学有了很大的变化,图形的光照模型已经由原来的固定管道变成了可编程管道,出现了更多灵活的光照模型,计算机非真实渲染也可以实时的实现,卡通渲染,水墨画渲染等方式出现在应用程序中。目前,计算机图形学正处于前所未有的发展时期。近5年来,GPU技术以令人惊叹的速度在发展。渲染速率(以每秒钟所渲染的像素计)每6个月就翻一翻。性能5年来翻了10次,也就是提高了上千倍!

本文针对GPU编程,以数学为基础,介绍了计算机光照模型的几个经典算法,并且提出了自己对于这些算法的看法。

2 局部光照模型

光照模型是生成真实感图形的基础。简言之,光照模型即根据光学物理的有关定律,计算物体表面上任意一点投向观察者眼中的光亮度的大小和颜色组成的公式。

光照模型分为全局光照模型和局部光照模型。

全局光照模型把世界坐标中的所有物体考虑成统一的整体,其光照强度计算了物体之间的辐射、阴影等,相对复杂些。

局部光照模型仅考虑光源照射在景物表面所产生的光照效果,景物表面通常被假定为不透明,且具有均匀的反射率。局部光照模型能表现出由光源直接照射在漫反射表面上形成的连续明暗色调,镜面上的高光以及由于景物相互遮挡而形成的阴影等,具有一定的真实感效果。

3 Lambert漫反射模型

自然界的大多数景物为理想漫反射体,Lambert余弦定律总结了一个理想漫反射物体在点光源下的光的反射规律。根据Lambert定律,一个理想漫反射物体表面上反射出来的漫反射光的强度同入射光与物体表面法向量之间的夹角的余弦成正比,即

I=KdIlcosθ,

其中I为景物表面在被照射点P处的漫反射的光亮度,Il为点光源所发出的入射光亮度,Kd为景物表面的漫反射率,θ为入射光与表面

法线之间的夹角。如右图:

若记景物表面在被照射点P处的单位法向

量为N,P到点光源的单位向量为L,则上述表

达式可以表达为如下形式:

I=KdIl(N∗L)。

显然,当点光源离被照射表面很远时,上式

中L变化很小,因而可以将L看作为一常向量。

我们称此时的点光源为方向光,它由一向量完全确定。

考虑θ大于90度时候,光线从表面的背面射过来,在这时I的值并不是负值,而在图形学里默认为0,即从表面背面射过来的光线对于表面的反射色彩不起任何作用。显然,当θ=0时,其强度最大,即光线直射表面。

但上述公式还不足够描述现实中的光照物体,物体还经常会收到从周围环境射来的光,从而改变光线进入人眼的颜色。例如,早上和黑夜,外面的物体给我们的颜色有很大差别,就是因为环境光的问题,但是由于环境光精确计算非常耗时间,所以在对速度要求很高的实时系统中,经常用简单的单一漫反射光强度来表示物体的漫反射光照,而不是精确的计算。

对于对图形要求不是很高的情况,这样的模拟已经提供足够的效果了。

I=KaIa+KdIl(N∗L),

加入了漫反射光照之后,模型的真实感有了较大提高。

上述公式仍然有一定的不足之处,它没有考虑到光源与物体之间的距离,而真实世界中光源到物体的距离对于光照强度有一定的衰减作用。所以我们进一步改变上述公式:

I=KaIa+(KdIl(N∗L)/d2),

其中d为光源到物体之间的距离。上述公式中,光源离物体很远时,强度变化是不大的,所以真实模拟中,经常用线性变换来代替,但更为灵活的做法是把衰减率定为:

f=max(1,1), c1+c2d+c3d2I=KaIa+KdIl(N∗L)f。

上述公式即总结了Lembert漫反射模型的算法。下面图片为Lambert在RenderMonkey中的渲染效果:

该模型在计算机中,耗时很小,计算速度很快,

适合对于图象质量要求不是很高的应用,可以

在机器硬件水平不是很高的情况下,流畅的运

行。但是,该模型对于物体的模拟有一定的疏

忽,它没有考虑到物体的高光部分,所以有一

定的失真效果。其效果并不能令大多数应用满

意,而且现在的计算机可以以正常的速度运算

算法更为复杂的光照模型,所以现在这个模型应用并不多。

4Phong光照模型

镜面反射在日常生活中随处可见,当光照射在金属球上面时,会在球面上形成高光部分,这是因为光照射在金属表面产生了镜面反射的结果。与漫反射不同,镜面反射的反射光有一定的汇聚性,它们朝空间一定方向汇聚,故表面的高光区域是随着观察着的位置变化而变化的。

与Lambert光照模型相比较,Phong模型多了高光处理,这使物体给观察者的真实感加强了很多,它可以体现观察者与物体之间的最简单交互。

根据光的反射定律,反射光线和入射光线对称地分布于表面法向量的两侧。对于纯镜面,入射至表面上的光线严格地遵循光的反射定律单向地反射出去,其单位反射向量为:

R=2∗N∗(N∗L)−L。

理想的镜面反射实际中是不存在的,因为不存在理想光滑的物体,所以真实情况多为(b)图中的情况。

1973年,Phong提出一个用来计算表面镜面反射光亮度的经验模型

Is=IlW(θ)cos(∂)n,

其中W(θ)为景物表面的镜面反射率,它是入射角θ和入射光波长的函数。在实际使用时,往往将W(θ)取值为常熟k,通常0≤k≤1。n成为高光指数,它被用来模拟镜面反射光在空间的汇聚程度。∂为视线与镜面反射光线之间的夹角,Is即为表面投向视线方向的镜面反射光亮度。

公式表明,投入观察者的反射光不仅决定于入射光的强度,而且和观察者的位置有关。 当观察者位于镜面反射光线附近时,观察者观察的反射光较强烈,反之,当观察者远离反射光线方向时镜面反射光就会迅速减弱以至于消失。

将Phong的镜面反射经验模型与Lambert漫反射模

型结合起来,就得到了在单一光源下的Phong光照模型

的表达式:

I=IaKa+KdIlcosθ+KsIl(cosα)n。

考虑到入射光的距离衰减效应,可以得到在多个点光源下表面光亮度计算的Phong模 型:

I=IaKa+∑fiIl(kicosθi+ks(cosα)n),

i=1M

其中M为光源总数。

右面图片为Phong模型在RenderMonkey中渲染的效果。Phong模型有以下很多特点:

1)其模型为局部模型,没有考虑辐光强的

空间分布。

2)漫反射与镜面反射过于独立。

3)镜面反射色被假设为光源颜色,与物体

颜色无关。

4)对于物体没有被光源影响的部分,以简

单的环境光来模拟,而环境光的模型是常数,所

以没有被影响的部分呈现一种颜色,有一定的失真。

5 金属光照模型模拟

对于Phong的光照模型模拟金属效果还有些缺陷,例如它无法反射出周围环境的反射,所以出现了金属光照算法的模拟,从而对金属更加真实的模拟。

金属光照模型公式为:

I=(1−lerp)*IPhong+lerp*Ireflection,

其中公式前半部分与Phong的模型一样,后半部分加入了反射周围光照,其中lerp为插值参数。它体现了金属反射率的大小,即金属反射周围物体的程度。

引入反射贴图的概念,它是由六个方形图片组成,围成一个正方体,根据物体的反射光线提供物体反射颜色。在实时的应用中,立方体贴图经常实时生成,从而有效地动态的反映了周围的环境。

Ireflection=texCUBE(cubeTexture,Ir),

对于2D贴图来说使用u和v两个坐标来表示顶点对应的贴图坐标。而在Cube Map中,仅有2个量是无法表示一个点在立方体中的位置的,所以,Cube Map的贴图坐标

由3个数的向量来表示的,可以简单把这个贴图坐标对应的颜色的理解为是从盒子中心向这个3D向量的方向前进和盒子的交点所在的点的象素颜色值。这样,根据反射光线得到了应该反射的颜色。右图是由金属模型在RenderMonkey中渲染出的效果:

6 结束语

这篇论文是我学习完一年图形学后完成的,总结了Lambert、Phong等经典算法。其中还有很多的不足。在今后的学习中,我还将针对这部分进行更深入的学习,研究一些更复杂的算法,例如Blinn等模型,以及全局光照的算法。

参考文献

[1]计算机真实感图形的算法基础,科学出版社.

[2]计算机图形学原理及实践 C语言描述,机械工业出版社.

[3]计算机图形学(OpenGL版),科学出版社.

[4]3D游戏编程,电子工业出版社.

注释:以上模型的示例均在RenderMonkey1.62下编程所渲染,并附有源代码。

※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○※○

快乐的童年作文400字

人们都说童年是丰富多彩的,是快乐的,我的童年也不例外。当春风吹暖大地,爸爸会带我去放风筝。柳枝在春风中摇摆,天上的风筝五颜六色争奇斗艳,孩子们在下面快活地叫着喊着,比着谁的。

二年级数学手抄报10篇作文700字

篇一:二年级下册数学手抄报_1400字一、 填空题。(25分)1.据我国第五次人口普查统计,到2000年3月,我国总人口为十二亿九千五百三十万,横线上的数写作( ),省略亿后面的尾数约为()亿。),省略。

五年级数学手抄报10篇作文400字

篇一:五年级数学手抄报_800字神奇的数字 7世界上最神奇的数字是: 7 地球有七大洲,每星期有七天, 月球运行的周期 28 天正好是 7 的倍数,而且也是 1 至 7 这 7 个数字之和……彩虹。

喜欢 不喜欢(再来) 我要投稿

我要评论《数学之美10篇》

指正错误,点评精髓,才是彼此提升作文写作的正道。

匿名发表