1 / 12
文档名称:

数学之美读书笔记.doc

格式:doc   大小:47KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数学之美读书笔记.doc

上传人:书生教育 2021/1/8 文件大小:47 KB

下载得到文件列表

数学之美读书笔记.doc

文档介绍

文档介绍:《数学之美》读书笔记
《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道 ---- 解决问题的方法, 而不仅仅是术。 书中也启发式的引导读者形成自己解决问题的道。
下面记录一下自己读这本书的一些感想:
第一章《文字和语言 vs 数字和信息》:文字和语言中天然蕴藏着一些数学思想, 数学可能不仅仅的是一门非常理科的知识, 也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会给你带来解决问题的灵感。
第二章《自然语言处理 ---- 从规则到统计》:试图模拟人脑处
理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度, 而基于统计的语言模型很好的解决了自然语言处理的诸多难题。 人们认识这个过程, 找到统计的方法经历
20 多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦苦摸索。 另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。 自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。 事情不可能一帆风顺的,这是自然界的普遍真理吧!
第三章《统计语言模型》:自然语言的处理找到了一种合适的方法 --- 基于统计的模型,概率论的知识开始发挥作用。二元模型、
三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。 以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话: 数学的魅力就在于将复杂的问题简单化。
第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。 从开始的到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求, 分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。
第五章《隐马尔科夫模型》:隐马尔科夫模型和概率论里面的
马尔科夫链相似,就是该时刻的状态仅与前面某几个时刻的状态有关。
基于大量数据训练出相应的隐马尔科夫模型, 就可以解决好多机器学<br****的问题,训练中会涉及到一些经典的算法 ( 维特比算法等 ) 。关于这
个模型,没有实际实现过, 所以感觉好陌生,只是知道了些概率论讲
过的原理而已。
第六章《信息的度量和作用》:信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性, 同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,
这一点与热力学中的熵概念相同, 看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
第七章《贾里尼克和现代语言处理》:贾里尼克是为世界级的大师,不仅在于他的学术成就,更在于他的风范。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究, 关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”,这很像听到的一句话“我不赞同你,但我支持你”。贾里克尼教授一生专注学****最后在办公桌前过世了。 读了这章我总结出的一句话是 “思想决定一个人的高度”。
在这章中对于少年时的教育,以下几点值得借鉴:
、少年时期其实没有必要花那么多时间读书, 他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。
、中学时花大量时间学会的内容, 在大学用非常短的时间就可以读完,因为在大学阶段,人的理解力要强很多。
、学****和教育)是一个人一辈子的过程。
、书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
第八章《简单之美 ---- 布尔代数和搜索引擎的索引》:布尔是
世纪英国的一位中学教师,但他的公开身份是啤酒商,提出好的思想的人不一定是大师。 简单的建立索引可以根据一个词是否在一个网页中出现而设置为 0 和 1,为了适应索引访问的速度、 附加的信息、
更新要快速,改进了索引的建立,但原理上依然简单,等价于布尔运
算。牛顿的一句话“(人们