为什么我们要学习基本理论

为什么我们要学习基本理论
想说这件事很久了,就是我们为什么学习基本理论。我的基本理论非常差劲,很多时候拖了后腿,这也是我对这一点感受很深的原因。
很多同学提到,计算机是个日新月异的学科,每年甚至每个月都在产生新的技术、新的名词。去年可能还很难解决的问题,今年就非常容易了。当年用记事本做个网页那个费劲,现在随便用dreamweaver之类的工具就能画一个来,成了最没技术含量的工作。同学们说,在这种情况下,为什么我们还要学习195X年发明的那些技术,甚至学习电子学这样194X年的技术。
1. 基础理论过时很慢
幸好,我没有听到有同学问,为什么我们还要学习3000年前的数学。一个学科赖以存在的基础,不像新科电视剧,它的出现和消失都是非常缓慢的。即使计算机这样的学科,那些影响到软件工程的理论,也大多在195X年就已经出现了。比如模块化、信息隐藏、编译原理、操作系统。更基本的算法,在电子计算机1946年以前早就出现了。比如世界上第一个计算机程序的作者生活于18XX年,是拜伦的女儿,就是那个诗人拜伦。有人可能会说,她怎么能为计算机这样不存在的东西写程序呢?她当然不是为"电子"计算机写程序,而是个数学家。这倒不是计算机科学为了显得自己有历史,而是她的工作确实是计算机的理论基础--而且对软件工程等有确实的影响。
为什么要学习基本理论,有很多理由。其中一个理由是前一段时间跟建一长聊之后想到的。建一要做一些不止是计算机的工程--事实上,这是一个普遍的现象,我们很少从事纯粹的计算机工作。他遇到的困难之一是,那个领域里充满了各种复杂的细节,其中很多是陌生的。我后来想到,这时基础理论在一定程度上能有帮助。一方面,很多工程类学科都依赖数学,这是共通的那一部分;另一方面,许多工程方法具有相似性,有时候,接近的学科,即使你没有接触,也能猜测到可能会有什么样的机制支持你。这两种情况下,更深刻地理解学科的基础就有意义了。
基础理论的学习,也能帮助学习"方法"。不少同学都提到,大学应该学习"方法",而不是"知识"。 (我略过了另一些观点,有人认为大学应该学习与人交往或者做人什么的。这种观点的价值观估且不讨论,我对它的困惑主要在于,还有一半没上大学的,他们就不需要与人交往或者做人了么?)而"方法"是很难传授的,只有在学习某个东西的过程中才能体悟。学习基础理论,动机之一就是通过它学习"方法"。
这些理论,以及学习这些理论过程中了解到的"方法",在学科的历史中长久地不过时。而你的一生,比学科要短很多,没有见到它们过时的可能。换句话说,那些十年以后就消失了的东西,并非基础理论。
2. 硬件进步的影响呢?
对基础理论的另一种质疑,由学科本身的成长导致。比如,莫尔法则指出,计算机硬件aoao地成长。所以,有人据此认为,程序的优化是没有必要的,又进一步推得,程序优化的技术是没有必要学习的。
我最近在精读CSAPP 就是这本[http://book.douban.com/subject/1896753/]。第四章读了两遍,还有很多没记住,正准备看第四章。这时看到网上有贴子提到,第四章的优化是毫无用处的。他的理由是,你优化了半年,程序效率可能才提高20%,而你这半年啥也不干,或者就只是玩,半年之后你的程序性能自然就达到指标了--因为硬件性能的提高。
这贴子听起来很有诱惑力。如果这个世界以这样的方式运作,那生活简单太美好了,美好到可能很多人都不想活了。你想,如果衣来伸手,饭来张口,啥也不用干,想要啥有啥,所有人都听你的...而根据康德的理论,人类之所以能感受到美,就是因为在过程中感受到自身的力量。
这贴子还有其他的问题,这种美好的生活是不会存在的。没有工作过,没有为别人创造过价值的人,可能难以理解这一点。你工作的意义不仅是实现某个效果(比如你那个程序,没有优化快20%的),而且在于在特定的时间完成这个工作。
我要对每一届进实验室做项目的研究生同学反复说,你的工作不仅是完全某个任务,而是必须在规定时间前完成。凡是在规定时间以后完成的,基本就没有意义了。这跟降落伞差不多,需要你的时候如果你不在,你就永远也不用在了。
为什么。
在万恶的旧社会,有一个时代,叫做486时代。那个时候的主流计算机型叫做486。那时候著名的奔腾还没有出生,像CS这样的游戏还没有它们能运行的硬件。那个时代看碟 (对,基本是碟,而不是AVI) 需要使用硬件解压卡。没有硬件的帮助,CPU的速度还不足以完成播放。那个时代著名的播放器叫做xing,能不用解压卡,但是它是英文的。后来。后来的事件太重要了,我另起一段。
后来,有一个重要的软件出现了,它不需要解压卡就能播放影碟,而且,它是中文的。它叫做金山影霸。是先前和后来著名的金山公司的重要产品。是的,后来有了586,有了奔腾,有了你现在用的这样的机器。这些机器的性能高到不仅不需要解压卡,连声卡和网卡的运算都免了,全在CPU里完成。但是,在金山影霸存在的那个时代,它们全、都、不、存、在。
这就是金山影霸存在的价值,也是你的工作的意义。我在课堂提到的一个比喻这样说,一个将军有多么牛,靠什么度量?如果敌人很牛,天气很差,我方装备非常缺乏,地理环境也不熟悉,而且身陷死地,自己的军队士气低落,全是老农军事素养低下。如果在这样的情况下,你带兵打了胜仗,你就是很牛的将军。如果反过来,敌人全很完蛋,天时地利都利于我方,你的士兵个个特种兵,你也打胜了。那打胜了有什么好说的,应该的啊。
你存在的意义就在于,你能够克服各种困难,完成人所不能。不仅做出来,而且在那个时候就要实现,它们都是你的工作的意义。如果要等半年硬件进步,你的老板为什么要付给你钱?
不仅硬件进步,厂商们,比如MS或GOOGLE还会封装底层的各种机制,让你调用它们的API。它们越封越多,越封越严。一方面,没有对底层的深刻理解,用它们的API做简单的程序非常容易,做难的程序比以前更难;另一方面,如果三两行就能写一个程序了,还是那个问题,你的老板为什么要付你钱。所以,你必须在它们还没封完以前把程序做出来。等它们封完了,你的工作就不值钱了。
3. 有人质疑,那他的聪明呢
这也是跟同学们讨论的一个话题。A同学如果学习了基础理论,才设计出某个程序,和另一种情况比,B同学完全没有学习基础理论,也设计出了某个程序,哪个更牛?
有些人认为,天赋异禀的B同学更牛,他更聪明,更有智慧,更富有创造力。你看,他没看理论,独立地就设计出了与某大公司相同的框架。
不过须知,做工程项目和科学研究,不是奥运会比赛,你聪明不聪明对公司和工资都没啥影响。你徒手或者用弓箭射杀鬼子也没有加分。完全自己设计,不遵循现成的基本理论,不参考 (或否定) 别人的设计,基本是小农经济时代的思维吧。证明你是本小镇最聪明的人又怎么样,你织的布就更好了,就比大机器生产的质量更高更便宜了么?
深入学习基础理论,能避免前人和别人早就做过的蠢事,也更容易重复牛人的成果。你没得到独创的机会,实在是得归疚于生得晚了,要创造也只能创造些别的了。无论你是否知道,是否把耳朵眼睛全睹起来,别人已经创造完了的,总归是创造完了。
有些人误认为古龙莫言之类的创造者,都全身心投入到女人和地方特色中去,两耳不闻窗外事。细读一下他们别的言论你就会知道,他们对于西方文学各种流派和文学基本理论的概念都熟悉得很呢。只是,写小说的时候,跟听故事的读者说不来这些东西就是了。你会跟你的客户说你很了解汇编语言么,有意义么。你应该展示汇编语言的威力。
4. 再说硬件
说到硬件,还有两点。一是,即使半年后硬件进步了,你的优化也还是有意义。如果你优化了20%,你仍然比同样的硬件下别人的东西快20%。就像在列车上奔跑,停步的那个人,还是会落后,不是落后于地面,而是落后于不停奔跑的那个。二是,算法的理论 (和实践) 告诉我们,算法与算法之间性能的差别,比硬件和硬件的性能差得如此之大,以致于一个差的算法,即使运行在银河机上,而好的算法运行在当年的日立小计算器甚至算盘上,好的算法仍然快得多。这个说起来话就长了。
又想起来前一段时间某段对话。某人说,这些东西的技术某公司都有前期研究,所以...言下之意这些工作是不是可以便宜一些。
不能。
有些工作就是体力活,就跟给你家刮大白似的。你会刮也白扯,我给你家装修的时候也不会便宜。不过,问题的另一方面是,如果你不会刮,或者我由于基础理论好,刮得格外好或者格外快,那铁定得加钱了。
5. 最后一段
关于基本理论,齐同学当年提到过一件事。他对考基本概念很反感。我对动手能力强的同学希望考理论的应用,而不考理论,非常理解。
那么为什么还要考察基本概念呢。尤其齐同学还提高,如果按自己的话答,老师就给扣分,老师就希望背下来。
事情是这样,按自己的话答,是不会扣分的。为什么齐同学有此误解呢?估计是他答的知识点不全。基本概念的考核在我做学生的时候,也非常头疼。现在想来,是我理解得不够深刻,所以答得不完整,以后应用的时候也受到负面影响。当然,我并不是说背也来就高超很多,大家都不咋地。
正确地做法是,深刻理解,理解到可以复述,就像背下来一样。你女朋友的电话号码记得那么清楚,为什么用来谋生 (也包括她的生?)的工具,怎么能随手就忘呢?
所以我等读完CSAPP,我还会再次重读第四章。直到能用手把图里的节点以及它们的连接画下来。那个时候,才是真正掌握的开始。
--------------------
博客会手工同步到以下地址:
----
杨贵福
东北师范大学 计算机科学与信息技术学院
--
Sincerely,
YANG Guifu
School of Computer Science and Information Technology
Northeast Normal University
Changchun, P.R.China

重剑无锋,大巧不工。

无不大工。

契约精神,姜戈里的医生为什么要杀奴隶主 (标题有剧透),及编程等乱七八糟的

契约精神,姜戈里的医生为什么要杀奴隶主 (标题有剧透),及编程等乱七八糟的

我看到传闻,说很多人不理解姜戈里的医生为什么要杀奴隶主。他们说,明明已经忍气吞声了那么久,钱也付了,人也赎回来了,只剩了单单一个握手而已,为什么医生要大动干戈把对方杀了,而且甚至没有准备杀完之后的应对措施。

我还看到网上有人答复了这些困惑的同学,并且深以为然。医生为什么这么干,精神病一样,我想先讲个我的经历。就是今天的。

我经常去家附近的一家火锅店吃饭,今天发现手里还有一些代金券,快过期了,所以今天去吃,还带了二猫妈和二猫。整个吃的过程都很顺利,豆腐皮很难吃,而且一煮就碎,我按一般的流程处理,放在那不吃,不讨论,钱照付。到了付钱的时候,出了麻烦。

服务员说,代金券不能想花多少就花多少,限额要按当初领代金券的时候相同比例来,好像是100现金对20元券。二猫妈付钱,跟服务员柔声细语地讨论,领券的时候没说啊。领班路过,一口认定,说了。我对领班说,你别跟她说了,跟我说。

这时候貌似女经理的路过,拦下来。我说,券上没写你们说的这些附加条款。她说,也不能什么都写啊。我说,这个必须写上,我只按写的执行。她说,那也不能你想付100券就付100券啊。

我就喜欢这样的,我就喜欢不讲理的。我本来想说,那也不能你们口头说每次只可以用一块钱的,那就用一块钱的啊,得按协议来。但是我太喜欢不讲理的人了,所以我拍桌子站起来说,我不付钱了,一分钱也不付。然后告诉二猫妈和二猫,你们收拾东西走人,告诉女经理,你赶紧叫保安堵住门口,我不付钱。

女经理拉我袖子,说咱们到吧台说,这里有顾客。我说,对啊,这里有顾客,我就要让大家知道你们不讲信用。我对别人靠近和拉扯我有特别的反感,但是这只有熟悉我的人才知道,所以我不能对此发火,我只能说,你给我念念上面写着什么,我又不是不认识字。然后我态度不错地告诉她,你别碰我啊,你真别碰我。我得承认,这段话很容易令人误解,好像她要打我似的,但是我又不能推她,只好语言通知。

二猫问我,怎么了。我说,他们不讲信用,我跟他们讨论一下。我想起了园长说的话,父母是子女的表率。我想,我得用行动告诉二猫,如果什么东西是你的,如果你还想要,即使一分钱,那么别人谁也不能动,谁动杀谁。

随后我和二猫妈达成一致意见,算了。好吧,我告诉女经理,我准备付现金。女经理又同意我用券,想用多少用多少。我说,我不打算用了,准备留着发网上。女经理说,那也行,用也行,不用也行。我说,你能承认你们企业违背约定这么干是错的么。她鞠躬道歉,说这都是为了维护企业。我躲开不按受,说,你们企业太不讲信用了。背信的人理应承认,守信的人毫无义务原谅。

我想起了很多年前,大学还没毕业的时候,给一些地方干活,拖欠我工资的事。你当初答应我的,每一件事,都要兑现。你现在有困难,关我P事,你的困难是你的困难,不是我的,我有困难的时候也不会求助于你。你以为这是公事,这在我就是纯粹的私事。我会把你的设备抬走,我会跟你吵翻脸,我还可能会放弃工资从而换得痛骂你一顿让你的员工知道你是什么样的人。但是,即使粉身碎骨,没有我的同意,忘记了或者想试图忘记诺言的,都应该被整死。这样的原则,绝对不会变。如果你背弃这个原则,就由我来贯彻。

这些年来,我看到过很多视承诺和协议如无物的人,说完话转脸就忘。我就按他们的原则提醒他们,他们期待用暴力提醒的,我就用暴力提醒,他们期待用强权提醒的,我就用强权提醒。如果我是农民工,绝对不会爬塔吊,我更可能告诉老板,我是讲道理的人,所以我提前通知你,你什么时间前必须还我钱,不然就整死你。

好了,现在谈谈姜戈里的那位医生。网上那位兄弟说,医生的阵营是"守序善良"。善良容易理解,就是好人,比如很多大妈,还有悲惨世界里的超人冉阿让。守序是什么呢?网上那位兄弟提到,守序是中国人特别缺乏的精神,所以咱们不太容易理解医生的做法。守序就是悲惨世界里的沙威的世界观,他认为世界按某一规则工作,他是守序邪恶。这是医生和沙威信仰的共同部分。我信仰的核心部分也包括秩序,集中体现为承诺。医生杀奴隶主的原因,既不是因为羞辱,也不是因为他特别地憎恨奴隶主,并非因为这些积累到了最后一根稻草,而是因为奴隶主攻击了他的三观中的核心部分,秩序中的承诺。奴隶主在最后时刻变更或者说附加了条款,并且认为自己能占到便宜。这也正是我见到咱们中国人常干的一件事,"我再试试多得一点如何,不行就拉倒呗,反正也没损失。"他们不知道有人会在这一刻翻脸,就像女经理可能没想到有人会突然决定不讨论了,而是不付钱。他们不懂,承诺属于信仰,是不能讨论的。所以你想再多得那一星半点的利益可能真的不重要,但是你多于我们既有的协议所索要的,无论多么微小,都是在攻击我的信仰,在叫喊我的信仰是个P。

有人可能会说,这太教条了,难道承诺了你就不能再讨论一次吗?当然能,但是再讨论之是否可以实施,要单纯地取决于我的同意与否。如果我不同意,那么,连讨论也不必,我只要求你兑现诺言。

而且,从你试图背信的一刻起,契约本身就不再存在,我可以任意攻击。当初民国政府与满清末代皇族达成的协议是保留紫禁城,小皇帝在里面仍然是小皇帝。但是后来张勋复辟,溥仪再登基,协议就全部撕毁了,所以张勋倒了以后,皇帝只好去天津当平民。有人可能会说,那孩子都是被逼的。那孩子怎么样咱们不得而知,但是皇位的追求者是在试图投机。投机,就可能失败,就要付出代价。你可以拒绝,或者逃亡,唯独不能背约,背约就准备失去约定中的一切利益。

所以承诺要小心,所以承诺才值钱。所以,有些人一辈子也编不了程序,也学不了自然科学和工程,也无法与西方仍然是列强的民族平等讨论,也无法与任何人平等讨论,只有威逼和被威逼的命运。因为他们不平白,谁也不是谁的奴才,我们大家是诺言的奴隶。因为他们不明白,协议、约定、契约这种东西,是金子做的,只要你轻轻触碰一下,它就分文不值,垃圾一样臭不可闻。被期待遵守这一契约的人,与他们的契约等价。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

解析解和有些人那么值钱的原因,及解决ORACLE加了索引还是非常慢

解析解和有些人那么值钱的原因,及解决ORACLE加了索引还是非常慢

昨天长春的天气让人倍感生活丰富多彩。早上的时候是阴天,然后下了场小雨,小雨还没停,转成下雪。大雪,全年无休,春天以后每天一场,大家正期待这场有能耐的大雪持续到五一节。先是小雪,然后开始刮风,等风把雪吹成斜斜的线条的时候,转成了大雪片子。中午以前,大雪停了,出太阳。太阳晒了一会,起风,终于开始了正常的春天,沙尘暴开始了。

沙尘暴一直没停,到晚上九十点钟,PM10飙升至重度污染。尚未结束供暖期,但是暖气早就停了好几天,大家宅在家里,穿上羽绒服唱热水,透过玻璃看灯光照亮的满天沙子,听外面鬼哭一样的风声。

不过毕竟还是有过阳光,有点阳光,不然这日子可怎么过下去。今天和包师弟还有ZHUMAO分别讨论,解决了两个很有意思的小问题。

一. 解析解

跟包师弟先是听大李yang同学报告stm32的板子加以太网,与PC机间进行socket通信。然后去包师弟家,包师弟给我讲循环伏安法的实验参数间的约束关系,我把它们写成方程。我们打算把方程给偶像,然后看看是否可以有些合作。偶像当时问过我,你们的方程都要求什么计算。我说,有加减乘除,有指数对数啥的,没有找一堆数的最大值最小值。实践表明,有找最大值最小值这种运算。而且在最后一个方程里,我还看到了递代。

我说,这算什么运算,可咋写成方程啊。我还不知道偶像他们是否接受不是方程的东西。

包师弟说:是啊,原理就是这样,我也不知道用方程怎么表示。

我说,迭代啊,然后我讲了段故事。

故事的背景是大李yang同学每周五跟我讨论SICP上的题目,半个小时。那个时间正好是我七八节课和九十节课的课间,我们共进晚快餐,并讨论SICP上他感兴趣的题目。前两周有道题目,是证明斐波那契数列的递归或迭代算法,其结果等价于一个公式。当时我也不知道怎么证,只知道他给出的穷举测试是不够强有力的。回家查了下google,有位牛人给出了不到半屏的证明,提到一个词,我们都熟悉,但是似乎又忘记了,齐次线性方程的特征根。我又查了一下wikipedia,发现前人们早有结论,迭代算法可以等价于齐次线性方程的特征根的什么什么。

所以,我说,至少我们可以用齐次啥啥的把这个迭代法的公式写出来,是一堆指数和lambda什么的。

然后我俩闲扯了一会儿,我说,这个东西估计是个经典算法,就是咱们不知道它的名字啊……然后包师弟给我讲了一下这个迭代的原理是咋出来的。

这时,这一天的阳光时刻到了。我指着其中一行说,这个就是个公式啊,这不就是什么什么然后再什么什么吗。包师弟说,听着倒是像,不知道是不是等价。我请大李yang同学把包师弟的代码和我的公式分别实现一下。此时,包师弟在厨房开始炒菜,一边跟我们说,mvs设成多少多少,rs设成多少多少,再试一次;大李yang同学靠墙坐地板上,本子搁腿上pilipala敲键盘;我在包师弟找到一个木鱼,做成青蛙的形状,它嘴里叼个小木棍,拿这个小木棍刮它的后背,就发出蛙鸣,声音还非常像,我这个时候就负责刮它的后背,感叹,"真是什么牛人都有啊,这也能做出来。"

目前为止,我的公式与包师弟的迭代看起来还是等价的。这个公式的价值不在于让代码从五六行缩为一行,或者执行效率有多么高。让我兴奋的是,这是一个实例,我十多年前考研究生的时候寻找的东西,问题的解析解。虽然只是一个实例,正如阳光虽然只露了那么一下头,也足够令人高兴一下。

二. 有些人那么值钱的原因

跟包师弟讨论其间,给ZHUMAO打个电话,说,你们啥啥服务器坏了啊,我从什么什么链路上去,估计哪哪的用户也访问不到了啊,你们赶紧修吧,别让人投诉了啊。

ZHUMAO片刻之后说,修好了,然后说,你在哪呐。我说我在包师弟家,他说,你回不回家啊。我说,回,我没跟包师弟"在一起"。他说,那你吃完饭到我这来吧,我十点才走。然后,我和包师弟"分手"以后,就去找ZHUMAO。

去找ZHUMAO的过程挺现代化的。我在图书馆门口掏出一卡通,嘀,然后推三脚滚闸进门,上电梯,穿过阅览室,来来往往很多同学,空气里全是人味。刷卡,嘀,通过东北特色馆藏,灯明瓦亮空间开阔,一个工作人员对着墙沉思,画什么图。往里走,再刷卡,嘀,进门,看见大间办公室,办公室里很多小隔间,很多机器,嗡嗡地响,ZHUMAO一个人缩得小小的,坐在角落里。

我俩跟谁也没看见谁似的,我卸护膝护腰,他在那pilipala摘键盘。我说,你整啥呢。他给我看,你看,这个东西整差不多了。

我说,咋这么慢捏。

他说,是啊,在mysql里也没这么慢呢。

我凑过去看屏幕,他用JSP写的东西,从oracle里select东西。

我说,是,oracle值钱,值钱的都这样?

值钱的东西倒底比不值钱的东西好在哪里,有很多个故事,以后再说。

1. 你用 sqlplus 执行一下你那几个语句试试。

还是慢。

这个测试的动机是,分离性能问题的原因,到底是JSP,还是数据库部分。

我又抻头过去看,如果不贴到显示器上,我基本上啥也看不到。我说,哎呀,你用的不是我给你的select语句啊。他说,都一样。我说,别扯了,我看好几个字母都不一样,你查下我邮件,试试我的。

试了,还是慢。

2。我说,你加索引了吗?

加了啊。

在哪呢,你给我看看。

这呢。他展示了两个索引。

我说,那就是索引名字,我也不知道你索引的是哪个字段啊。

怎么显示索引的是哪个字段啊。

我也不知道。

重建一个吧。

好。

ZHUMAO又建了个索引,用我的SQL语句,在sqlplus上执行。啪,结果就出来了,瞬间。

ZHUMAO指着结果,但是数据不对啊,这都些什么玩意。

3. 对比一下我的语句和他的语句,啊,我没加 order by

所以顺序是乱的。加上,结果对了。

然后他用JSP一跑,完了,速度又下来了。JSP里一共两条SQL语句,一个升序排列的,一个降序排列的。我们刚才只测试了升序的,再单独在sqlplus下跑了一下降序的,非常慢。原来是降序那句把整个速度拖下来了。

4. 降序

也建索引了啊,这二分法查找,升序和降序还不一样吗。我自言自语,这建的都是啥索引呐。我的意思是,这都是些什么糟烂索引。ZHUMAO很正经和权威地回答,建的是B+树索引。

我突然想起来,B+树升序和降序好像根本不一样。我也不确认,不过,再建一个没有啥负面影响。

我们又建了降序的索引,select速度还是不行。至此,我算陷入绝境了,唯一知道的是,要么索引没建上,要么没用上。于是,我转去研究桌上的一根 不锈钢棍子,以前从来没见过。有不到20厘米长,直径二三厘米,上机标着USA。我说这是值更的时候砸坏人的么。ZHUMAO说,不是,这是签到的。我说做成这样干啥。他说,怕值更的人把它破坏了。我哈哈笑,脑海中浮现出ZHUMAO穿着教父里美国警察的制服,手里拎着个大手电筒一样的,银光闪闪的家伙,一边走,一边往沿墙的一排暖气片上嗑,当当当当地走过走廊。

我说,还是google吧,索引这玩意可能没那么简单。ZHUMAO说,不用了,我有书。一会他指着一行字给我看,优化器不知道你建立了索引,然后给我念一行代码,让我加在select里,告诉它用哪个索引。

瞬间,结果就出来了。性能问题完全没有了。

ZHUMAO拿的那本书一点也不厚,估计也就100页左右,名字叫《Oracle索引技术》。

我说,我现在知道为什么有些人那么值钱了,oracle dba的存在是有原因的啊。他们不会花费大半个晚上,才解决这种加上一行就能解决的问题,他们都是在问题上瞄上一眼,然后说,在这个位置锯开,把线圈去掉三匝。

新拍的照片和画在这里 [http://www.douban.com/photos/album/100752322/]。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

用graphviz画机房拓扑的几个关键词

用graphviz画机房拓扑的几个关键词

我准备用graphviz画机房的拓扑图。用excel或txt记录机器和VLAN什么的信息,用antlr写个工具解析,然后生成dot文件,最后用graphviz把dot画出来。

想到有这么几个基本技术,今天试了一下。下面的这段代码就是例子。行号是我加的,为了说明方便。执行结果如图所示。

建一同学提到用graphviz画UML,请参考 plantuml。不知道为什么被墙了。

1 // dot -Tpng test.dot -o test.png; eog test.png
2 digraph a
3 {
4     node1 [label="NODE1", shape=none, image="pc.png", labelloc=b]; // color=white,
5     node2 [shape=box3d];
6     node3;
7     node4;
8
9 //    edge [weight=100, arrowhead=none];
10     node1 -> node2 [taillabel="tail", headlabel="head", labeldistance=3, labelangle=-45 ,label="label", sametail="a"];
11 //    edge [weight=0.5, arrowhead=none];
12     node1 -> node3:se [sametail="a", weight=100];
13     node3 -> node4;
14    
15     {rank = same; node2; node4; };
16    
17    
18 }

1. 定制节点

默认的节点是矩形圆形多边形这样规则的形状。可以使用图片,人类看起来漂亮一些。

参见第4行,image="pc.png"。

2. 线连接的位置

有些节点要连出去很多线,线连接的位置如果散开,有时候比较难看。sametail可以让它们都聚在一起,参见第10和第11行。

也许,有时候想从特别的角度连到节点上,可以指定方向,参见第12行node3:se,表示从东南方向连接。

3. 题注的位置

用了定制的图片以后,题注标在节点正中就有些不合习惯,可以用labelloc指定位置。参见第4行,lableloc=b,b表示底部。

线的题注 (这东西叫题注么?) 除了label本身以外,可以用taillabel,headlabel,分别标在箭尾或箭头。标在箭尾或箭头的题注,可以用labeldistance=3, labelangle=-45进一步修订,参见第10行。

4. 节点的位置

某个节点,如果希望它跟别的节点平级,用rank,参见第15行。rank不仅能same,还可以起名字。这一技术还可以用于水平的图,让时间与事件对齐。

还可以用node的属性pos指定节点位置。实验表明,1.需要给出所有的node的位置,2.要使用neato引擎,不能用dot本身。而且,我在实验中发现,想指定一个合理美观的节点位置实在太难了。如果想强调某个结点的核心位置,请参见下一条。

5. 连线的位置

如果想强调某根线,用weight。weight越大,线越直,线连接的节点间距离越近。参见第9、11、12行。

weight是edge的属性,因此既可以加在某条线的后的"[]"里,也可以如第9行的写法,从此向下的edge都具有这样的属性。

更多细节,请参考[http://www.graphviz.org/doc/info/attrs.html]。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

今天我生日

今天我生日

今天我生日,不过亲爱的各位请别祝贺了。前两天我下半夜睡着睡着,突然想
到,还有20年多一点我就退休了,如果按工作年限,就只有15年了。悚然一惊,
从梦里醒过来,翻来覆去想了很久。

也许15年或20年对有些人来说还很远,可是对我来说不太一样。从能够独立计
划,不必按老师安排学习以后,我一般订计划是以五年为期的。而今发现,这样
的周期只有三四次而已了,令人叹息。三次四计划,又能完成些什么呢。

我想起初中还是小学读到的一个日本作家的话。他当时确诊为癌症,医生说还能
活一年半吧,他写了本书,叫做《一年有半》。他说:一年半确实非常短暂,不
过无论谁,所余的生的日子与死后的无穷岁月相比,都不仅是短暂,而且趋近于
无。读到这一篇的时候,我只是感叹而已,心里倒是确认需要数日子的人里肯定
不会有我的。如今,各位,所余无多,当好好珍惜。

最近拍的照片,还有画的画,在
[http://www.douban.com/photos/album/100275452/]。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

创意,有时候啥也不是

创意,有时候啥也不是

那天和李记者喝酒,我说,你注没注意我跟你说话的时候从不注视你的眼睛,没有眼神交流,就盯着桌子或者墙。他说,我还一直以为你那是眼神空洞,表示睿智呢。我说,那是因为反正我也看不见,看哪都差不多。有的时候,只是傻看着这个世界,想说的很多,却不知从何说起。

今天说说创意吧。说说创意啥也不是的时候。当今之世,有人说这是个"创意"的时代。他有证据的,你看乔布斯吧,他的创意就好,手机啊MP3什么的,到了他的手里,就成了流行元素。这是"有人"最近的观点,他们在早些年举的例子是比尔盖茨。不过,他们刻意或无意地,回避了乔布斯其实很多年前就出过传记,那时候他还没死,还不是传说的时候。他创意过苹果和苹果II,最早的个人计算机,流行一时。不过如果你这就得出了创意无敌,还早点,他在苹果II以后还创意过好像叫Lisa的电脑,用据说第一款鼠标,还创意过一个NETX或者类似名字的公司,二者基本上都被认定为不怎么成功,如果避免用输得一塌糊涂这样的形容的话。

你只看到了贼偷,没看着贼挨打。

往远了说。春秋战国有个国君想拉拢人才,贴了告示,有啥能耐都用。来了个老头。问他会啥,说,我会小九九,就是九九乘法表。国君说你玩我呐。老头说,你想啊,大王,如果连像我这样会小九九的都能得到您的赏识和重用,那更有能耐的人不就接着来了吗。国君重用了老头,果然来了很多有能耐的人。这老头够有创意吧,故事的结局也不错,不过那老头后来呢?那老头从此淡出了历史。

再说。汉高祖刘邦对知识分子不礼貌,呼来喝去的。又来个老头,知识分子,说有大政方针指点。刘邦正洗脚呢,我忘了是一边擦脚还是坐那撇着腿了,就说,"啥事,说吧。"老头说,这可不是国君应该有的态度啊。刘邦然后就正式接见,然后就厉害了。故事又完了,那老头呢?这个老头后来倒是历史有点记载,不过跟洗脚这事没关系,他去当死间被人家烹了。

再说。李自成还是朱元璋进京以前,一片农民起义军。这个时候总会跳出来个人指点他,毛主席也遇到过这样的神仙,叫李鼎铭。他们说,"广积粮,缓称王"。然后大事遂成。怎么样,这个家伙也有创意吧。但是历史上,后来就没有他的事了。

这些有创意的人,他们都没有后来。

乔布斯的创意与这些才高八斗指点江山的家伙有所不同。乔布斯能在自己家车库(相当于仓房?)里把苹果机焊出来,而这些家伙的创意都是由别人去实现的。在这个世界上,创意从来不重要,除非你不把他拿出来。只要你拿出来,那就是全人类的,专利也只保护你那么几年。如果你不拿出来,那它就是不存在的,甚至也不属于你。没验证过的,不是创意,是吹牛。

所以,老板,如果你真的觉得自己的创意很好,那就亲自动手去干,或者出钱,证明它很好。老板们是不是脑袋都进水了,以为忽悠大家一起创意,然后这个世界就和谐了。没有一群工程师出力,谁替你把创意带到世界上来。

非老板们也以为自己一个创意就能救了自己。那是老板忽悠你的。上述春秋战国某王、刘邦、李自成的谋士的故事都告诉我们:未来的公司是属于跟老板一起光膀子打天下的。那个当初指指点点这么干能成的家伙,早就被大家忘光了。

别说,有一个人,他倒是例外。他当初指点他爹造反,建立了唐朝。他爹说过,要不是你那句话,咱们哪有今天。这位爹是李渊,儿子是李世民大帝。不过,他爹可不是没事回忆和感谢这位儿子当年的创意呢。李世民先是亲手跟老爹和兄弟们打了天下,后来杀了两个哥,逼李渊退位当太上皇。他爹对这位牛人的好评,可不是凭创意得到的。

《创世纪》里,上帝说,要有光。他老人家可不是说,我看有光不错,你们几个整一个试试。如果成了算我的,整出毛病来,反正也不是我整的。

作为工程师,少整点创意,多点实现创意的能力吧。

最后,我想起来十来年前给一位老板修机器时候的对话。他说,你为什么不考虑一下市场需求,创意很重要啊。不是原话,大致如此。我说,手头的活儿都干不过来,没工夫整创意。

有资本的人是有资本谈创意的,因为他有钱支持创意。如罗素所说,有闲阶级的太太们可以养活一大群无聊和不咋地的艺术家。没资本的人少扯点创意,多点实现别人创意的本事吧。

即使我有一千个创意,倒也不见得非得讲给无关的人听,又不是想拉他的投资。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

水木关站纪念

水木关站纪念

明天,是水木清华关站纪念日。事情过去的时间太久了,久到我都不记得那是哪一年。好好回忆了一下,结合学习两会精神,想起来,那是十年前。

水木清华,是清华大学当年的BBS,当时最大的BBS,也许没有之一吧。当时的高校BBS面向全社会开放,免费注册,随便浏览和发言。十年前的3月,高校们说,高校的BBS是属于高校自己的,只为校内师生服务,开始关闭对外的注册,也关闭了对外的连接。

南大小百合和水木清华的站务做出了相当激烈的反抗,结果之一就是现在的水木社区

[http://www.newsmth.net]。然而,十年,一切都烟消云散了吧。上次课的时候讲到理想电压源,它的端电压只由电压源本身决定,不随外界的变化而变化。我顺口讲到什么是理想,什么是不变,然后我问,"你们还记得当初的理想吗?"最后排有几位同学大声喊,"记得!"我不由得楞了那么一下,当时,我真想喊回去,"你们的理想是什么?"

你的理想是什么。你背弃了你的理想么。

十年。也许水木自己都忘记3-16关站纪念了吧。黑色的背景,也不知道明天还会不会出现,当初向清华校训献纸鹤的少年,此刻在为什么而忧虑。

我听说过这样的言论,高校的教育工作者们提出的问题,如何才能吸引青年学生们不只上人人网,而是"回归"到严肃的校内的讨论中来,应该建个什么样的站点。我哈哈大笑,有啊,这样的站点早就有啦,不就是被你们关掉了吗。而且,即使再建个这样的站点,你就能容忍同学们讨论你不喜欢的话题了吗,如果你不能容忍,他们一样还是会再离开。离开,然后变成你所期待的奴才,或者,成为你这样的人。很多人都可以说,他们根本没有背弃理想,只是换了一个,或者修正了而已。这,又有什么难的。

我愿意孤独地死去,一个也不原谅。

--

冬天过去,春天也还是灰色的。各种失望的人和事。某天中午,我以为有个特别好的消息,当真是欣喜得很。我当时想,这么久来,终于有一件让我能高兴那么一下的事。结果,空欢喜。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

云服务就是个渣:云服务或者google reader有多可靠

云服务就是个渣:云服务或者google reader有多可靠

云服务就是个渣,这是我纯从用户的角度发出的感慨,如果与云服务的技术从业人员或投入资本的家们的观点有所不同,深感遗憾。

当年我哪位导师就教导过我,"杨,你别把邮件放在服务器上,得放在本地。"我当时年少轻狂,说,"我相信google。"再说了,我当时也没有1个G的硬盘,那都是昂贵的设备。我也非常悲欢gmail的搜索,我想,分类算什么,纯是浪费时间,搜索快得多。我还使用

google reader 订阅

rss,一个原因是它用起来很方便,还有一个重要的原因是,通过它订阅到墙外的新语丝。google后来把服务都转移到https下,我还想过,真是贴心。

我用过 google note做笔记,记了不少东西,后来,这个服务关闭了。网速太慢,那些笔记最后就消失在不知道哪个空间里,再也找不到了。此后,我的笔记再也没有记在网上,本地硬盘,定期备份。我用过mybase,之前还用过什么忘记了,后来改用

emacs org-mode。mybase可以导出成rtf格式,org-mode干脆就是纯文本,目前看到处处通用。google

note的沉没没有引起我的警惕,只是抱怨了几句而已。不过,后来的有道笔记之类,我绝无尝试的勇气,盖源于此。

昨天听到噩耗传来, google reader将在2013年7月1日关闭。我才又一次猛然意识到,google

reader不是一个摸得着看得见的产品,而是一项服务--完全操纵在别人的手里,人家要停止,你连个P都放不出来啊。可怜我等小众在上面积累了这么久的阅读习惯、订阅的rss、各种趋势。g+初现的时候,为了强推之,google

reader被阉割掉share分享功能,那个时候,使用者们就应该有觉悟知道会有今日吧。

云服务是一种服务,而不是真实的机器,数据操在人家的手里,任由生杀予夺。我等不过是实验室中的小白鼠,你自以为人家是要饲候好你,其实只是为了记录哪种环境饮食能把咱们养育得更胖更白。当然,我们对此也不该有什么怨言,虽然我们看了广告,但是如果赚得不够,机主也确实有权利终止协议--估计律师们早就研究透了,对契约遵守什么的肯定绝无妨碍。

所以,当悲剧发生的时候就是这样:我倒是想把gmail的数据都整到本地来,可怜网速不够,而且gmail的pop3和imap似乎料到有此一招,批量下载数据的时候会时断时续。不信你亲自试试,或者google一下,早有讨论。

所以,永远也不要把希望寄托在这种不靠谱的东西上。你说那是个承诺,他说你当初完全误会了他的意思。

我现在才明白为什么苏老师一直坚持用古老得不行的outlook,导师们一直要求实验数据都刻盘什么的存着;明白了牛老师为什么一直不用endnote,一直费劲巴拉地组织目录树存文献。因为越是古老,越是用了很久的,才是可靠的。好玩的,花哨的,俏皮的幽默的,那都是很好很好的,可是,在真正干活的时候,又有什么用呢。

所以说,可靠才是第一重要的品质。得有多大勇气才能把自己托付给别人?而他在"不得已""我也没办法啊""情况变了啊"的时候把你的信任捏得粉碎。把你的信任捏成渣的,你就该把他视为同样粉碎的渣,然后永不相见。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]

《C程序设计语言》句读 20130313

《C程序设计语言》句读 20130313
今天从统计行数的例程请起,到统计单词数,数组刚刚开始。
这次照片也没有,感慨也没有了,快累死了。上传一次句读,表明还活着而已。
--------------------
博客会手工同步到以下地址:

反向工程一例,攻击人脸识别系统

反向工程一例,攻击人脸识别系统

包师弟有个笔记本,可以通过刷他的脸登录。登录的时候他往机器前面一坐,屏幕上显示摄像头看到他的脸了,然后"的狗"一声,机器就登录成功了。这几天做SECM实在压抑,干活期间,我们试着业余攻击这个人脸识别系统。

我们把攻击定义为,能通过包师弟的脸以外的东西登录成功。众所周知,人脸识别系统是通过摄像头,十有八九是基于数字图像处理的什么算法。如果能够猜测到算法,那么攻击就有的放矢了。

所以,第一步是猜想,第二步是设计实验验证或证否猜想,第三步是修正手头上的"东西",让它看起来虽然不像包师弟的脸,甚至不从他的脸抄袭,却能通过验证。

我们几个人一起整的,中间有商量彼此赞同,还有互相驳斥,再实验验证;许多猜想夹杂在一起,验证的顺序颇为混乱,所以我不按时间叙述,而按猜想组织。

1. 颜色,对比度

我们最初想到的就是拍一张包师弟的照片,刷照片。

第一张照片,我们考虑到了距离远近会导致几何失真,所以相机距离包师弟的脸与摄像头距离他几乎相同距离

(约一臂远)。距离不必太精确,因为考虑到人在登录的时候距离也不精确,所以算法一定具有一定程序的鲁棒性。又同样由于几何失真,我们把这张照片打印为人脸几乎充满A4纸,这跟人脸的真正大小差不多。

登录失败。

我们用的是灰度图,黑白打印机。所以我们怀疑是算法要求颜色,比如使用颜色和纹理确认哪里是人脸,哪里是背景。虽然我们强烈倾向于灰度应该有足够的信息了,但是反向工程时,目标产品用了什么算法却不一定局限于"合理"和足够。所以我们重拍了一张照片,打印成彩色的。

登录成功了。

再用登录成功的照片,打印成灰度的。

登录又成功了。

这说明算法是基于灰度的。第一次失败的照片拍摄的时候有些逆光,虽然使用了点测光,但是对比度仍然不够。这可能不利于检出边缘。

2. 部位

这时候许老师来了,他是物证签定专家。他说,应该挡住一些部位,可能某些部分就足够了。

挡住下巴,登录失败。与此前的登录失败不同,这次不是脸不能识别,而是没有找到脸。此下的实验也表明,认出那是一张脸和认出那是哪张脸,这两个不同的算法,或者算法两个不同部分。

在下巴那部分用黑笔画出个大致的轮廓,上半部分用照片,登录成功。头发和眉毛挡住,画个大致的轮廓,登录成功。把包师弟真人的下半部分用下巴的手绘轮廓图挡住,登录成功。

又做了几次实验。实验表明,眼睛部分是最重要的,其余的部分对于识别是哪张脸没有作用,或者可以归为鲁棒性部分。

包师弟最初在计算机中注册的是戴眼睛的,摘掉眼镜也可以,闭着眼睛也可以,但是眼睛的上缘刚好在瞳孔上登录失败。所以猜测跟瞳孔关系可能最大。关同学猜测,可能跟瞳距,包括瞳距与脸的两侧的比例有关。

用下巴那纸纸挡住包师弟的脸,如果下巴部分太长,登录失败,向上移动下巴的纸,登录成功。所以猜测,可能跟眼睛距离脸的上缘

(可能是头发下缘)和下缘(下巴)的比例有关。

3. 边缘检测

无论用手绘的线条,还是照片,都能检测出脸的存在。这说明至少在找到那是一张脸这一算法中,边缘检测不区别 线条

(两侧是同一颜色,线条是较深的颜色)和 灰度变化 (两侧是不同颜色)。

4. 大小

许老师猜身份证也行。实验表明,佳能IXUS 860

IS那么大的三英寸屏幕不行。我们分析的原因是,这么小的屏幕,为了在摄像头上得到足够大面积的脸,需要把照片靠近摄像头,而摄像头的焦点不能调节到这么近的距离,因此取像模糊。

包师弟的大手机屏幕 (四五英寸)就可以用于登录了。

5. 鲁棒性,装饰和遮蔽物

实验表明,头发可以手绘,而且轮廓即可,下巴也是。甚至宽下巴窄下巴都不怎么重要。包师弟还有个痦子,不画上没有任何影响。

算法大多仍是朴素和愚蠢的,没有智能化到你点个痦子或者理了发就发现这一点--如果它没有能力发现,也就不应该有能力以此为特征识别。

我猜,也许描个眼线,贴个睫毛,描个眼影,也许有影响。如果确认那是哪张脸的算法除了瞳孔还考虑了别的因素,比如眼睛的面积。因为如果用户登录尚未成功,他可能会调整表情、脸的位置,所以算法可能获取许多帧,然后找到眼睛大小和形状合理的那个。所以,表情导致的眼睛变化,算法不考虑可能仍在合理范围内。

6. 总结目前的进度

一张巴掌大小的灰度照片,可以登录。一张横向折了很多次的灰度或彩色照片,可以登录。眼睛及所在的水平像素是打印照片,其余部分是手绘的粗糙线条画,可以登录。

结论,眼睛部分是包师弟这台笔记本人脸识别登录算法的关键。当然,其他的部分要做到足够计算机确认那是一张人脸的程度。

原本希望手绘线条画,包括眼睛,能够登录。如果手绘的基本像眼睛,让计算机能找到,同时非常不像包师弟的眼睛,而算法的特征却一致

(比如算法如果使用了达到某灰度的积分值,即眼睛的面积),那就更理想了。这些最近都没有时间玩了。

--------------------

博客会手工同步到以下地址:

[http://giftdotyoung.blogspot.com]

[http://blog.csdn.net/younggift]