编者按:本文中,作者从三个方面来论证教材中的“软件工程”和实际中的“软件工程”有何不同。鉴于此,作者认为或许实打实地写代码、做系统才能帮助学习者进一步增进对于“软件工程”的理解。本文作者 余晟,36氪经授权转载自微信公众号 余晟以为(ID: yurii-says)。
按:本文的很多观点来自与七牛云存储首席架构师道哥(李道兵)的讨论,在这里对道哥表示感谢。
高校的计算机教育与时代脱节,这已经成为大家的共识。如果要问哪些课程脱节最严重,我的答案是“软件工程”。其他的课程虽然也有脱节,但多少有点用处:编程语言虽然不教怎么把程序写漂亮,至少教了语法;网络课程虽然没有形象直观的展示,毕竟通讯协议还在使用;数据库课程不讲数据库的安装和调优,关系代数理论仍然是不少问题的原型;数据结构与算法即便看起来与开发没有直接关联,有了概念总不会吃亏……
只有软件工程,是例外。顾名思义,“软件工程”讲的应当是把软件开发出来的学问。所以,它是名不副实的:如果你按照“软件工程”教的去做,多半开发不出来软件,至少开发不出好的软件。一方面大量毕业生不会写程序、写不出好程序,另一方面合格的“软件工程师”奇缺,对这种怪异的景象,名不副实的“软件工程”功不可没。
不信?我在写作本文之前专门查阅了如今流行的“软件工程”教材,共同的大纲如下:
可行性研究
形式化说明
软件研发模型
设计-实现-测试
面向对象分析、方法、实现
软件生命周期
项目管理
如今真正做过软件开发的人觉得这些名词和自己的开发有多大的关系?就我的调查,大多数人的答案是“没多大关系”。但是大多数人的日常工作,分明又是“软件工程”。那么,此“软件工程”和彼“软件工程”为何不一样,问题到底出在哪里呢?按照我的总结,主要有以下几个方面。
教材上的“软件工程”是理论先行的,现实的“软件工程”是实践先行的。
理论先行的潜意识,就是把现实世界削删之后装到理想的世界里,受到预定义的规范和定理的支配。早期的软件开发确实可以严格遵循这种套路,比如银行的业务就与关系数据库理论严密契合,所以要做的是直接映射到复杂(完美)的实体-关系中,用数据库表加以实现。所以,重要的问题是“分析”,也就是找到对应的理论模型,然后进行设计和开发。
现代软件开发的环境则有很大不同。软件需要解决的不再是“经典问题”,而是复杂的现实问题,这类问题背后根本没有统一的抽象模型。比如当前热门的NoSQL,出现的原因是大家发现很多问题“不是关系模型可以解决的”。然而“不是关系模型”的模型到底是什么模型,根本没有理论答案,所有人都在不断摸索和总结,虽然有了一些中间阶段的解决方案,但各个流派至今也没有统一。既然没有理论,就只能在实践中不断思考、摸索、总结,并及时关心了解业界的最新经验。很不幸,这样的工作方式并不包含在“软件工程”的教材里。
“实践先行”的另一个表现是,必须意识到软件运行的环境是不可靠的——用户是不会按照说明书的严格规定来使用软件的,安装软件的操作系统可能缺乏某个类库,软件运行的硬件环境往往并不可靠…… 我们说一款软件(或者一套系统)工程做得好,往往就是肯定它们已经预先考虑到了各种异常情况,并且都准备了适当的应对预案。能够在开发之前思考各种异常并设计应对方案(“为失败而设计”),这是软件工程师的基本素质。不幸的是,“软件工程”教材也没有教授这样的素质。
教材上的“软件工程”是单机环境的,现实的“软件工程”是网络环境的。
如果你仔细留意就会发现,在“软件工程”的教材里,计算机的资源常常被假设为无限的,它们给了开发者披坚执锐的勇气。即便有“工程”相关的考虑,往往也只是针对这个流程的思考而已。比如常见的图书管理系统,几十万几百万图书的信息虽然人工管理起来无比麻烦,计算机却异常简单,根本不用考虑内存、数据库、硬盘、处理速度的限制,所以这些因素大可在抽象思考的过程中忽略。自然而然的,“软件工程”只需要关心项目管理即可。
但是有过现实开发经验的人都知道,如今单机的处理能力已经远远不能应对计算机要解决的问题。比如网站的登录服务,从模型上说与图书管理系统差不了多少,甚至更简单。但是用户量的飞涨可能迅速超过了单表、单库能承受的极限,大量用户的集中登录会大量消耗带宽和计算资源,登录信息的保存很可能超过单台机器的内存容量,这还不包括避免会话保持服务器发生异常影响用户体验而必须准备的会话迁移……
在移动互联网推动导致数据和计算量爆炸式增长的今天,几乎所有的程序员都必须从一开始就摆脱单机的思维,掌握这种从逻辑服务、抽象资源及其限制的角度出发看待和解决问题的思考和工作方法。不幸的是,这样的思维方式,教材上的“软件工程”也没有涉及。结果就是大量系统只能满足于小打小闹,业务稍微增长就无力应对了。
教材上的“软件工程”侧重的是开发,实际的“软件工程”兼顾开发与维护。
如果你仔细观察就会发现,教材上的“软件工程”无论怎么强调反馈和改进,总是把大部分篇幅放在了“开发”上。只要软件的分析准确、设计得当、开发规范,交付之后就解决了大部分的问题。至于软件运行中会遇到什么问题,那是运维的事情。软件的缺陷如何管理,那是下次升级要解决的问题。总而言之,软件交付之后,事情基本就告一段落了。
但是实际的软件开发中,“交付”的更准确的说法只是“第一次交付”,后续还有若干次交付。尤其在时间紧急的项目中,根本不可能有那么多时间去分析和设计,只能保证几个主要的功能运行正常。之后再投入精力去改进和完善这个“半成品”。对优秀的软件工程师来说,这种权衡能力是非常重要的。不幸的是很多人都不具备这种能力,结果要么是过度设计导致迟迟不能交付,要么是毫无设计和规划导致改进和完善困难重重。可惜,这种权衡的能力,教材上的“软件工程”并没有涉及。
现代软件开发的另一个特点是,开发的结果不再是一次定型的“软件”,而是需要不断维护和改造的“系统”。系统既要根据实际的运行环境不断调优,又要持续根据用户(而不是一锤子买卖的“客户”)的反馈迅速改进甚至是调转方向。所以优秀的软件工程师一方面会关心系统的运行状况,不会一股脑扔给运维人员去解决,另一方面还得设计出柔韧而健壮的系统架构,并且有勇气和耐心持续投入精力去维护和改造,有时候甚至要毫不犹豫地推倒重来。很可惜,这种“持续打磨”的工作模式,教材上的“软件工程”也没有涉及。
总的来说,现在高校的“软件工程”教材其实与“工程”没什么联系。当然这也情有可原,因为现代软件开发已经脱离了“计算机科学”的笼罩,依靠自身的经验和实践形成了一门全新的学问。然而无论是教材的编写者,还是课程的教授者,习惯和思维都还停留在“计算机科学”的时代,并没有多少实际开发的经验,也没有重视实际的开发。不幸的是,教师和教材可以停留在过去,学生却必须在现在的时代工作。所以,如果你现在正在高校学习计算机的知识,不妨实打实地写代码、做系统。如果持之以恒,你对“软件工程”的理解将会远远超过《软件工程》。