斯坦福教授、Tcl 语言发明者 John Ousterhout 的著作《A Philosophy of Software Design》,自出版以来,好评如潮。冠名为“哲学”,意为这本书讲授的是一些通用的原则和方法论,这些原则和方法论串起来,能够形成一个体系。用一句话概括《A Philosophy of Software Design》——软件设计的核心在于降低复杂性。
一、复杂性的来源
- 复杂性的定义
- 如果一个软件系统难以理解和修改,那它就很复杂。
- 一个功能复杂但操作简单的系统,并不复杂。
- 总体复杂度等于每个部分复杂度乘以开发人员所花时间,因此隔离复杂性和完全消除复杂性几乎一样好。
- 复杂性的症状
- 变更放大: 看似简单的变更需要对代码在很多地方进行修改。
- 认知负荷: 开发人员需要知道很多信息才能完成任务。
- 未知的未知: 需要修改什么代码、知道哪些知识才能完成任务,在系统中都不是明显的。
- 复杂性的原因
- 依赖性: 依赖关系是软件系统的基本组成部分,无法完全消除。软件设计的目标就是最大化减少依赖关系。
- 模糊性: 当重要信息不明显时就会产生模糊。比如依赖项不明显、变量名不一致等。缺乏文档也是其中一个原因,但是一个简洁的设计能减少对文档的需求。
- 复杂性的积累
- 系统复杂性都是一点一滴积累起来的,因此需要在开发维护时实行“零容忍”策略。
二、如何正确工作
2.1 战略编程与战术编程
- 战术编程
- 着眼于快速完成任务,不介意增加一些复杂性和引入一两个错误。
- 会逐渐积累复杂性,并在之后让重构系统的成本变得难以负担。
- 战略编程
- 将系统长期结构视为重要目标,而不仅仅关注工作代码。
战略编程需要一种投资心态:
- 主动投资: 例如为每一个新类找到一个简单设计;试想系统未来可能需要的扩展。
- 被动投资: 当发现设计问题时,花一些额外时间修复它。
- 初期的设计很快会因需求的改变而变得不合适,因此应进行连续小额的投资,总共花10-20%的时间,可在几个月后收回成本。
2.2 设计两次
设计软件是件复杂的事情,很少有人能一次做对,再聪明的人也会被提拔到足够困难的环境中,所以要对每个主要设计考虑多个选项。设计两次可以改善设计、提高自己的设计能力。
设计步骤:
- 勾勒出一些重要方法。
- 尝试选择完全不同的方法,考虑它们的弱点并将其与其他设计特征进行比对。
- 列出每个方案的优缺点。接口是否带来更简洁的界面?是否更通用?是否带来更有效的实现?
- 最终选择一个,或者将多个功能组合成一个新的设计。
- 如果没有一个方案足够好,则是一个危险的信号,需要带着原始方案的问题重新考虑设计。
2.3 选择名字,一致性,代码易读性
2.3.1 选择名字
为变量和函数选择一个好的名字能带来很多好处,例如避免错误、提供重要信息。
- 精确性: 避免笼统和含糊。一个名称如果过于广泛(如result),那它无法传递有效信息。好的名字可以让读者在不查询文档的情况下推知它的角色、值的意义。
- 一致性: 在系统中不同位置可以使用同一名称用于相同目的,但需要注意以下几点:
- 始终将通用名称用于给定目的;
- 除给定目的外不使用通用名称;
- 确保目的足够狭窄,使所有通用名称都有相同行为。
2.3.2 一致性
一致性还可以作用在更大的范围,是显著降低系统复杂性的强大工具。其功效有两点:
- 降低认知负担: 如果系统是一致的,就意味着相似的事情以相似的方式完成,不必了解每一处细节。
- 减少错误: 开发人员可以根据熟悉的模式进行假设而不出错。
一致性体现在以下几个方面:命名、编码风格、接口、设计模式、不变量。其中不变量是始终为真的变量或结构的属性,例如储存文本的数据结构总以换行符结尾。这种不变量减少了特殊情况。
一致性约定不要随意改变。一致性相比不一致的好处远大于一个新方法相比于旧方法的好处。除非新的方法能够带来足够的好处,才可以进行一致性约定的改变。如果确定要改变,则要保证完全去除旧的约定,重新让系统达到一致性。
2.3.3 代码易读性
代码清晰可读,能够让合作者快速了解其功能,也能减少犯错的可能。确定代码是否清晰的最好方法就是让别人来阅读代码。只要读者认为不清晰,就需要进行调整。除选择好的名字、保持一致性以外,空格、注释和文档的合理使用也能让代码清晰可读。
有几种做法会损害代码的清晰性:
- 事件驱动的编程。 事件驱动的编程很难遵循控制流程,为了弥补这种模糊性,应该给每一个处理程序函数使用接口注释。
- 通用容器 容器如
std::pair
等提供了方便的方法一次性返回多个对象,但分组后元素的通用名称模糊了它们的含义。因此最好定义新的类或者结构体,并赋予有意义的名称。
2.4 正确修改代码
系统的设计在不断发展,添加新的模块和功能,因此无法在一开始给系统一个正确的设计。我们需要采取措施防止随着系统的发展而积累复杂性。
保持战略。 大多数开发者思考的是“如何以最小修改达到目的”,虽然这避免了大的改动带来的不稳定,但这种战术编程会迅速积累复杂性。因此应在修改代码时就考虑设计系统,以获得最佳设计,这样每次修改都将改善系统设计。
小步前进。 每次修改代码时都尝试找到一点系统设计的改善。在几个月时间的重构和两个小时的修补之间,考虑一种折中的替代方法,它能够提供像重构一样的简洁,但只需要几天实现。每个团队都应留出一些时间来进行清理和重构,这会很快收回成本。
三、模块如何设计
3.1 模块应该是深的
为了管理系统复杂性,我们将软件划分为不同的模块,理想情况下程序员可以在任何模块中工作而不必了解其他模块。然而由于模块间不可避免地有相互依赖,所以将模块分为接口和实现两个部分:
- 接口:描述模块做什么,而非怎么做
- 实现:完成接口所承诺的功能
最好的模块是接口比实现简单得多的模块,有两个优点:(1) 将外部复杂性降到最低 (2)更容易在不影响接口的情况下更改实现
模块深度是考虑成本与收益的一种方式:
- 模块提供的好处是它的功能
- 模块的成本是其接口,代表其强加于其他模块的复杂度
最好的模块是那些收益最大化而成本最低的模块,因此深模块是更好的。unix系统的文件I/O机制就只有五个接口,虽然随着计算机系统的发展它们的实现已经发生了翻天覆地的变化,但仍然保持着稳定而简洁的接口。
3.2 信息隐藏
实现深层模块最重要的技术就是信息隐藏:每个模块应该封装一些知识,这些知识代表设计决策,对其他模块不可见。带来两点好处:
- 简化了接口,隐藏了细节,减少认知负担。
- 使系统更容易演化。信息隐藏技术减少了外部模块对内部信息的依赖,如tcp协议改变只需要更改底层通信类。
信息泄漏是信息隐藏的反面,当一个设计决策反映在多个模块中时,就会发生信息泄漏。这在模块间创建了依赖关系,对设计决策的任何改变都要求修改所有涉及的类。比如对特定文件结构的读写。
将任务按时间分解并依此设计系统容易产生信息泄漏。如文件读取-修改-写出,其中I/O部分共享文件结构信息,应实现在同一类中。在设计模块时应专注每个模块涉及的知识,而不是执行的顺序。
3.3 不同的层不同的抽象
软件系统由不同层组成,较高层使用较低层提供的接口。在设计良好的系统中,每一层都提供与其上下两层不同的抽象。
- 直通方法: 相邻层存在相似抽象时,通常会出现直通方法。直通方法存在以下问题:(1)除传参外不执行任何操作(2)增加复杂性而不带来任何功能(3)在类之间创造依赖关系。直通方法表明类之间职责划分出现混淆,需要用重构解决,有暴露、划分、合并三种解决方法。
- 接口复制: 具有相同签名的方法只要提供有用且独特的功能,就不会混淆,而且能降低认知负担。它们通常位于同一抽象层。举例:分派器函数调用同名函数。
- 装饰器: 装饰器对象接受现有对象并扩展其功能,通常提供相同API。装饰器类通常很浅,引入大量模版但提供很少的功能,考虑与基础类、用例或已有装饰器进行合并以减少复杂度。
- 接口与实现: 接口与实现的分离是另一个“不同层不同的抽象”规则的应用。
- 跨层传参: 传递变量增加了复杂性,因为它强制所有中间方法知道它的存在,但并不产生作用。有三种办法减轻跨层传参的复杂度:共享对象(打包参数),全局变量,上下文对象。
3.4 降低复杂性
遇到不可避免的复杂性时,应该让用户处理还是让模块内部处理?通常用户数量远远多于开发者,因此应尽可能让用户舒服。一个准则是:简单的接口比简单的实现更重要。
例如不确定要实施什么策略,则可以定义一些配置参数来设定模块。配置参数可以让用户有更强的控制,但这会增加系统的复杂度。在决定将一个参数交给用户设置前,先扪心自问:用户是否能够确定比我现在更好的参数?如果不能,那就尽可能自动计算合理的默认值。
3.5 相关模块放在一起
给定两个模块,它们是否应该放在一起?可以从降低复杂度的角度看到,有两种典型场景下两个模块应该放在一起:(1)模块共享信息(2)放在一起可以简化接口
模块过长并不是拆分它的理由,而是要看拆分之后是否能够提供更好的抽象(如消除重复),否则更深的模块和更简洁的接口能带来更多好处。
3.6 减少异常处理
异常处理是软件系统中最糟糕的复杂性来源之一。异常通常指任何会改变程序正常控制流程的不常见条件,包括正式定义的异常和方法因未完成正常行为而返回特殊值。异常处理带来复杂性主要在于:
- 异常中断了正常代码流,无论是停下还是继续程序都很复杂。
- 异常处理代码为带来更多异常创造条件。(在冗余恢复期间再次发生异常怎么办?)
- 语言对异常的支持是冗长笨拙的,使阅读变得困难。
- 难以检查异常处理模块是否正确工作,因为异常很少发生。
抛出异常容易,处理起来却很麻烦,所以最好的方法是减少必须处理异常的位置数,有四种方法:
- 消除定义盲区: 消除特殊情况,使得程序可以自动处理所有情况而不需要额外代码
- unix与windows文件删除的不同实现,使得unix可以删除正在被其他进程使用的文件而不产生异常。
- java字符串取子串的接口支持超出范围的输入。
- 异常屏蔽: 在系统较低的级别上检测和处理异常,使得更高级别软件无需知道该情况。
- tcp网络传输丢包的处理。
- NFS系统服务器崩溃时客户端只会挂起。
- 异常聚集: 用一段代码处理多个异常。这种方法适合处理在堆栈中传播了多个层级的异常。
- web服务器需要处理url的各种问题,但因为处理异常都是打印错误消息,所以可以传递至最顶层用同一段代码处理。
- RAMCloud从来不单独处理异常恢复,而是把所有异常提级,进行服务器级别的崩溃恢复。这样做减少了必须的代码编写量,也使得崩溃恢复代码得到更多测试。虽然增加了恢复成本。但由于异常发生频率低,这样做不是大问题。
- 直接崩溃: 软件系统中有些错误是不值得尝试的,此时直接打印诊断信息并中止是最好的方法:
- 储存分配期间出现内存不足。
- I/O时出现错误(除非软件系统本身就是储存系统)。
重要的异常仍然需要抛出,不要为了消除异常位置而走得太远。
四、如何写注释
- 代码内注释很重要:
- 帮助开发人员理解系统并有效工作
- 隐藏模块的复杂性
- 编写注释改善系统设计
- 好的注释
- 可以对系统整体质量产生很大影响
- 并不难写
- 写起来很有趣
4.1 四个写注释的理由
- Q1:好的代码可以自我注释
“好的代码不需要注释”是个美丽的谎言,因为:- 没有注释代码就不完整: 代码的正式接口定义只能提供一部分信息,剩下的非正式信息(如方法的功能和原理)只能由注释提供。
- 没有注释很痛苦: 如果要通过阅读代码来知道方法的功能,会非常耗时和痛苦。而为了可读性使用浅层方法会使方法变复杂。
- 有了注释很方便: 有了注释可以提供完整的抽象,只保留必要的信息,从而隐藏复杂度。
- Q2:没有时间写注释
- 如果总将开发任务置于注释之上,那么永远不会轮到注释。
- 如果想要高效的软件结构和长期有效的工作,那必须花费额外时间。好的注释能够很快收回投资成本。
- 许多最重要的注释是顶层设计与抽象,是设计过程的一部分,不占额外时间,并且会让系统结构变得更好。
- Q3:注释过时或者误导
- 只有当代码发生较大改动时才会需要对注释作大的改动,相比起来注释改动很小。
- 避免重复的文档并时刻保持文档与代码一致。
- Q4:很多注释没有用
- 可以通过一定的方法编写良好的文档并随时进行维护。
- A1:写注释的好处
- 减轻认知负荷: 通过提供必要信息为开发人员减轻认知负担。
- 减少未知的风险: 通过阐明系统结构从而减少未知。
- 依赖与模糊: 阐明依赖关系,填补空白消除模糊。
4.2 怎么写注释
代码不能捕获开发人员想到的所有重要信息,因此需要编写注释来记录它们。注释的指导原则是描述那些代码中不明显的信息。
确定注释的约定:约定要注释的内容和格式。约定即便不完美也没关系,约定保证了两件事:一致性、有内容。
注释一般分为四种:
- 接口注释:描述接口的整体行为
- 实现注释:描述代码内在工作方式
- 数据结构成员注释
- 跨模块注释
不要重复代码:有两种常见误区
- 重复代码: 注释内容可轻松地从代码推断出,因此没有引入额外信息。
- 复用代码中的实体名: 注释应选用为实体提供更多信息的表述。
低级/高级注释
- 低级注释提高精度:
- 变量单位、范围、空值含义、资源管理、是否存在不变量等。
- 注释变量时尽量使用名词,清楚表明它记录什么。
- 高级注释增强直觉:
- 在比代码更高层面编写,提供一个只保留必要信息的简单框架,帮助读者理解整体意图和结构。
接口/实现注释
- 记录抽象的第一步就是分离接口注释和实现注释。
- 接口注释应包含用于抽象的高层信息,也应包含用于精度的低层细节信息:
- 描述该方法在调用者视角下的行为
- 描述每个参数和返回值
- 如果有副作用,则必须注明
- 如果调用前需要满足一定条件,则必须注明
- 实现注释出现在代码内部,以帮助读者了解代码的工作方式。实现注释主要做三件事:
- 解释代码在做什么(而不是如何做)
- 解释这么做的原因(如果在代码中并不明显)
- 解释重要的局部变量
跨模块设计
理想的环境下,每个设计决策都应封装在一个类中。但在实践中仍然不可避免跨模块的依赖。跨模块文档编写最重要的事是找到一个合适的放置位置。如果很难找到,则可以创建一个中央文件,以保证只有一份文档。
4.3 先写注释
先写注释有三大好处:产生更好的文档,产生更好的设计,产生愉悦感。
推迟编写注释会导致没有注释,即便返回回来写注释也因为长久没有设计代码了而让记忆变得模糊,从而漏掉重要的设计,最后还让编写注释变得无聊。
首先编写类的接口注释,其次是重要公共方法的注释和签名,不断迭代直到满意为止。然后为实例变量编写注释,最后实现方法主体。
先写注释的好处:
- 更好的注释: 先写注释能够让设计者专注于设计问题,而不为实现分心,得到更好的抽象。其次,在编码和测试过程中能够发现注释的问题,从而改善注释。
- 更好的设计: 注释提供了完全捕获抽象的唯一方法。如果注释需要写得很复杂,说明没有很好地抽象,设计存在问题。反之如果注释清晰完整,则是良好设计的指示。
- 早期注释很有趣: 类的早期设计阶段是编程中最有趣的部分。找到简洁的注释会带来成就感。
- 早期注释并不贵: 早期编写注释和后期编写注释花的时间差不多,至多占10%的总时间。尽早编写注释意味着抽象更加稳定,这会节省编码时间。
4.4 更新注释
当更新代码时,更改很有可能使注释过时。不准确的注释会让读者沮丧。发生次数多了之后读者便会对注释失去信任。如何保持注释在最新状态呢?
- 离代码近: 注释离关联代码越远,被正确更新的概率就越小。所以应将注释放在离它所描述代码近的地方,如:
- 编写接口注释时考虑放在.cc文件。更改代码主体时可以看到注释。IDE/Doxygen工具可以提取注释从而不会与写在头文件上有区别。
- 编写实现注释时将注释分散开来。不要将所有注释写在开头,将其分散到主体中,头部只写总体策略。
- 不要将重要注释放到提交日志中。
- 避免重复: 如果同一份注释有多个副本,则更新时很容易漏掉。
- 只记录一次设计决策,并把它放在最明显的位置。
- 如果找不到合适的地方,新建一个designNote,并把所有相关地方指向该note。
- 不要把一个模块的设计放在另一个模块中,比如不要在方法调用处解释该方法。
- 如果信息在模块之外的某个地方记录了,就不要重复记录。
- 检查差异: 在提交更改前再检查一遍所有变动,确定文档正确反映了每个更改。
git diff
能很好完成这一功能。 - 让注释更高级: 越高级、越抽象的注释越不容易受到代码更改的影响。
五、设计性能
简单性不仅能改善系统设计,而且通常还能使系统更快。
先了解哪些操作是昂贵的:
- 网络通信:数据中心内往返约10-50us,广域往返10-100ms
- 存储I/O:硬盘5-10ms,闪存10-100us,固态硬盘1us(2000条指令)
- 动态内存分配:分配、释放和垃圾回收等产生大量开销。
- 高速缓存未命中:数百条指令的延迟。
了解程序中哪些东西是耗时的,最好的方法是运行基准测试。第一,目标是确定大量耗时的少量非常具体的地方。第二,可以为性能改善提供基线。
以高性能的方法替代耗时的方法。例如用hash表替代有序映射,用C/C++分配结构数组。如果增加复杂度是提高性能的唯一方法,就需要仔细考虑;如果复杂度被封装起来,那它是值得的;否则,最好先从简单的方法开始,在遇到性能瓶颈时再作优化。
围绕关键路径进行设计:
- 首先确定在通常情况下需要执行的最少代码量是多少,忽略所有特殊情况,并假定最适合的数据结构,得到一个理想中的设计。
- 第二步寻找一个新的设计,尽可能的接近理想设计,并同时保持干净的结构。
- 最重要的事是减少需要处理的特殊情况,因为每增加一个特殊情况就会拖慢系统运行,最好是在一开始只有一个if语句判断是否是特殊情况。
参考资料
[1] https://go7hic.github.io/A-Philosophy-of-Software-Design/#/
[2] https://cactus-proj.github.io/A-Philosophy-of-Software-Design-zh/