经验技巧5 如何回答算法设计问题

程序员面试中的很多算法设计问题,都是历年来各家企业的“炒现饭”,不管求职者以前对算法知识学习得是否扎实,理解得是否深入,只要面试前买本《程序员面试笔试宝典》(编者早前编写的一本书,由机械工业出版社出版),学习上一段时间,牢记于心,应付此类题目就完全没有问题,但遗憾的是,很多世界级知名企业也深知这一点,如果纯粹是出一些毫无技术含量的题目,对于考前“突击手”而言,可能会占尽便宜,但对于那些技术好的人而言是非常不公平的。所以,为了把优秀的求职者与一般的求职者能够更好地区分开来,企业会推陈出新,越来越倾向于出一些有技术含量的“新”题,这些题目以及答案,不再是陈谷子烂芝麻了,而是经过精心设计的好题。

在程序员面试中,算法的地位就如同GRE或托福考试在出国留学中的地位,必需但不是最重要的,它只是众多考核方面中的一个而已,不一定就能决定求职者的生死。虽然如此,但并非说就不用去准备算法知识了,因为算法知识回答得好,必然会成为面试的加分项,对于求职成功,百利而无一害。那么如何应对此类题目呢?很显然,编者不可能将此类题目都在《程序员面试笔试宝典》中一一解答,一来由于内容众多,篇幅有限,二来也没必要,今年考过了,以后一般就不会再考了,不然还是没有区分度。编者以为,靠死记硬背肯定是行不通的,解答此类算法设计问题,需要求职者具有扎实的基本功以及良好的运用能力。编者无法左右求职者的个人基本功以及运用能力。因为这些能力需要求职者“十年磨一剑”地苦学,但编者可以提供一些比较好的答题方法和解题思路,以供求职者在面试时应对此类算法设计问题。“授之以鱼不如授之以渔”,岂不是更好?

(1)归纳法

此方法通过写出问题的一些特定的例子,分析总结其中一般的规律。具体而言就是通过列举少量的特殊情况,经过分析,最后找出一般的关系。例如,某人有一对兔子饲养在围墙中,如果它们每个月生一对兔子,且新生的兔子在第二个月后也是每个月生一对兔子,问一年后围墙中共有多少对兔子?

使用归纳法解答此题,首先想到的就是第一个月有多少对兔子,第一个月的时候,最初的一对兔子生下一对兔子,此时围墙内共有两对兔子。第二个月仍是最初的一对兔子生下一对兔子,共有 3 对兔子。到第三个月除最初的兔子新生一对兔子外,第一个月生的兔子也开始生兔子,因此共有 5 对兔子。通过举例,可以看出,从第二个月开始,每一个月兔子总数都是前两个月兔子总数之和,Un+1=Un+Un-1,一年后,围墙中的兔子总数为377对。

此种方法比较抽象,也不可能对所有的情况进行列举,所以,得出的结论只是一种猜测,还需要进行证明。

(2)相似法

此方法考虑解决问题的算法是相似的。如果面试官提出的问题与求职者以前用某个算法解决过的问题相似,此时此刻就可以触类旁通,尝试改进原有算法来解决这个新问题。而通常情况下,此种方法都会比较奏效。

例如,实现字符串的逆序打印,也许求职者从来就没遇到过此问题,但将字符串逆序肯定在求职准备的过程中是见过的。将字符串逆序的算法稍加处理,即可实现字符串的逆序打印。

(3)简化法

此方法首先将问题简单化,例如改变一下数据类型、空间大小等,然后尝试着将简化后的问题解决,一旦有了一个算法或者思路可以解决这个简化过的问题,再将问题还原,尝试着用此类方法解决原有问题。

例如,在海量日志数据中提取出某日访问某网站次数最多的那个IP地址。很显然,由于数据量巨大,直接进行排序不可行,但如果数据规模不大时,采用直接排序不失为一种好的解决方法。那么如何将问题规模缩小呢?于是想到了哈希(Hash)法,Hash法往往可以缩小问题规模,然后在简化的数据里面使用常规排序算法即可找出此问题的答案。

(4)递归法

为了降低问题的复杂度,很多时候都会将问题逐层分解,最后归结为一些最简单的问题,这就是递归。此种方法,首先要能够解决最基本的情况,然后以此为基础,解决接下来的问题。

例如,在寻求全排列的时候,可能会感觉无从下手,但仔细推敲,会发现后一种排列组合往往是在前一种排列组合的基础上进行的重新排列,只要知道了前一种排列组合的各类组合情况,只需将最后一个元素插入到前面各种组合的排列里面,就实现了目标:即先截去字符串s[1…n]中的最后一个字母,生成所有s[1…n-1]的全排列,然后再将最后一个字母插入到每一个可插入的位置。

(5)分治法

任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小,越容易直接求解,解题所需的计算时间也越少。而分治法正是充分考虑到这一内容,将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。分治法一般包含以下三个步骤:

1)将问题的实例划分为几个较小的实例,最好具有相等的规模。

2)对这些较小的实例求解,而最常见的方法一般是递归。

3)如果有必要,合并这些较小问题的解,以得到原始问题的解。

分治法是程序员面试常考的算法之一,一般适用于二分查找、大整数相乘、求最大子数组和、找出伪币、金块问题、矩阵乘法、残缺棋盘、归并排序、快速排序、距离最近的点对、导线与开关等。

(6)Hash法

很多面试笔试题目,都要求求职者给出的算法尽可能高效。什么样的算法是高效的?一般而言,时间复杂度越低的算法越高效。而要想达到时间复杂度的高效,很多时候就必须在空间上有所牺牲,用空间来换时间。而用空间换时间最有效的方式就是Hash法、大数组和位图法。当然,此类方法并非万能,有时,面试官也会对空间大小进行限制,那么此时,求职者只能再去思考其他的方法了。

其实,凡是涉及大规模数据处理的算法设计,Hash法就是最好的方法之一。

(7)轮询法

在设计每道面试笔试题时,往往会有一个载体,这个载体便是数据结构,例如数组、链表、二叉树或图等,当载体确定后,可用的算法自然而然地就会暴露出来。可问题是很多时候并不确定这个载体是什么。当无法确定这个载体时,一般也就很难想到合适的方法了。

编者建议,此时,求职者可以采用最原始的思考问题的方法——轮询法,在脑海中轮询各种可能的数据结构与算法,常考的数据结构与算法一共就那么几种(见表1),即使不完全一样,也是由此衍生出来的或者相似的,总有一种适合考题的。

表1 常考的数据结构与算法知识点

此种方法看似笨拙,其实实用,只要求职者对常见的数据结构与算法烂熟于心,就没有问题。

为了更好地理解这些方法,求职者可以在平时的准备过程中,应用此类方法去答题,做得多了,自然对各种方法也就熟能生巧了,面试的时候,再遇到此类问题,也就能够收放自如了。算法设计功力的练就是平时一点一滴的付出和思维的磨炼。方法与技巧只是给面试打了一针“鸡血”、喂一口“大补丸”,真正的功力还需要长期的积累。