刷题方法论

【转自一亩三分田】谈谈面试官在面试coding题目时的考察终点与心理活动

本人简介: 曾经微软dev, 35+, 10年经验, 有FLG offer.  去年加入一个start up 公司, 最近前景不明, 在犹豫要不要去个稳定点的大公司。  我从sde开始面试其他人, 到现在估计面试过100+人次的面试和debrief。 我面过coding, problem solving, design, behavior.  本帖子只谈论纯粹coding, 视情况讨论要不要再开帖子讨论其他方面。

本文涉及下面几个问题:

1) 我刷过这个题目, 还要不要伪装
2) 我觉得这题很简单, 但是不知道为什么就挂了
3) 我觉得面试官不是很友好, 没提示
4) 我一定要bug free才能被录取
5) leet code的hard问题真的会被问到吗? 考起来有什么意义?

我们从一个非常经典的, 大家可能都刷过的题目开始。 序列化/反序列化 二叉树。先说个背景, 能面到我这里的, 基本需要面试者有3-5年的面试经验。 做为应聘任何微软或者flg的高级dev (63 and above, T4/E4 and above), 面试官其实都是假设你刷过不少题目的。 我假设你刷过这个题目, 所以我并不关心你写的到底有多快,写的是不是完全bug free, 我更关心的是你做事的方式和沟通问题的能力。 具体请看下面。  
1. 提出问题, 请序列化/反序列化二叉树。  
什么? 面试者不知道什么是序列化, 反序列化? 那我就问个多线程爬虫, timing LRU 一类的。 如果多线程, 锁也不会, 那说明这个面试者的项目经验很不足。 为了和其他有经验的人相match, 往往我会给一个很open的问题, 或者一个很难的hard coding (取决于他已经被考察了哪个方面). 我个人觉得很少有面试官上来会考你 very hard coding question, 只是当某个面试者与其他面试人比显得相当缺少项目经验, 那他除非能在聪明敏捷或者下苦功方面有突出表现, 否则很难击败其他候选人。

2. 交流阶段
如果面试者马上开始写程序, 或者马上给出他的想法, 我会觉得面试者太过于着急了。 在实际项目中, 你很熟悉的地方可能成为项目中的滑铁卢, 因为你熟悉的地方可能有变化, 可能有个big change你不知道, 可能很快你熟悉的api就不工作了。 你总是要有很好的沟通能力, 确保大家知道你在做什么, 及早的发现你的错误。 在code review甚至是test 阶段被人发现问题对项目来说就是个灾难。

我期望面试者能够在这个阶段提出一些问题, 例如,有什么限制条件吗? 二叉树的value是什么类型? 这个api谁来使用, 内部的还是public的? 这个api更注重speed还是space?  我需要多线程吗? 如果面试者没问任何问题马上开始照着leetcode的signature开始coding, 甚至class 名字也叫solution(很多人), 我会觉得面试者做事的方式不够成熟。 可能以后工作中会很毛躁, 需要人来指导。

3. 无论你提出的建议是什么, 例如你说你觉得speed更重要, 我可能会说我更期待space. 这样做是避免陷入你最熟悉的套路。  假设我说, 我更需要序列化之后的空间占用最小。 这时候一般的候选人不会刷到这么深, 开始思考。 
如果候选人根本没有办法优化空间, 那我会认为他give up too early.  我希望候选人能安静的思考, 提出几种方案, 哪怕方案不成立。
如果候选人提出过多的方案, 没有问help, 这些方案也不工作, 我就认为候选人沟通有问题, 无法把握好度。

举个leetcode的例子来说明问题的深入, leetcode的序列化格式中, ‘,‘是必要的吗? ‘[’是必要的吗? 有没有办法用byte直接序列化? byte还能变长吗? base64是什么? zip会有帮助吗?

4. 候选人选定方案后, 我希望他能和我沟通, 看看是不是在有限时间内能够写完。 项目中, 很多时候谁都知道什么design是正确的, 什么是bad smell, 最聪明的人不是能做出最好design的, 而是在有限时间内能给出大家都能接受的solution的人。  如果空间优化非常好, 但是代码将超级复杂, 无法写完, 那么面试者应该及时和我交流。 我也会偶尔提醒一下这样能不能在40分钟内写完。 如果面试者坚持, 我不会坚持, 我会看他是不是能写完。 这就是either strong hire or fail.

5. 候选人可能这时候说太复杂了, 我们简化一下, 简化到他熟悉的, 刷过的coding.

6. coding 开始
到这一步, 如果你做了2,3,4,5中的大部分, 并且code看起来似乎是work的, 没有什么致命的问题,我不会纠结于比如正负数, nullpointer, int.min, coding是不是整洁一类的无聊问题。  一般就开始7. 如果你2,3,4,5都skip, 那么一般我就希望你bug free, 否则你没办法和其他候选者做比较。往往bug free又要求你code组织很好, 否则谁都很难一眼看出你有没有问题。

7. follow up
还有什么能改进的吗? 这是考察面试者的知识面, 也看你是不是耐心。 很多时候, 很多面试者做出题目高兴的得意忘形, 到这里就开始语无伦次的乱说, 这不会影响到是不是hire, 但是可能会影响是不是strong hire, 也可能影响到你的level.

举例子: 我觉得还需要写点java doc啊,unit test, regression test, performance tuning, benchmarking, A/B testing, 等等。

总结: 如果你能想到1-7中的所有点, 谁会在乎你是不是刷过这个题目? 即使你刷过这个题目, 我也十分确定你刷的比别人好很多, 你就是我心中想要的那个同事。 反之, 如果你只做到了6#, 但是别人做了1,2,3,4,5,6,7, 那你又怎么能面试成功呢?



前几天写了个关于面试官心理活动和侧重点的帖子, 见 谈谈面试官在面试coding题目时的考察终点与心理活动, 求大米, 首先感谢大家的捧场与大米, 也请大家原谅我的一些错别字与语无伦次(为了快速求大米写的粗糙了一点), 反应超出我的预期。  也让我有了动力接着写这一篇帖子。 
在上一篇帖子中提到了coding的一般步骤与考察点, 在开贴讨论design,behavior, culture fit前, 继续深入的讨论一下coding的考察范围, 也以此做为对一些同学, 特别是new grad的问题的统一回复。我就不排版和检查拼写了, 大家继续凑合读。

coding 种类与应对策略
大致上, 面试官在开始面试前, 会收到一封email, 里面回大致说明每个人需要侧重于考察面试者的哪个方面。 对于coding来说, 一般有三类问题, 每个面试官会被分配到一类问题。
1. solid coding
这类问题说白了, 谁都知道怎么做, 纯粹就是考察coding是不是扎实, 平时自己写code多不多, 能不能快速的把自己的idea转化为code。 对于面试者来说属于必考种类, new grad 一般会有两轮甚至三轮这样的题目, 有很多工作经验的人可能就只有1轮了。  这类题目不过关, 很可能电面死掉或者前几轮突然死亡。 
solid coding又一般可以分成两个小类:
1.1  考察你对算法的基本理解以及边界条件的运用, 比如findkth largest integer, search in rotate array, bit manipulation 等等。 
1.2 考察你对基本数据结构以及复杂度的理解。 比如binary search tree, linkedlist vs array, stack, tree dfs, tree bfs 等等。

按难度来分, easy的比如3 sum, tree level order iterator.  medium 难度的比如 reverse linked list from index m to index n, course schedule,string multiplication, hard 难度的比如valid number, 复杂的calculator等。

应对策略:
1.1 类型, 如果是简单和medium的没得说了, 就是希望你又快又好, 除了勤奋和熟练, 没有什么好策略。 对于像merge sort, partition这类的算法, 如果7-8分钟还写不出bug free我估计就没戏了。easy问题请多多注意边界条件, int 溢出, nullpointer, 负数, 非法输入等。  
hard 1.1的请参考1.3
1.2 类型, 简单和medium请在写代码前多阐明复杂度, 这类数据结构的问题往往也可以在coding前画图来表示运行状态, 图画的清楚也是个重要的加分项。 hard请参考1.3
1.3 hard类型的coding题目. 这往往是考察你的solid coding的能力, 即我在前文中提到的, 你做事的方式和你思考问题的方法。 即给你一个coding任务, 你如何从白板开始, 一步步的做出bug free的程序。 这类问题的过程重于结果。 比如valid number, 你能确保每实现一个模块, 都没有regressgion, 都没有bug, 比你一下子实现所有的feature但是有很多bug 要好很多。  一般来说面试官看你是否能够一步步的分隔出小的coding模块(method), 你如何设计test case, 你如何能够确保这些test case能cover所有的scenario, 你是不是和面试官提前做了足够的沟通并且限定了coding范围。   从这个角度来说, valid number其实是个很不错的solid coding面试题。  限于篇幅, 我就不展开来说了。

2. problem resolving
这类问题对于new grad是关键, 也是能帮你differentiate的关键。 说白了, 计算机并不是只有算法,我们还需要数据库, 操作系统, 网络, 安全等方面的知识。  new grad这些方面要弱一些, 所以面试者希望new grad能展现出思维敏捷, 多思考, 快速反应的能力。 problem resolving就为了考察这个能力而诞生的。 
problem resolving也可以分成四个小类型。
2.1  API design.  这类问题是为了更深入的考察你对数据结构的理解与运用。 例如LRU cache,  insert delete getRandom ALL O(1) , design twitter等等。 
2.2  Abstraction.  这类问题是考察你能不能把一个相对抽象的问题规约到你熟悉的问题上面。 比如skyline problem, int stream find median, cleaning robot等等。 
2.3 计算机小程序, 例如thread pool, 爬虫,日志merge等, random generator等。 
2.4 dynamic programming问题。 这类问题有点像solid problem resolving.  主要考察你是不是有systemmatic的方法来降低一个brute force程序的复杂度

这类问题一般都不是很easy的问题, 根据面试官心情, 可能走的很深很难。 也可能最后演变成bar raiser.

应对策略:
2.1  主要考察你对数据结构的深层次认识。  首先请同时确保你理解了题目的意思, 最好能问清点条件 例如immutable array max subarray sum, 那数组将来会变吗?问清这类的问题有助于你写代码前做好重构和测试的准备。 其次, 如果你能证明你选择的算法的复杂度, 甚至证明这就是最佳复杂度, 那是一个大大的加分项, 如果不能, 至少你也问问面试官是不是已经满意了再开始写代码。 
2.2  这个我自己也头疼, 说实话如果第一次遇见了skyline, 我也不知道能不能搞定。  大家有好办法请回复有什么好办法能系统化的解决这类的问题, 我个人觉得很多时候靠灵光一闪。 
2.3  这类问题主要看你平时积累, 也是一大类不能通过leetcode练习的问题。临时抱佛脚的话, 我个人推荐java concurrency in practice这本书。 
2.4  动态规划, 我不知道为什么很多人害怕动态规划。 面试中的动态规划大致分为单向递归(首或者尾), O(n2)或者O(n3) 距离递归,  O(mn)递归,有限定条件的NP (背包)。 每种类型听几节课, 懂了基本原理即可。 至于贪心和带状态的dp(走道铺砖)一类的dp, 至少我没在面试中遇到过, 因为很难临时造出一道这样的题目, 面试官一般也没这个能力和时间来思考题目是不是严谨。 贪心准备下加油站, 迪杰斯特拉, 最小生成树就足够了。

3. bar raiser
这类的问题只有当onsite应聘者的数量远远大于head count的时候, 或者你前几轮明显超出了电面时对你的定位才会发生。 其目的是帮助公司选择最优秀的人。 对应聘者来说, 坏消息是要度过痛苦一小时, 好消息是你能充分了解这公司厉害的人有多厉害, 能充分展示你的能力, 甚至被越级录取也不是不可能。 
bar raiser也是三小类。



较难的hard题,最好在彻底理解答案的基础上背题。面试官比较看重的是得到这个解法的过程。
我们来以skyline的表演为例,抛砖引玉一下~

题目要求的是建筑的剪影,可以抽象为每个固定横坐标上的最高点(划重点:提取问题核心)。因此这个解法可以分成两部分:
(1)如何把input转换为线性,从而抽象成扫描线问题(甩名词:sweep line) 
(2)扫描线的具体实现

第一部分,如果想要简单扫一遍,数据必须是按x轴排序的。假设我们 start_x 来对 building 排序,则end_x仍然是无序的,这样不好。(此时演技爆棚一拍脑袋想到)我们只需要知道skyline的线段是在哪里开始的,因此在building高度发生变化的X位置进行处理即可。building的开始和结束都算是高度变化,因此可以把 start 和 end 拆开处理,只需要标记 X 位置上的高度数据以及这个高度是开始还是结束。

至于每个X位置数据的具体结构,可以用一个tuple(int h 高度,bool start 表示是开始还是结束),也可以像高票解法一样用正数代表开始、负数代表结束。可以和面试官阐明。

第二部分,主要是如何维持一个高度的queue。
阐明在扫描过程中需要三个操作,插入(遇到start),删除(遇到end),获取最大值(高度更新),因此可能有:
1. 因为要取最大值嘛,所以很明显我们试试heap,插入O(logn),max O(1),但是删除是O(n),不太好,我们试试别的;
2. balanced bst (c++ ordered map以及java treemap),全场O(logn),通通O(logn);
3. 有没有可能优化方法1呢?可以用 hashmap + heap的方式来实现,O(logn) insert, O(logn) remove, O(1) get_max。

第一部分稍微举例说明了一下如何展示思路。
第二部分我认为是装逼重点。能写方法3,就先列出1和2,指出他们的不足,然后提出3。如果懒得实现3,先提出1,再提出2,指出红黑树的时间优于heap,在面试官看来也是对数据结构足够熟练的应用了。

最后记得提出edge case,比如两个building高度相同怎么办(假装思考一下)如果先push start,再pop end,就不会有高度变化的问题了嘛,所以我们重写compare函数的时候注意一下就行了。

以上整个过程,在表演不崩的情况下用5-8分钟来解释,我认为都是可以的。

两年没刷题了,具体细节可能记得不太清楚。最近刚开始当面试官,在演技方面给大家举个栗子🌰。对于这种candidate,即使对方可能是在表演,如果能够把问题肢解得这么清楚、把多种实现细节的trade-off分析得这么明白,我也会给一个pass的。
(皮完就跑 #滑稽#

补充内容 (2018-7-29 05:14):
解释思路的时间扩展到10+分钟应该也可以吧,诸位要不要试试mock一下计个时?我们统计一下(笑)
总之只要思路连贯,有理有据令人信服,就不会演崩。但一定要有develop思路的过程,这也能体现对解法的充分理解



写一点刷题感想

前前后后刷题也一年了,很多感想。所以想总结出来。我也不知道自己说的对不对,所以正好和大家交流,相互学习。

最核心的三条:
1. 想刷的好没别的,唯手熟尔。
刷题跟高考数学本质一模一样。想想过去高中三年啥事儿都不做,天天做卷子,看到题就大概知道怎么做。而如今因为生活忙碌,各种事情distraction,导致刷题可能变得时间不够。再看看leetcode contest那些20分钟做完四道题的牛人,很多都是有ACM竞赛背景的。当然或许他们的确天资过人,但我更相信他们是从小开始训练coding,见多识广,经验丰富,submission上万遍,付出无数努力才能维持如此高的应试水平的。

另外,对于所有leetcode mediun题甚至一些hard题,也是要求你在半个小时甚至更短时间内做出来,不是要你花几个月几年时间做调研写报告或者做research探究人类未知,所以内容本身应该是很简洁的一个小问题(当然简洁不代表简单)。所以刷不出来?why?就一句话:刷少了。知识点不够熟,或者XX算法没见过,或者这种题型很陌生。不会的东西都可以在网上找到答案/资料/训练,而不像做research你面对的是unknown的东西需要花费巨大精力去不断尝试和研究;所以不会的就学习,缺少的就补课,每学一点,就进步一点。非常公平。

所以主要还是自己努力的不够。这是我最大的感受。

2. 最好做到不间断。
上面说的是刷题本质,回答的是what的问题。现在说一下how的问题。
我的一个感想就是,从应试记忆的角度来说,一定要不间断的刷题,时刻保持手感。中间如果停掉一个月或者几个月,再pickup起来的成本就会很大。这也是我自己的一个重大教训,我自己毅力不够。往往别的事情一忙碌,就彻底把刷题抛在脑后了。过了一个月再回来狂刷。但我慢慢发现这个方式并不好,那些刷题很牛的人,他们一定是细水长流的,每天刷,哪怕每天只submit一次也可以。

当然说的容易,做起来难。就是毅力。

3. 不停的总结套路+题型。。
如果说刷题有啥技巧,最核心的我觉得就是要不停的总结套路和题型。当然还没刷到200题的就不要care这个,先把量做到足够多才有必要总结。还是那个古老的规律:好记性不如烂笔头。之前说了,刷题本质就是努力,而努力的核心就是不停刷;如何高效的不停刷呢?就是做总结笔记。而且一定是参考其他人笔记后,做出的最适合自己的那个笔记,宛如自己的指纹,全世界独一份属于你的。比如,DFS/BFS画个图写个pseudo code总结下。然后有的题为啥BFS比DFS强?拿一个题做例子总结一下。有的题是DFS/BFS+union find;有的题是DFS/BFS+DP,分别总结下。backtracking里各种subset,permutation,combination总结一下看看他们的区别。Comparator怎么写?忘记了?赶紧总结个模板。类似的,2D array/priorityqueue如何sort? 。。。
不管任何大模板,还是小细节,都要做笔记。不管你用evernote,github,gitbook还是什么别的。

除了少数技巧特殊的题目,其他所有题目一定掌握核心灵魂,而不是死记硬背。我过去就犯过这种错误。已经两个月没刷题了,突然来个面试,慌了,所以赶紧把code背一背寄希望碰到原题。最后面试的时候一塌糊涂。而我那时候还没有很认真的做总结。所以有一份刷题总结在手,作为面试前复习的精华,就不怕任何突如其来的面试了。
所以刷来刷去,刷出来的就是套路。如何掌握这些套路?努力呗。

另外还两小点。
第一就是我觉得现在题型核心就是DFS/BFS/Tree/Backtracking/UF以及延伸出的一些东西,这些都是一条绳上的蚂蚱(说的不对请指正)。当然还有一个点就是DP。 但是过于难的DP实在是想不出来。所以我不知道DP这个东西也是可以通过不停努力掌握的吗?
第二就是,面试的时候和leetcode刷题还是很不同的。lc刷习惯了会产生对那种环境的依赖感。而实际面试可能要你自己写main function;或者白板面试。这些都是要额外训练的。

原文地址:https://www.cnblogs.com/shawshawwan/p/9498910.html

时间: 2024-08-26 00:01:47

刷题方法论的相关文章

用js刷题的一些坑

leecode可以用js刷题了,我大js越来越被认可了是吧.但是刷题中会因为忽略js的一些特性掉入坑里.我这里总结一下我掉过的坑. 坑1:js中数组对象是引用对象 js中除了object还有数组对象也是引用对象,这点常常被忽视,所以在递归的时候传递数组要用arr.slice(0)这样复制一个一样的新数组,不然会出现你传入的数组会被同级的递归改变,结果就不对了. 所以只要数组复制的地方最好都要这么写,除非你真的想引用.而且注意是slice不是splice这两个方法差别很大,你如果用splice(0

LeetCode刷题之一:寻找只出现一次的数字

投简历的时候看到了个刷题网站,http://www.nowcoder.com/527604,就做了一套题,现记录下来. 题目为: Given an array of integers, every element appears twice except for one. Find that single one. Note: Your algorithm should have a linear runtime complexity. Could you implement it withou

【leetcode刷题笔记】Sum Root to Leaf Numbers

Given a binary tree containing digits from 0-9 only, each root-to-leaf path could represent a number. An example is the root-to-leaf path 1->2->3 which represents the number 123. Find the total sum of all root-to-leaf numbers. For example, 1 / 2 3 T

BZOJ第一页刷题计划

BZOJ第一页刷题计划 已完成:1 / 100 BZOJ1000:A+B

刷题记录

刷题啦,刷题啦,咱也刷算法题. 先从牛客网的JS方面刷起,接着刷数据结构和算法,然后去刷leetcode,这儿记载自己从出错的地方. 1.题目描述 移除数组 arr 中的所有值与 item 相等的元素,直接在给定的 arr 数组上进行操作,并将结果返回 . 没有认真思考,写下了如下的答案 function removeWithoutCopy(arr, item) { for(i = 0; i < arr.length; i++) { if( arr[i] === item) { arr.spli

停课刷题总结-给自己一点鼓励吧

嗯,我已经停了四五天课在家刷BZOJ准备复赛了,感觉压力好大.但是,实际上感觉效率并不高,每天就是7-8题的样子,而且并不是每题都有质量.而且这几天刷下来,我貌似因为刷了太多水题的关系,打字写题的速度变慢了,有一点悠闲没有紧迫感了,要赶快把这个习惯给改掉!今天去学校做题被虐了,竟然一个简单的Hash没有调对[虽然我现在还是不知道为什么会死循环QAQ.]感觉吧,可能因为刷题有点不在状态了.[其实也因为刷题的间隙玩了几盘LOL,游戏这东西QAQ]被虐了,感觉很不爽,有点难受,毕竟我付出了那么多努力,

leetcode 刷题之路 63 Binary Tree Zigzag Level Order Traversal

Given a binary tree, return the zigzag level order traversal of its nodes' values. (ie, from left to right, then right to left for the next level and alternate between). For example: Given binary tree {3,9,20,#,#,15,7}, 3 / 9 20 / 15 7 return its zig

leetcode 刷题之路 64 Construct Binary Tree from Inorder and Postorder Traversal

Given inorder and postorder traversal of a tree, construct the binary tree. Note: You may assume that duplicates do not exist in the tree. 给出二叉树的中序遍历和后序遍历结果,恢复出二叉树. 后序遍历序列的最后一个元素值是二叉树的根节点的值,查找该元素在中序遍历序列中的位置mid,根据中序遍历和后序遍历性质,有: 位置mid以前的序列部分为二叉树根节点左子树中

半个暑假的刷题有感

这半个多月一来,主要是在刷DP.开始是一些简单的DP(可是我没有感觉有多简单=_=!!),然后是最大连续子序列,最大公共子序列,最大子矩阵等等,这些题目还好,有的题目甚至可以模板化. 还有一些没有解决的难题: 1024 Max Sum Plus Plus 最大m段不重叠子段和](可不连续)1244 Max Sum Plus Plus Plus [最大m段不重叠子段和](连续) 1074 Doing Homework [压缩dp](这个题整个程序都在用位运算,让我这个小白情何以堪啊) 还有记忆化搜