零基础三个月转行数据岗-我如何进入顶尖咨询公司做数据科学家
“ 现在在网上自学data science的方式很多,但如果短时间内跳槽的话,Techie的优势非常明显:更加有面试导向性。不仅是帮我们系统梳理知识,而是更会告诉我们对于某个知识点,具体面试可能会怎么问,follow up可能会怎么问,等等。押题非常准。”
我是陈麟,本科学的是化学专业,从毕业到工作都是从事化学方面的工作,没有任何data背景。去年年初决定转行,五月参加了Techie的数据科学集训营,八月拿到了Accenture offer,九月入职。在这里我和大家分享一下我的求职时间线以及面试备考、实战的一些经验,和大家共勉。
1. 前期准备
我现在在西雅图,没有什么化学方面的工作职位,所以有了转行Data岗的念头。主观原因还是因为我自己对data感兴趣,喜欢挖掘数据分析数据。挑战主要是在我几乎没有coding背景,并且我是做化学实验的,也不像理论或者化学工程可能会积累一些相关知识。这些都是我需要短时间弥补的弱点。
现在在网上自学data science的方式很多,但如果短时间内跳槽的话,Techie的优势非常明显:更加有面试导向性。不仅是帮我们系统梳理知识,而是更会告诉我们对于某个知识点,具体面试可能会怎么问,follow up可能会怎么问,等等。押题非常准。
举个简单的例子:有个关于ABtesting的知识点,在Techie数据集训营上就有一张表格总结了当sample size大和小的时候,population variance知道或者不知道的时候,都分别怎么去做AB test。后来我上完课没多久就遇到了一个面试的第二轮,刚好就和这个有关。我就结合了课上的summary把这个问题回答了出来,让面试官非常满意。
现在开始!
免费试听数据科学集训营,首节2小时精华内容
内容包括:数据科学各岗位面试真题讲解,在线广告系统 20道follow-ups常考题,线性回归Linear Regression模型考点,...
现在开始试听2. 面试规划 & 备考安排
关于data方面的面试备考,大家能做的事情大体都差不多,不过有几点我觉得非常重要:
第一,根据自己的逻辑和习惯,把老师说过的东西做个梳理和总结。比如说Random Forest的优缺点是什么,原理是什么。Deep Learning的优缺点是什么,等等。
第二,由于面试官问问题都是随机的,这要求你对知识点的掌握非常熟练。需要在高压的环境下做出最好的表现。我当时的做法是把所有知识点都打印出来,让家属随便挑问题考我。虽然我以为自己已经倒背如流了,却在真正回答问题的时候磕磕巴巴。并且家属在问我问题的时候可能会好奇追问我一下,这就是很常见的面经问题:用最简单朴实的语言介绍一个专业术语或者概念,比如说p-value。这个过程可以帮助我们更透彻地理解问题。
最后,你在面试的过程中可以将所有的题目都列个文件存进去。这样当你收集了足够面试问题之后,你就有个更清晰的框架知道自己应该掌握什么知识,有哪些地方是欠缺的。有时你也不知道面试的正确答案是什么,可能面试官也不知道,这个时候Techie的面经论坛就是一个很好的资源分享平台,大家可以上去看看别人讨论的内容,也可以分享自己的看法。
3. 面试流程 & 心得体会
数据科学岗位的面试流程大家都有所了解。先是HR联系,然后Hiring Manager联系,不会太techinical,主要问你背景和项目经验,判断你对业务是否熟悉,是不是他们要找的人。然后会有一个组员来面试你的technical。我遇到过的面试有两种,第一种是自己有个问题清单,一道一道问你,比如说gradient descent是什么,reinforment learning是什么, 等等。还有一种情况是根据你的简历,深入地问你项目细节,并且follow up,等等。
关于OA,Accenture没有给我OA,但是我也做过别的公司的OA,这个我个人觉得是最难练习也是最难控制和准备的。因为你不知道给你的data长什么样,也不知道公司想要考察你的点是什么,没有什么标准答案,可能他们也不一定在看你答案对不对,而是看你分析的是否合理,结论是否make sense。
最后就是onsite,会让你做presentation。一般能让你进到这一轮的话,你的technical和OA都应该不会有什么大的问题,至于onsite会问你更多techinical还是behavior questions,则是因人&公司而异,咨询公司更喜欢问behavioral questions,以及如何平衡团队和客户需求等等。
我也面试过一些其他科技公司,retail公司等等。就Data Scientist而言,technical方面的区别并不是很大。区别可能是behavior questions,毕竟作为consultant,面向客户,肯定和in house的数据科学家不一样,你要确定你的是否适合这个工作。
我们作为咨询公司的Data Scientist的日常也是一直和数据打交道,包括要和客户沟通,把技术和知识转移给客户。很多时候客户自己也不清楚自己的需求,这个时候你作为咨询师你就需要引导客户把问题提明白。问题提明白了,那么问题也就解决了大半了。
4. 数据岗面试中的Coding题
DS的coding面试有两种:一种是和日常工作联系非常紧密的,比如说sql和python如何转换,还有就是字符串的处理,也就是data preposseing。比如说有些logs有很多空格,需要进行匹配。另一方面就是数据结构和算法相关,和SDE很相似。关于这部分的备考,我也建议同学从基础做起。从Leetcode的easy或者大公司的medium开始。
Techie网站上也有coding相关的内容的免费文章,包括youtube上也有Techie史强老师给大家说了五段关于binary search相关的内容,希望可以给大家带来帮助。
5. 简历项目
如果你不是PHD,简历最好不要超过一页。如果是没有工作经验,写3-4个项目,如果有工作经验,写一两个工作经验,再写一两个项目就可以了。
项目一定要是hot topic,一定是大家都可能会用的。因为你一定会投很多简历,你的项目最好就比较general,比如说任何互联网公司可能会有商品推荐(recommendation system)、user targeting。或者NLP对应customer service,AI chatbox。或者有些fraud detection,等等。要是你现在没有项目的话,尽量往这些领域去挑选项目,这样投资回报会高一些。不需要写太多个项目,而是把一个项目写的细致一点。
我觉得自己还是比较幸运的,在转行的路上很早就参加了Techie数据科学课,老师们很认真负责,课后答疑和简历修改都特别及时,让我少走了很多弯路,很感谢老师们的辛勤工作。未来我也会继续关注Techie的学员活动,与老师和同学们一起不断进步。
祝同学们都能拿到满意的offer!实现自己的职业发展目标!