加入免费会员

转方向求职 - 我拿到了Expedia Data Scientist Offer

 

Video Poster Image

“ 我面试中问到的东西有90%以上都是Techie课上讲过的问题。比如说当我们在某个应用场景想要用某个test的时候,面试官会根据你的选择继续深入讨论为什么要用这个test,这个test和别的test的区别在哪里等等。这些都是Techie在数据科学集训营中归纳总结过的知识,平时同学们在Techie论坛上讨论时也有涵盖到。

我是毕业于University of Washington Biostatistics专业的Sixuan。毕业后我先在一个小公司工作,对于实验设计(experiment test)、产品等相关的知识比较薄弱。从2022年二月开始转方向换工作,五月份拿到了Expedia Data Scientist offer,六月份入职。今天应Techie 汪淼老师的邀请,来和大家分享一下我的整个换工作求职的经历。

 

1. 转方向求职的挑战

 

在现在这个信息爆炸的时代,形形色色的备考资源非常多,并且每个人都可以根据自己经验推荐各式各样学习材料。我身边也有很多一起备考的朋友,大家一个共性问题就是:时间非常有限,知识体系零散,没有方向感。我觉得面对海量知识点,将无序的知识转化为有序的思维导图十分重要,这也方便自己理解和消化。对于曾经遇到过的面试问题,我会结合网上搜索到的面经和Techie论坛上同学们关于面试问题、工作学习问题的讨论,可以迅速将那些问题所对应的知识点联系在一起,加到自己的思维导图中,这样可以很快根据面试官的问题联系到他们想要问的知识点。最重要的是,Techie数据科学集训营,导师们将这些资源都已经筛选好了,大大节省了同学们的时间。

 

2. 面试流程和准备经验

 

现在行业中的数据科学面试主要分为两个方向:侧重深度学习、算法、coding的Machine Learning Scientist和传统的侧重于实验设计、产品、基础机器学习的Data Scientist。面试前尽可能获取足够多的信息非常重要, 多问问recruiter对于接下来面试要考察的主要方向。也可以从Job Description或者reach out公司现员工等角度入手,收集更多这个工作岗位平时的工作性质和内容。

我面试中问到的东西有90%以上都是课上讲过的问题。比如说当我们在某个应用场景想要用某个test的时候,面试官会根据你的选择继续深入讨论为什么要用这个test,这个test和别的test的区别在哪里等等。这些都是Techie在数据科学集训营中归纳总结过的知识,平时同学们在Techie论坛上讨论时也有涵盖到。

面试结束后,及时的复盘和总结是不可或缺的一部分。有的时候也难免面试官会问到自己的知识盲区,这都是非常正常的事情。如果遇到这种情况,我会先尽量去回答一些自己的知道的内容。如果在后面的面试中聊得还不错的话,可以在问问题的环节以一种轻松的方式问问面试官对这个问题的看法,这样可以学习到如果在真正的工作场景上应该怎么解决这样的问题,并且补充到自己的思维导图中。

现在开始!

免费试听数据科学集训营,首节2小时精华内容

内容包括:数据科学各岗位面试真题讲解,在线广告系统 20道follow-ups常考题,线性回归Linear Regression模型考点,...

现在开始试听

3. 数据科学面试侧重点

 

OA(Take-home)

OA或者Take-home的特点就是时间有限,所以需要尽可能多地节省前期数据处理时间,将时间留到重要的分析和提供insights的部分,要记住:代码没有传递的信息重要!

Techie数据科学课上的项目提供了一个非常好的解决问题的模板,同学们可以根据自己的需求扩充和修改,这样就可以在数据处理、explorative analysis的过程直接复用,省去很多查阅documentation的时间。

OA/take home 的presentation Q&A是相对而言比较难准备的一部分。因为面试官的followup question比较难以预测,有时候是基于analysis结果,有时候不仅基于analysis,并且可以结合到真正工作内容去考察面试人临场解决问题的能力。在这种情况下,建议是和面试官需要建立良好的communication,先从自己知道的东西说起,再慢慢延伸,多观察面试官的反应和feedback。

 

机器学习:

机器学习的考察经常是以case study的方式出现,比如说给你一个具体场景,问你模型选择相关的问题,然后会根据谈话的深入,考察到data preprosessing, feature engineering, standardization, scaling等等。当选择了一个或者多个模型框架之后,会继续讨论选择模型的原因,各个模型的优劣,和其他模型比较的tradeoff等。最后,会涉及到如何evaluete model performance,如何在realtime上保证模型的flow。这一块知识需要同学们对机器学习的各个流程的环节以及相应的细节有足够深的了解。

 

Coding

如果是算法coding,Leetcode是个比较不错的刷题选择,出现原题的概率也比较高。Techie编程算法集训营里也针对常考高频算法题为大家做了归类整理。

而SQL coding则有些不同,SQL考察特点就是每次面试时题目会相对较多,并且经常是后一个问题基于前一个问题的结果。SQL不建议leetcode,因为行业中SQL面试经常是和case相结合,让同学们去解决一个问题。这个过程中,和面试官保持沟通是非常重要的,比如说自己对table结构的理解是否正确,确定要遇到什么table output等。

 

AB Test 和Probability

由于面试岗位是数据科学,面试官一般会对AB test的expectation比较高。比如说会结合具体的商业案例,要求面试人将AB test的流程从头到尾说一遍。每个环节和整个流程的设计,再问一些follow up的问题比如说不同test的区别,如何sample,如何解决network effect等等。在Probability方面的考察则会更straightforward一些,会直接考察题目。

Techie的youtube官网会经常不定期发送一些求职面试干货,我觉得内容很不错,对面试的帮助很大。在Techie面经论坛上,也经常会有同学们相互交流面试心得,及时补充相关的知识和经验。推荐大家有时间的时候看一下。

面试题问答社区

Techie面经论坛

汇聚数据科学家、软件工程师最新面经, 硅谷一线大厂面试官每天亲自为你答疑解惑。

免费加入Techie面经论坛

4. 给同学们的一些建议

 

对于简历的考察和修改:一般hiring manager会问简历。根据他们的偏好不同,简历问题也会侧重不同方向。比较偏向Techinical的会问模型理论知识,再问一问遇到challenge该怎么办。偏business的方向会问stakeholder是谁,平时是如何和他们合作的,如何和缺少technical背景的人解释一些concept等等。建议同学们在自己的工作过程中,每次结束一个主要项目的时候将项目内容记录一下,总结自己做了什么contribution并且具体化、量化自己的impact。这在今后修改简历的时候可以用到。

关于时间分配:不需要等待自己ready再去面试,毕竟是没有一个真正ready的概念的。我们只需要保证自己的头脑对于那些知识点是比较active的状况下去面试,在面试过程中不断补充自己的知识盲区,一边学习一边面试,及时总结整理面试经验,这样才会短时间有更大的提高。

最后我想分享给大家的是,面试心态调整真的非常重要。在面试的过程中,很多东西是不受自己控制的。但是心态要放平,尝试去了解多个不同公司。只有放平心态才能和面试官合作和交流。想象成和一个比自己经验更多的team mate去沟通讨论一个问题,仔细了解问题动机,说自己的想法,并且根据对方的反馈及时调整自己的思路,用一种合作的方式解决问题。心态放平的时候面试表现会更从容,可能会有意向不到效果。

希望这次的分享能给同学们一些帮助,期待未来在Techie微信群和问答论坛上继续与大家交流,共同进步。