2022, Data Scientist!

Posted by Masutangu on December 31, 2021

很久之前看过乔布斯在斯坦福大学的演讲,关于他人生中的三个故事。其中第一个故事,串联生命中的点点滴滴,给我留下很深刻的印象。

乔布斯因为看不到大学的价值而做出了退学的决定,不用再上那些他并不感兴趣的必修课,而是选修了他自己觉得更有趣的课程,比如美术字课。虽然那时他觉得并不会有什么实际应用,但最终在设计第一台 Macintosh 电脑的时候,他把当初美术字课程里学到的字体设计进了 Mac,也是第一台使用了漂亮印刷字体的电脑。

当回顾过去,乔布斯发现,如果他当时没有退学, 就不会有机会去选修自己更感兴趣的美术字课程, Mac 就不会有这么多丰富的字体,以及赏心悦目的字体间距。当他在大学的时候,还不可能把从前的点点滴滴串连起来,但是当十年后回顾这一切的时候,一切豁然开朗了。

没有人可以预测未来,只有当你回头看,才发现过去的点滴是可以串联起来的。今天我也想分享一下自己的经历。

早在我还在读本科的时候,我曾经怀抱着科研的梦想,因为我觉得自己非常适合做科研,很喜欢探索未知的领域,也享受从未知到了解到深入这个过程带来的成就感。大三的时候也到研究所实习过半年,积攒了一些读论文做研究的经验。可惜研究所的这段经历和我的期望不是特别契合,最终我在研究所的这段实习没有成功发 paper,感觉没什么底气申请香港的 Mphil,最后选择读了 MSc,毕业后走上业务开发的道路,就此告别了科研梦。

在毕业刚进公司不久,接到要做个性化推荐的需求。我那时冲劲十足,以做研究的心态,查阅了很多资料和书籍,从基础开始,每天都在学习,做笔记。而最终这个需求并没有做好,因为我太偏重理论的学习,忽视了在实践中去运用,没有及时进行工程迭代,进展自然也不如预期。最终推荐交给了专门做推荐的组去做,这也是我后来觉得非常遗憾的一件事情。

在做业务开发,有一度最让我觉得迷茫的是,工作中大部分是 CRUD,负载均衡、容灾等后台基本能力也是老生常谈,这让我不得不经常思考,我自己的核心竞争力在哪里?有哪些是我能比别人更擅长做的?我需要去挖掘这样的东西。于是我开始把后台知识进行归类,拆分成存储/网络/分布式系统等,然后逐个开始深入学习。特别是分布式系统,花了很多心思在上面,通过学习分布式系统,我提炼了涉足新领域时适用于自己的方法论。虽然学的东西在工作中真正能落地的机会并不多,但显著提升了自己思考的深度和广度。更重要的是,在学习的过程中,我需要不断去修正我的学习方法,比如,工作日只有零碎的时间,周末则需要兼顾学习和休息,哪类知识采用哪种学习方式更适合我更有效率?又例如,学的知识如果没有太多实践机会,就很容易忘记,如何加深记忆?哪些工具可以帮助我更好的整理汇总学过的知识?这些都需要自己不断去探索和总结。

最近几年 AI 大火,AlphaGo 的横空出世让很多人开始真正关注到 AI,也包括我。年初我也计划在收尾分布式学习以及个人 wiki 搭建后开展 AI 的学习,这也在我年初 Hello 2021 里提到的“新方向的学习”。在年初到年中我陆陆续续看了一些 AI 的资料,结合自己之前入坑分布式的经验,整理了一个适合自己的 AI 入门路线,然后就轰轰烈烈的开始了。年中的时候我加入了新部门,需要做一个新人分享,想着 push 自己一把,所以我把分享主题定为 AlphaGo。在做分享前赶着看完了 Introduction to Reinforcement Learning with David Silver 的课程,读了 AlphaGo 的论文,做了两份 PPT,最终算是把 RL 的基础理论和 AlphaGo 的原理整明白了,也给同事们做了分享。

然后,幸运的是,我有了参与 AI 项目的机会。这一次,有大佬带队主导方向,而我作为 AI 小白,吸取了刚毕业时参与推荐需求的失败教训,重新整理了自己的计划表,理论 + 实践并行走,且前期更注重实践,一定要尽快动手实践走上正轨,在不断迭代的过程中再逐步补充相关理论知识。于是我花了两周闲暇时间快速看完李沐的 动手学深度学习 课程中的大部分内容,感谢李沐大佬这门课,给了我极大帮助,让我能够更快速的参与到开发之中。从前期做做小功能,到开发稍微复杂的特性,熟悉整体框架和算法网络以及参与调优,到逐渐可以和大佬有方向性的请教讨论。虽然目前依然是初级新手,但能明显体会到,从项目出发,着手实践,带着目标去弥补理论知识,这是和自学完全不一样的路线,这条路更有效率。

回顾过去,过往的失败积累了宝贵的经验,过往的迷茫促使了自己去探索学习,沉淀了适合自己的学习方法,帮助自己更快上手新领域,过往的研究所实习,虽然没有发成 paper,但如今面对论文还能找回一些熟悉的感觉。曾经的科研梦想,兜兜转转又回到了眼前,有点不可思议。既平衡了工作和个人学习,又能结合学术研究和工程落地,这正是我所憧憬的理想工作。对于未来的挑战和机遇,我非常期待。

这一年,感恩机遇,感谢同事们的指导和信任,感谢所有像李沐大佬一样无私分享知识,帮助他人的人,感谢自己一直以来的努力和坚持,2022 年,我想成为一名合格的数据科学家,并朝着机器学习专家前进。路漫漫其修远兮,吾将上下而求索!