独家 | 探秘全栈数据科学家
作者:Kelvin Lu
翻译:陈之炎
校对:赵茹萱
本文约4300字,建议阅读9分钟 本文介绍了作者对于“全栈数据科学家”的一些见解。
定义全栈数据科学家
-
面向工程,与纯粹面向研究的数据科学家角色不同。 -
具备一定的数据工程技能,能够独立处理大数据和传统的关系数据源。 -
了解MLOps实践,可以在生产过程中执行模型训练和部署。
反例
字里行间
-
产品所有者 -
项目经理 -
业务分析师 -
架构师 -
开发人员 -
测试人员
-
对预算、质量和时间表有没有清晰地认识? -
是否有能力基于业务价值来驱动需求定义? -
是否认为将人为错误造成的问题最小化非常重要? -
是否会自动执行重复性的例程? -
是否优先考虑模型性能或系统稳定性?
古老的智慧
没有灵丹妙药
-
教育:未来的数据科学家需要具备工程思维模式,而不仅仅是学术数据科学知识。 -
科研:需要开发新的理论来指导从业者处理机器学习应用的不确定性。例如,在时间序列分析中使用ARIMA或Prophet非常常见,对吧?如何有效地预测超过5万个时间序列?你能从这么多的时间序列中发现因果关系吗? -
工具:当被问及何时停止调整深度学习模型时,导师说:当你钱花完了或弹尽力竭时停止,这可能会带来不便,但谁知道呢?或许当时人们还认为用黑曜石制造武器是唯一的选择。所以,不要说永远不会发生。这是当前如何进行机器学习实践的一个例子,需要更多新的工具来提高生产力。
结论
Full-Stack Data Scientist?
译者简介
陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织
评论