03/08/2022
返回所有文章
从事数据科学职业需要哪些技能和背景呢?
任何定量学科的学士或硕士学位都是数据科学职业的一个良好起点。大多数相关学科都可以,包括计算机科学、数学、物理学和统计学。然而,如果你学过其他东西也不会排除你进军数据科学领域的可能性。
Fyte旗下Forecast的分析主管Ali Hussnain和Paul van Loon更详细地讨论了进入数据科学领域所需的教育背景。
数据科学的生命周期
数据科学的概念相对较新:数据科学家的定义(2008年提出,2012年普及)仍在不断发展。现在,数据科学涉及一整套任务,你可能已经在获得学位的路上完成了。
根据伯克利信息学院的说法,数据科学的生命周期有五个阶段。
- 数据科学家通过一种或多种方式获取数据——主动创造新数据、获取组织产生的现有数据或接收设备创造的数据。
- 这一阶段主要是关于数据的整合和预处理,而还没有从中获得商业价值。其目的是事先准备你的数据以便下一阶段的整合与应用。维护任务包括数据储存、数据清洗和数据的提取-转换-加载(ETL)过程,在这些过程中会出现数据分期。
- 接下来是数据挖掘(发现数据集中的模式)的阶段。可以采用各种各样的方法,无论是简单的总结还是更高级的方法,如聚类和分类。
- 在这个阶段,人们使用定量和定性分析从数据集中提取内部信息。任务范围从探索性数据分析(EDA)和确认性分析到回归和预测性建模。在客户评论或法律文件分析方面,文本分析和自然语言处理(NLP)也变得越来越流行。
- 最后,你将结果提供给利益相关者。这包括数据报告和可视化,通常还有一些商业情报和商业影响分析,以告知决策者。
STEM(科学、技术、工程学、数学)和统计学背景
现在你对数据科学家的日常任务有了基本的了解,可以清楚地看到,STEM学科可以帮助你启动你的职业生涯。但你需要深入了解数学和统计学,需要扎实的编程基础,还需要全面的数据收集、数据清理、数据分析和数据报告。处理不同数据集的实践经验肯定会有帮助。外面有大量的书本和在线课程供你一路学习。
什么样的数据科学家是有需求的?首先,让我们看看与数据相关的各种职业类型。高端人才招聘专家认为:不仅仅是数据科学家,还有商业分析师、数据开发人员和数据工程师。每个工作系列所需的技能和知识都不一样。
De Mauro等人的一篇会议论文(‘Beyond Data Scientists, a Review of Big Data Skills and Job Families’, 2016《超越数据科学家,大数据技能和职业系谱的回顾》)分析了网上发布的大量工作岗位,并对在数据行业发展所需的技能做了一些说明。例如,商业分析师更倾向于商业方面,通常具备有效的沟通技巧和财务头脑,能够对业务转型产生真正的影响。
数据科学家的核心能力
然而,在你作为数据科学家的职业道路上,你的各项技能的重点必须是分析方法和将数据转化为实际见解的能力。作为一名数据科学家,你需要熟练使用数据库,并善于从云端与本地数据库中查询或提取数据。
作为一名数据科学家,你还需要利用手头的数据去识别数据模式、提取信息、设计和实施模型的描述性或预测性目的,并兼顾业务背景。因此,必须对统计学有着扎实的理解,你还需要一些编程技巧,以便用R、Python或其他语言实现你的模型。
数据科学家还寻求不断地改进指标和统计模型,并将研究和学习作为该过程的一部分。科学家"的心态有助于通过试验和错误积累专业知识。