您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

如何成为一名数据科学家?

发表于:2019-05-13 作者:Alison DeNisco Rayome 来源:企业网D1Net

如果人们对数据科学的职业感兴趣,那么需要了解数据科学家的薪酬、热门的就业市场、技术培训等方面的有关信息。

如今,企业对数据科学家的需求量很大。数据科学家在Glassdoor公司发布的美国最佳工作排行榜连续4年名列榜首,并且表示拥有适当技能的数据科学家薪酬很高。2012年,《哈佛商业评论》表示数据科学家是“21世纪最好的工作”之一。

如何成为一名数据科学家?


Glassdoor公司社区专家表示:“对数据科学家的需求旺盛的一个重要原因是,很多企业都致力成为一家科技公司。在必须处理数字化数据、拥有应用程序或在线状态的行业中,都需要能够帮助支持所有这些数据并从数据中找到见解的专业人员。”

然而,现在面临数据科学专业人才短缺的情况:据IBM公司预测,到2020年,美国所有精通数据的专业人士的每年职位空缺数量将增加到270万个。人才招募机构LinkedIn公司的数据显示,截至2019年1月,具有数据科学技能的人在美国的平均年薪为130,000美元,比上一年增加56%。

为了帮助那些对数据科学领域感兴趣的专业人员更好地了解如何进入数据科学的职业生涯,在此创建了一个包含最重要细节和资源的指南。

执行摘要

  1. 为什么对数据科学家的需求日益增加?很多公司现在都有能力收集数据,并且数据量越来越大。这导致对具有特定技能的员工的更高需求,他们可以有效地组织和分析这些数据,以收集业务见解。
  2. 数据科学家的工作角色有哪些?核心数据科学家、研究人员和大数据专家是数据科学领域的顶级职位。
  3. 成为数据科学家需要哪些技能?Glassdoor公司表示,掌握Python、R、SQL语言是数据科学工作列表中的三大技能。Glassdoor公司指出,每10个数据科学职位发布中就有9个需要掌握至少一种语言。
  4. 哪些行业拥有数据科学家最热门的市场?预计数据科学家的需求将在未来几年增长。据IBM公司称,目前约有59%的数据科学和分析工作需求来自金融和保险、专业服务和IT行业。
  5. 数据科学家的平均薪酬是多少?据LinkedIn公司称,截至2019年1月,美国的数据科学家平均年薪为130,000美元。Glassdoor公司的调查表明,其平均年薪为108,000美元。其薪酬因地而异,旧金山、圣何塞、西雅图和纽约市的数据科学家薪酬最高。
  6. 数据科学工作的典型面试问题是什么?其问题可能包括让面试人员了解应聘者曾经做过的项目,描述其与团队合作的经历,以及与领导沟通的情况,并完成面试人员进行的测试。
  7. 在哪里可以找到数据科学职业的资源?美国数据科学协会、运筹学和管理科学研究所以及国际分析研究所是这样的国家组织和国际组织,行业人士可以在那里查找有关该专业的信息以及认证和培训选项。许多提供商都提供许多编程语言的在线课程,如Python、R和SQL。

为什么对数据科学家的需求增加?

随着很多公司在某种程度上成为一家科技公司,对能够分析数据和收集业务洞察力的熟练专业人员的需求也在增加。

“随着企业数据规模越来越大,对具有特定技能的员工的需求也越来越高,他们可以有效地组织和分析这些数据。”Glassdoor公司经济研究员Pablo Ruiz Junco表示,“与此同时,拥有这些技能的人数与需求相比仍然相对较低,从而导致更高的薪酬。”

塔夫茨大学研究生工程学院的IEEE研究员、院长Karen Panetta表示,技术进步和大量可用的在线数据影响着每个行业和部门,并对经济产生了巨大的影响。这种所谓的“数据雪崩”不仅涉及庞大的数据量,还涉及其变化和增长的速度,以及可用的各种数据类型。

Panetta 表示,“在新兴的大数据革命中,了解如何使用电子表格和传统数据库还不够。分析需要实时完成,决策可能至关重要。了解如何使用软件工具只是这一挑战的一部分。了解跨学科的数据,能够传达其意义,以及使用统计数据将是传统数字处理器的差异化因素。”

数据科学家的工作角色是什么?

一般来说,数据科学家挖掘采购数据,并根据特定的公司利益对其进行分析,然后与市场部门合作以利用这些知识。这些工作人员必须熟悉数据收集软件、编程和仓储技术。

根据Glassdoor公司的研究,数据科学工作分为三个主要角色:核心数据科学家、研究人员、大数据专家。

核心数据科学家占到这些工作职位的71%,并且具有Python、R和SQL等方面的技能。这些专业人士在美国的平均年薪估计为116203美元。研究人员声称有15%的空缺职位,并且可能具备SAS、Matlab、Java、Hadoop、Python和R的技能。研究人员的平均年薪是112346美元。Glassdoor公司的调查发现,大数据专家占据了剩下14%的数据科学工作岗位,并掌握SARK、HIVE、Hadoop、Java、Python等技能,他们的平均年薪估计为121246美元。

据IBM公司介绍,在这些职位中,包括数据工程师之类的专业人员,他们需要诸如Apache Hadoop、Java和Python之类的技能,以及财务和风险分析经理,他们使用诸如风险管理、财务分析、规划和SQL等技能。

成为一名数据科学家需要哪些技能?

根据2019年4月的一份主要报告,以下是数据科学职位招聘中最常提到的五项技能:

  1. 机器学习
  2. Python
  3. R
  4. SQL
  5. Hadoop

Glassdoor公司2017年发布的调查报告发现,职位招聘中的前10项技能是Python、R、SQL、Hadoop、Java、SAS、Spice、Matlab、HiVe和TabLeAU。Glassdoor公司的调查发现,样本中每10个职位发布中就有9个至少需要Python、R和/或SQL技能。根据该报告,这些技能密切相关,这使得它们成为每个数据科学求职者应该学习的必需技能。

“如果想进入数据科学领域,并建立一个坚实的经验基础,在未来的雇主眼中,应聘者需要三种核心技能:Python,R和SQL。”Glassdoor公司经济研究员Pablo Ruiz Junco表示。有了这些技能,应聘者将有资格申请超过70%的数据科学家职位。另外,将这些技能扩展到这些基础语言之外,可以使应聘者获得更高的薪水,并允许其投入更广泛的网络申请。

根据Kaggle公司的一份报告,大约32%的全职数据科学家通过大规模开放在线课程(MOOC)开始学习机器学习或数据科学,而27%的人表示他们开始自己学习所需的技能。 30%的受访者表示,他们在大学开始从事数据科学的学习和研究。

哪些行业拥有数据科学家最热门的市场?

IBM公司在2017年5月预测,到2020年,美国所有精通数据的专业人士的每年职位空缺数量将增加到270万个。大约59%的数据科学和分析工作需求来自金融和保险、专业服务和IT行业。到2020年,对快速增长的数据科学家、数据开发人员和数据工程师新角色的需求将达到近70万个。

据Prime公司主管Shu Wu表示,对具有数据科学技能的开发人员的需求目前在企业中非常强劲, 在过去四年中,数据科学家的职位空缺出现大幅增长。

Shu Wu表示,“虽然未来几年数据科学家的工作前景依然强劲,而且这些专业人员可以获得高薪,竞争也很激烈。可以使整个组织都能理解数据专家是伟大的。”

数据科学家的平均年薪是多少?

美国数据科学家的平均年薪略有不同,具体取决于其工作地点。LinkedIn公司调查的平均年薪为130,000美元,Glassdoor公司调查的平均年薪为108,000美元。

根据Indeed公司的数据,旧金山的数据科学家年薪最高,平均年薪为166,519美元,其次是圣何塞(153,535美元)、西雅图(146,088美元)和纽约市(146,067美元)。

如上所述,由于核心数据科学家、研究人员和大数据专家之间的薪酬差异,个别数据科学家提出的技能可能会对薪酬产生很大影响。求职者应该考虑他们最感兴趣的角色,并对哪些技能值得花时间学习进行成本效益分析。

数据科学职业的典型面试问题是什么?

“为了评估应聘者是否能够成为一名数据科学家,可以通过这些进行衡量:基础知识、创造性和科学地思考现实世界问题的能力,关于高技术主题的特殊沟通,以及不断的好奇心。”Umbel公司高级工程总监Kevin Safford说。

根据Forrester公司分析师Kjell Carlsson的说法,一名初级数据科学家可以在求职面试中遇到以下问题:

介绍一下所完成的最为自豪的项目,在哪里使用数据/数据科学/机器学习/高级分析。应聘者在这个项目中的角色是什么?在每个步骤中都做了什么?

  • 应聘者参加的项目(在此处采用的语言或技能,例如Python、R)。
  • 应聘者与数据科学项目不精通数据的人合作的时间。
  • 应聘者解释数据科学,例如数据科学主题、交叉验证、无监督学习等。
  • 应聘者处理非常混乱的数据的时间。
  • 应聘者在原有团队中工作的经历。
  • 应聘者快速成为新技术专家的时间。

应聘者可能会根据团队开展的数据科学项目进行小型案例研究,其问题包括:需要哪些数据?想测试哪些假设?将使用什么技术来评估它们?

Carlsson说,面试还可能包括一个练习,在这个练习中,应聘者会得到一组数据和一个广泛的问题,并被要求陈述他们的调查结果。

根据Empowered Staffing公司招聘副总裁Daniel Miller的说法,对于更高级的职位,这些问题可能会出现:

  • 应聘者是否从头开始构建数据仓库?如果是这样,为成功实施数据仓库而创建的流程(如果从头开始没有参与其中,可以询问应聘者是否是处理公司合并或数据采集的部门的一员,以及是如何处理的)。
  • 应聘者构建了哪些类型的定制仪表盘,以及通过仪表盘提供了哪些信息/分析?
  • 应聘者完成的最复杂的数据项目,以及其为实现成功所能做的事情。
  • 应聘者如何向执行和高级领导解释和呈现数据?

在哪里可以找到数据科学职业的资源?

美国数据科学协会、运筹学和管理科学研究所,以及国际分析研究所是国家组织和国际组织,人们可以在那里寻求有关该专业的信息以及认证和培训选项。

一些教育机构创建了数据科学学位课程,其中包括加州大学伯克利分校、西北大学、卡内基梅隆大学和肯尼索州立大学。其中一些学校提供在线课程。

专业人员可以从许多提供商处找到许多在线编程课程,例如Python、R和SQL中的课程。IEEE计算机学会也提供课程和研讨会。

此外,还提供了一些数据科学方面的认证。其中包括供应商中立的认证分析专家(CAP)、Dell EMC认证专家认证计划、Microsoft认证解决方案专家(MCSE)和SAS数据科学认证。