了解最新公司动态及行业资讯
编译:米卡
市场对数据工作者的要求很多:需要掌握机器学习、计算机科学、统计学、数学、数据可视化、深度学习等知识。要掌握所有这些方面,至少需要学习数十种语言、框架和技术,这显然是困难的。
那么,数据工作者应该如何合理分配时间,掌握哪些技能?
在本文中,我们搜索了工作网站,以找到数据相关工作(例如数据科学家)所需的技能。我分别分析了一般数据相关的技能和特定的语言和工具。
我们专门搜索了 、 、 和这些求职网站。
下表显示了每个网站上发布了多少相关工作。
我分析了许多职位列表和调查,列出了最常见的技能要求。像“管理”这样的词不包括在内,因为许多职位发布都包括它。
所有搜索均针对美国地点、关键字中包含“数据科学家”的职位发布,并且使用完全匹配搜索来减少结果数量。但是,这种方法可确保结果与数据科学家的职位相关并影响所有搜索词。
提供于
是招聘数据科学家的公司数量,而不是职位数量。我将排除这两种分析,因为它的搜索算法是 OR 的逻辑搜索,并且不能修改为 AND。如果您搜索“数据科学家”“”之类的关键字,还不错,但如果您搜索“数据科学家”“react.js”,它也会返回不雇用数据科学家的公司。
也被我排除在外。该网站称,目前美国发布了 26,263 个“数据科学家”职位,但实际上显示的职位不到 900 个。此外,发布的数据科学家职位不太可能是其他主流平台的三倍。
最终分析使用通用技能分析400多个职位信息和特定技能分析200多个职位信息。有一些重复,结果记录在Sheet中。
我下载了 .csv 文件并将其导入。然后我计算了每个百分比,并对工作现场的数字进行平均。
此外,我将结果与上半年发布的数据科学家工作研究进行了比较,并结合了调查信息。可以看出,一些技能对数据科学家来说越来越重要,而另一些则逐渐变得不那么重要。我们稍后会详细看到。
交互式图表和分析可以在我的 .我用它来进行可视化,在写这篇文章的时候,使用and有一些困难,在最终文档中有说明
文档
1.一般技能
以下是雇主最希望数据科学家具备的一般技能。
结果表明,数据分析和机器学习等通用技能是数据科学家工作的核心。从数据中收集分析见解是数据科学的主要功能。机器学习是关于开发能够产生预测性能的系统,它是一项非常流行的技能。
数据科学家需要统计和计算机科学技能也就不足为奇了。统计学、计算机科学和数学也是大学专业,这也可能增加这些技能的使用频率。
有趣的是,近一半的工作要求都提到了沟通技巧。数据科学家需要能够交流自己的见解并与他人协作。
人工智能和深度学习并不像其他术语那样频繁出现。它们是机器学习的一个子集,深度学习用于越来越多的机器学习任务it技能服务,以前主要使用其他算法。今天,大多数用于自然语言处理问题的最佳机器学习算法都是深度学习算法。我预计深度学习技能在未来的职位发布中会越来越明确,机器学习会越来越类似于深度学习。
那么雇主希望数据科学家使用哪些特定的软件工具?接下来,我们来看看问题。
2.技术技能
以下是雇主最希望数据科学家掌握的前 20 种特定语言、库和技术工具。
让我们简要介绍一下最常见的技术技能。
是最流行的语言。这种开源语言已经变得非常流行。对于初学者来说,该语言很容易上手,并且有很多支持资源。绝大多数数据科学工具都与它兼容。它是数据科学家使用的主要语言。
R 语言也不甘落后。它曾经是数据科学的主要语言,R 的需求量仍然很大。这种开源语言源于统计学,很受统计学家的欢迎。
或者说,R 语言是从事数据科学工作的必备语言。
SQL 的需求量也很大。 SQL 代表查询(结构化查询语言),是与数据库交互的主要方式。 SQL 在数据科学领域有时会被忽视,但如果您正在寻找数据科学领域的工作,这项技能很重要。
接下来是 Spark,两者都是大数据的开源工具。
是一个开源软件平台,用于分布式存储和分布式处理大型数据集,这些数据集是用商用硬件构建的计算机集群。
Spark 是一个快速的内存数据处理引擎,具有强大且富有表现力的开发 API,使数据工作者能够在需要快速迭代访问数据集的情况下高效地执行流式处理、机器学习或 SQL。
与 R 和 SQL 相比,很少有求职者具备这些技能。如果您有使用 Spark 的经验,那么您更有可能在求职中取得成功。
接下来是 Java 和 SAS。我惊讶地发现,这两种语言在职位描述中也出现得非常频繁。一般来说,Java 和 SAS 在数据科学界没有受到太多关注。
接下来是。这个分析平台和可视化工具功能强大、易于使用且越来越受欢迎。它有一个免费的公共版本,但如果您想保持数据的私密性,则需要花钱。如果您不熟悉,强烈推荐 Udemy 的 10 A-Z。
下面的技能列表显示了更多的语言、框架和其他数据科学软件工具。
根据我们的分析和调查,R 和 SQL 是最受欢迎的技能。根据局方开发者调查分析,近年来R、Java、SAS的使用量呈下降趋势,呈明显上升趋势。
3.建议
根据这些分析的结果,以下是给数据科学家的一些建议。
当雇主在寻找熟练的数据科学家时,他们还希望候选人掌握常用的数据科学库:numpy、-learn 和 .如果您正在学习这些工具,我建议您使用以下资源:
如果你想学习深度学习,我建议先学习 Keras,然后再学习 or。 Deep with 这本书是学习 Keras 的绝佳资源。
除此之外,我建议您了解自己感兴趣的内容,尽管这里需要考虑时间分配等因素。
如果您正在通过工作网站寻找数据科学家的工作it技能服务,我建议您尝试一下,它提供最多的工作信息。
同时,我建议您创建一个在线作品集,以很好地展示您的数据科学技能。还建议您在个人资料中注明您的技能。