如何成为一名数据科学家

来自:    更新日期:早些时候
如何成为一名数据科学家~

首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。但在一般情况下,一个数据科学家结合了软件工程师与统计学家的技能,并且在他或者她希望工作的领域投入了大量行业知识。
大约90%的数据科学家至少有大学教育经历,甚至到博士以及获得博士学位,当然,他们获得的学位的领域非常广泛。一些招聘者甚至发现人文专业的人们有所需的创造力,他们能教别人一些关键技能。
因此,排除一个数据科学的学位计划(世界各地的著名大学雨后春笋般的出现着),你需要采取什么措施,成为一个数据科学家?
复习你的数学和统计技能。一个好的数据科学家必须能够理解数据告诉你的内容,做到这一点,你必须有扎实的基本线性代数,对算法和统计技能的理解。在某些特定场合可能需要高等数学,但这是一个好的开始场合。
了解机器学习的概念。机器学习是下一个新兴词,却和大数据有着千丝万缕的联系。机器学习使用人工智能算法将数据转化为价值,并且无需显式编程。
学习代码。数据科学家必须知道如何调整代码,以便告诉计算机如何分析数据。从一个开放源码的语言如python那里开始吧。
了解数据库、数据池及分布式存储。数据存储在数据库、数据池或整个分布式网络中。以及如何建设这些数据的存储库取决于你如何访问、使用、并分析这些数据。如果当你建设你的数据存储时没有整体架构或者超前规划,那后续对你的影响将十分深远。
学习数据修改和数据清洗技术。数据修改是将原始数据到另一种更容易访问和分析的格式。数据清理有助于消除重复和“坏”数据。两者都是数据科学家工具箱中的必备工具。
了解良好的数据可视化和报告的基本知识。你不必成为一个平面设计师,但你确实需要深谙如何创建数据报告,便于外行的人比如你的经理或CEO可以理解。
添加更多的工具到您的工具箱。一旦你掌握了以上技巧,是时候扩大你的数据科学工具箱了,包括Hadoop、R语言和Spark。这些工具的使用经验和知识将让你处于大量数据科学求职者之上。
练习。在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实习生。最好的数据科学家在数据领域将拥有经验和直觉,能够展示自己的作品,以成为应聘者。

数学
数学是数据科学的重要组成部分。从微积分到线性代数这些大学数学的基础知识,要确保你都能知道。你知道的越多,你也会越来越好。
当数据变得越来越庞大,也就意味着它越来越难处理。这时候你就必须使用数学来处理数据了。
别以为你在大学没上过这些课,你就可以不知道了。说到底你还得需要了解如何操作数据矩阵,算法数学背后的大致思路你也得知道。
统计学
你必须得知道从一些小的数据集里如何利用统计学从而得出同样适用于大数据的理论。这是数据科学的基本法则。统计学将为你如何成为一名数据科学家铺平道路。
你需要知道统计是基于数据的,有了数据才能进行统计。统计能够让你更好地理解从数据中观察到的模式,并提取你需要的观点来做出合理的结论。例如,理解推论统计学可以帮助你去证实取自于小人群中的观点放到所有人群中的每一个个体也同样适用。
要了解数据科学,你必须了解假设检验的基础知识,并设计实验以了解数据的含义和上下文。
算法
理解如何使用机器来完成工作对于处理和分析数据集来说是至关重要的,因为这些数据集已经远远超出了人类的思维能够处理的范围。
如果你想在数据科学方面做出重大的改进,那你就必须了解算法选择和优化背后的理论。你必须决定问题是否需要回归分析,还需要决定是否需要一个能够帮助你将不同数据点分类到已经定义好的类别里面去的算法。
这样以后,你自己就会主动的去了解很多不同的算法以及机器学习的基本原理。机器学习就好比是允许亚马逊根据你的购买历史从而给你推荐产品,并且不需要任何直接的人工干预。这是一套算法,它是利用机器的能力去挖掘你的思维。
为了处理这些大量的数据集,你到时候就得使用机器了,因为这样你才能扩展你的思维。
数据可视化
完成数据分析只是这场战役的一半。 要想推动影响,你必须说服他人相信并采纳你的观点。
人类是视觉生物。 据3M和Zabisco透露,传递给大脑的几乎90%的信息本质上是视觉的,通过视觉进行处理的速度比通过文本将近快6万倍。
数据可视化是一种通过图表和其他可视化工具来呈现信息的艺术,这样观众就可以很容易地理解数据并从中获取信息。使用条形图展示什么信息最好?我们在散点图中应该展示什么类型的数据?
人类天生就会对视觉线索作出反应。你能够通过数据把你的观点表达得越好,别人就越有可能根据这些数据从而采取行动。
商业知识
数据在没有上下文的情况下是没有意义的。你必须了解正在分析的业务。清晰度是如何成为数据科学家的核心。
大多数公司之所以依赖于他们的数据科学家,不仅仅是希望他们能够挖掘数据集,而且还希望他们能够将其结果传达给各种利益相关者,并提出可行的建议。
最好的数据科学家不仅有能力处理大型复杂的数据集,而且还能理解他们所工作的业务或组织的复杂性。
拥有一般的业务知识可以让他们提出正确的问题,并提出有见地的解决方案和建议。
专业领域
作为一名数据科学家,你应该了解你所从事的行业以及它所处的行业。
除了对所在公司需要深入了解之外,你还必须了解它在你的商业洞察力中所起的作用。来自生物学研究的数据可能与精心设计的心理学研究中收集的数据具有截然不同的背景。 你应该足够了解行业行话。

成为一名数据科学家,并不难,小编给你总结了以下几点,只要你掌握了下面的技术,还是很容易成为数据科学家的。
(1) 计算机科学
一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景。简单来说,就是对处理大数据所必需的Hadoop、Mahout等大规模并行处理技术与机器学习相关的技能。

(2) 数学、统计、数据挖掘等
除了数学、统计方面的素养之外,还需要具备使用SPSS、SAS等主流统计分析软件的技能。其中,面向统计分析的开源编程语言及其运行环境“R”最近备受瞩目。R的强项不仅在于其包含了丰富的统计分析库,而且具备将结果进行可视化的高品质图表生成功能,并可以通过简单的命令来运行。此外,它还具备称为CRAN(The Comprehensive R Archive Network)的包扩展机制,通过导入扩展包就可以使用标准状态下所不支持的函数和数据集。R语言虽然功能强大,但是学习曲线较为陡峭,个人建议从python入手,拥有丰富的statistical libraries,NumPy ,SciPy.org ,Python Data Analysis Library,matplotlib: python plotting。

(3) 数据可视化(Visualization)
信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分析,开发Web原型,使用外部API将图表、地图、Dashboard等其他服务统一起来,从而使分析结果可视化,这是对于数据科学家来说十分重要的技能之一。

(4) 跨界为王
麦肯锡认为未来需要更多的“translators”,能够在IT技术,数据分析和商业决策之间架起一座桥梁的复合型人才是最被人需要的。”translators“可以驱动整个数据分析战略的设计和执行,同时连接的IT ,数据分析和业务部门的团队。如果缺少“translators“,即使拥有高端的数据分析策略和工具方法也是于事无补的。


如何成为一名数据科学家视频

相关评论:
  • 15370625254如何成为一名数据科学家?
    明初融保持开放的心态。如果你是一个新手,实际上并不知道什么是数据科学,所以它完全有可能不是你想要的工作领域。要成为数据科学家需要花费大量的时间和精力,请充分了解数据科学中不好的方面,比如数据整理,以及构建数据生产流水线,而这些工作占了数据科学家日常工作的大部分时间。首先要做的是学习Python。

  • 15370625254怎样成为数据科学家
    明初融需要以下几个方面:1.业务知识2.数理统计和数据分析3.计算机相关知识3.1数据处理与收集(ETL?)3.2机器学习和数据挖掘

  • 15370625254数据科学家需要具备什么能力
    明初融虽然很多框架都直接提供了这样的工具,但我们至少要了解内部的原型原理,比如如何高效判断一个矩阵是否存在逆矩阵并如何计算等。数理统计:概率论和各种统计学方法要做到基本掌握,比如贝叶斯概率如何计算?概率分布是怎么回事?虽不要求精通,但对相关背景和术语一定要了解。交互式数据分析框架:这里并不是指...

  • 15370625254如何才能成为一名数据科学家?
    明初融深入探索访谈数据的艺术,掌握主题分析法的六步骤,让你轻松驾驭定性研究!主题分析,作为人文社科实证研究中的重要工具,它通过挖掘文本内涵,提炼出关键信息,如Braun和Clarke(2006)所定义的那样,是识别、分析并报告数据模式的过程,主要包括代码(code)、类别(category)和主题(theme)这三个关键概念。

  • 15370625254如何成为一名数据科学家
    明初融成为数据科学家,先要从数据应用的某一点开始,弄懂一个,再来一个。大数据的应用技术有很多方面,例如信息采集技术,舆情监测技术等。以下是舆情监测技术的一些原理:实施后的好处:多多深入研究,10000小时能成为天才,加油!

  • 15370625254数据科学家 \/ 统计学家应该养成哪些好习惯?
    明初融回答:成为一名科学家,统计学家不仅是需要知识技能,还需要养成良好的习惯,下面我给大家说一说一名科学家统计学家应该养成哪些好习惯。进行数据可视化。这是很多老师都会强调的一点,对统计学来说,这也是最重要的一点。在实际的数据分析中,可视化可以决定选择什么模型,怎么样分析结果,解释结果。所以一定要熟悉各...

  • 15370625254如何成为一名数据科学家
    明初融如何成为一名数据科学家  我来答 首页 在问 全部问题 娱乐休闲 游戏 旅游 教育培训 金融财经 医疗健康 科技 家电数码 政策法规 文化历史 时尚美容 情感心理 汽车 生活 职业 母婴 三农 互联网 生产制造 其他 日报 日报精选 日报广场 用户 认证用户 视频作者 日报作者...

  • 15370625254如何成为一名数据科学家
    明初融众多新的软件分析工具作为深入大数据洞察研究的重要助力,成为数据科学家所必须掌握的知识技能。传统数据分析所用工具1、Excel作为电子表格软件,适合简单统计(分组\/求和等)需求,由于其方便好用,功能也能满足很多场景需要,所以实际成为研究人员最常用的软件工具。其缺点在于功能单一,且可处理数据规模小。这...

  • 15370625254避免五大误区丨数据科学家新手进阶之路
    明初融你需要做的是,熟练掌握你大部分时间将要做的事,即数据预处理。例如抓取图像或从API收集图像;从Genius收集歌词数据等。为解决特定问题准备所需的数据,然后将其输入到计算机中开始机器学习生命周期。精通数据预处理无疑将大大帮助你成为一名出色的数据科学家,从而让你在公司制定决策中起到关键作用。误区2...

  • 15370625254如何成为一名数据科学家
    明初融我认为有几个大方面1)学好python。现在几乎所以公司的数据都可以api给你,而python的数据处理能力强大且方便。加之在machinelearning的很多算法上,python也独俏一方。另外,它的简明方便迅速迭代开发,15分钟写完个算法就可以看效

  • 相关主题精彩

    版权声明:本网站为非赢利性站点,内容来自于网络投稿和网络,若有相关事宜,请联系管理员

    Copyright © 喜物网