您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

数据素养的7大判断标准:看你骨骼清奇,来当数据科学家吧!

发表于:2020-08-15 作者:读芯术 来源:读芯术

本文转载自公众号“读芯术”(ID:AI_Discovery)。

对于数据科学家来讲,能否理解数据是必须通过的筛选条件,任何先进的算法或复杂的机器学习模型都无法取代人类分析数据的优势,一个优秀的数据科学家必须具备数据素养。

企业每天都要通过分析来处理变化和由此产生的不确定性,这些日常的变化和不确定性使企业更快地行动,其中发展迅速却不冒失的才能成为成功的企业。数据科学家则负责研究场景、分析找出其根本原因、评估替代方案,在最后实施解决方案。企业越快收集到足够的数据进行调查,就能越快做出合理的决定,而这就是为什么优秀的数据科学家必须具备数据素养的原因。

数据素养在维基百科上的定义是“阅读、工作、分析和用数据说话的能力”。此外,数据素养还包括从事与数据相关工作的能力。

1. 能够清晰地表达观点

你是否能理解所见的事物?是否知道如何将其表述给他人?判断一个人是否具备数据素养的标准是能否清晰表达自己的观点,不是给出过分复杂化的解释,而是直击要害。

阿尔伯特·爱因斯坦曾说:“如果你不能解释得很浅显,说明你本身就未完全理解。”“理解”并非指的是明白当下的一切,而是指人们至少可在信息中有所提炼。当人们不是完全明白的时候,他们往往浪费很多篇幅来解释,只有他们完全理解才能简述自己的想法。

2. 不会轻易被信息淹没

数据素养的7大判断标准:看你骨骼清奇,来当数据科学家吧

图源:unsplash

数据无处不在,人们很容易被它淹没。

以新冠疫情为例,从疾病的信息、疫情带来的经济损失到洗手的方法,各个方面信息无处不在。很多人都被这些信息淹没,甚至难以辨别真假。被信息淹没的人们会忽视许多重要的事情,也会无法集中注意力。因此,在处理数据时,人们需要记住重点问题和信息。

3. 能够用数据说话

当你浏览互联网上的评论时,会发现其中很多都是毫无根据的或是纯粹的骗局。这与现实生活没有太大区别:许多人只会根据自己的感受或当下的想法来争论,但是具备数据素养的人则会基于数据而不是毫无根据地争论。

在商业领域,数据科学家是数据驱动业务的驱动者。在数据驱动的企业中,许多要素需要使人信服,数据科学家需要具备数据素养来建立合理的论据。

用数据说话比你想象中要困难,它需要理解数据并将其清晰表达,信息才能有效传达。用数据说话同样需要承担很大的责任,人们需要阐明他们拥有的数据符合正确的标准。当数据不足时,你最好保留意见。

数据素养的7大判断标准:看你骨骼清奇,来当数据科学家吧

图源:unsplash

4. 能够基于数据采取行动

具备数据素养的重要性,在于人们可以理解数据并基于此采取行动。具备数据素养的人即便面对诸多信息,也可以在脑海里处理好这些数据,并在此基础上采取行动。

举一个很常见的例子——在网上购买电脑。因为选择繁多,所以我们的第一步是判断所需要的电脑类型。如果是为了游戏,那么你需要通过浏览其他人的评论来决定预算范围内最适合游戏的电脑。这一过程就像定义问题(游戏)和范围(预算)→收集数据(评论)→采取行动。别不以为然地认为下单前看看买家秀是基操,很多人甚至懒得收集数据!

合理的行动需要专业知识和业务洞察力,如果能加上“结合数据”这一步骤,成功率大大上升。

5. 行动迅速而不莽撞

企业发展迅速,决策的速度更快,犹豫何时采取行动会让事情变得不确定。在数据较少的情况下过早采取行动无疑是莽撞的,但等待足够多的数据又或许太迟了。拥有数据素养意味着能够决定合适的行动时间,对变化做出快速的反应是数据科学家的基本意识。

以约会为例,向一个认识不久的人求婚是鲁莽的,但是等待太久才采取行动很可能错过爱情。人们通过收集关于对方足够多的信息来是否可以更进一步。“足够多的信息”可以是任何东西:它可能是对方的价值观,也可能只是身体特征。如果把它和企业类比,收集关于企业“足够多的信息”是采取行动前必须完成的步骤。

数据素养的7大判断标准:看你骨骼清奇,来当数据科学家吧

图源:unsplash

6. 对数据感兴趣

有些人被数据淹没,但有些人却直接忽略了数据。他们不在乎世界上发生了什么,也不想去了解最新的信息。在隔离期间,笔者很惊讶地发现自己的朋友甚至不知道需要通过拭子PCR检测才能确认是否感染新冠肺炎。

具备数据素养的人会对数据感兴趣。这并不是说他们需要在任何地方挖掘数据,但最起码他们想随时了解最新情况。笔者认识的具备数据素养的人总是对数据可视化感兴趣。他们对数据感兴趣,并不断追求如何以最完美的形式呈现数据,他们希望通过展示恰当的数据来获取有价值的信息。

7. 能够提出质疑

在这个充满信息的世界里,人们每天都会被新的数据轰炸,其中不乏正确信息,但更多的是错误的或是无关紧要的。具备信息素养的人会不断质疑自己获取到的信息,例如询问自己这条信息是否正确、是否有用、是否必需。

具备数据素养的人也会是渴望信息的人,因此他们会不断地提出质疑以获取新知。如果在商业环境中考虑,你可能已经完成了分析并得出了答案,但是这个答案是对的吗?或者你已经建立了最精确的机器学习模型,但是这个模型真的可以在现实世界中实现吗?数据科学家工作时经常会遇到这种情况,而这也是作为数据科学家应该提的问题。

数据素养的7大判断标准:看你骨骼清奇,来当数据科学家吧

图源:unsplash

但请注意,你仍然需要找到妥协点,因为问题终究是无穷无尽的。

判断一个人是否具备数据素养有以上七种标准,你满足这些条件了吗?