设为首页 | 收藏本站
18515218668

数据分析与数据科学——了解最重要的区别

发表时间:2025-09-02 19:01作者:Together规则引擎
文章附图

大多数人都会混淆数据科学和数据分析这两个术语,即使它们是完全不同的学科。可以这样想:数据科学家设计水晶球,而分析师阅读它。换句话说,一个创建使分析和预测成为可能的工具,而另一个则使用这些工具来解决实际的业务问题。在本文中,我将解释推动这些科学学科的爆炸性起源和巨大的技术力量。此外,我将提供清晰的定义和简洁的比较,以阐明数据分析与数据科学之间的区别。

1.数据分析和数据科学爆炸式增长背后的起源和驱动力。

事实上,几个世纪以来,会计师、数学家和统计学家一直在处理数字。现在,多亏了计算机,这些数字和方程已经变成了数据和算法。因此,数据分析和数据科学已成为一个研究和专业领域。为了进一步解释,下面我将详细介绍这两个数据学科的起源和当前正在解决的挑战。a. 计算机及其数据输出是两门学科起源的驱动力。

图片17.png

1962年,数理统计学家约翰·图基(JohnTukey)发表了一篇论文《数据分析的未来》(TheFutureofDataAnalysis)。在这篇论文中,他指出了一门尚未被认可的科学,称为数据分析。此外,他指出了数据分析的三个驱动力,这些驱动力今天仍然适用于数据分析和数据科学。这些驱动力是:

l 计算能力事实上,50多年后,计算机功能继续快速扩展,以存储、处理和显示数据。

l 计算机数据输出–“大数据”。过去,数据是一种新现象。现在,由于更强大的计算能力、廉价的数据存储以及物联网(IoT)设备的快速扩展,它不断增加。

l 快速的全球互联网。计算机现在正在以闪电般的速度将数据传输到其他计算机和“云”。

由于这些计算现象,每个行业和专业都在接受“数据争吵”并从“大数据”中榨取见解。

b.企业开始谈论数据。

值得注意的是,直到2008年,我们才开始听到“数据科学家”这个词。与此同时,企业和IT部门开始谈论和处理“数据”。此外,他们开始经常使用“大数据”、商业智能(BI)仪表板和数据分析等术语。现在,企业领导者正在拼命寻求利用所有这些数据并找到使其有效的方法。事实上,他们认为利用数据是业务成功的关键。

“数据正在成为商业的新原材料。”

克雷格·蒙德尔

c.我们现在充斥着数据,需要数据专业人员来使数据有用。

现在,我们被大量数据淹没了。根据TechJury的说法:“如果你把人类在2020年生成的所有数据分配给世界人口,你会发现每个人每秒创建1.7兆字节的数据。事实上,据估计,人类创建的总数据中有90%以上是在过去两年内生成的。事实上,现在很明显,企业需要数据专业人员。例如,数据分析和数据科学都是热门领域,现在对数据专业人员的需求达数百万。

“令人惊讶的是,那里有这么多数据。问题是我们如何以可用的形式将其置于可能?

比尔·福特

2.数据分析与数据科学——定义。

事实上,人们很容易对数据分析与数据科学之间的区别感到困惑。例如,雇主通常会为数据分析师和数据科学家提供数千个职位空缺。然而,在许多情况下,公司对这两个职位使用相同的职位描述和技能组合列表。现在,实际上这些术语不应该互换。这是因为企业确实需要数据科学家和数据分析师。为了更好地理解和区分这两个职位之间的区别,以下是一些定义。

a.数据科学家定义。

“使用科学方法(数据科学)从原始数据中解放和创造意义。”

数据科学协会

因此,数据科学家使用数据进行基础和应用研究。此外,他们使用科学方法来创建意义、数据模型和软件应用程序。

b.数据分析师定义。

“检查大型数据集以识别趋势、开发图表并创建可视化演示(即数据分析),以帮助企业做出更具战略性的决策。”

克里斯汀·伯纳姆,东北大学

在这种情况下,数据分析师使用广泛的软件工具(软件应用程序、算法、方法等)。然后,他们将这些工具应用于大型数据集。因此,利用这些数据,他们为决策者创建有用的信息。此外,数据分析师使用的许多(如果不是大多数)这些软件工具都源自数据科学。

图片18.png

3.数据分析与数据科学–按子类型划分每个学科。

a.六种类型的数据分析

此外,您可以通过多种方式应用数据分析。特别是,这包括预算和预测、风险管理、营销和销售以及产品开发。更重要的是,数据分析有六种类型。见下文:

分析类型

l 描述性数据分析。在这里,分析师问发生了什么?

l 诊断数据分析。接下来,分析师为什么会这样?

l 预测数据分析。分析师问最有可能发生什么?

l 规范性分析。在这里,分析师问我们应该采取什么行动?

l 实时、按需分析。在这种情况下,分析师问我现在该怎么办?

l 人工智能驱动的分析。最后,分析师问我不知道要问哪些问题?

“数据是一门新科学。大数据掌握着答案。你问的问题对了吗?

帕特里克·基辛格

图片19.png

b.数据科学的六个部门。

事实上,数据科学现在正在影响所有学科、组织和行业。此外,数据科学的领域知识及其软件工具集正在迅速增长。此外,数据量继续爆炸式增长。为了更好地说明数据科学的浩瀚性,斯坦福大学统计学教授大卫·多诺霍在他的论文《数据科学50年》中描述并分类了数据科学的各种活动。具体来说,他将GDS(大数据科学)描述为从数据中学习的科学,分为六个部门。列出这6种类型是:

数据科学的类型

1. 探索和准备数据。

2. 表示和转换数据。

3. 使用数据进行计算。

4. 建模数据。

5. 可视化和呈现数据。

6. 关于数据科学的科学。

“成为一名统计学家最好的事情是你可以在每个人的后院玩耍。”

约翰·图基


精选文章
公众号
关于我们
联系方式
让您的业务更自动化、智能化!
联系邮箱:   zhangyi@rongtek.com      wangyilong@rongtek.com
咨询热线:185 1521 8668        183 3562 2627
电话:010-8200081