作者:陈启焕,某互联网数据分析师

01 数据、信息、知识

数据是当今的热词。很多人的理解中,数据就是数字,其实不然,数据的范畴要大得多,包括数字、语言、文字、图像、视频,甚至是人类活动的行为都可以被认为是数据。数据本身是客观存在的,但是他的范畴是随着社会发展不断演进的。例如在计算机出现以前,文字和语言并不被认为是数据,而现在文字和语言,已是翻译,电子通讯等重要领域的核心数据。

此外,我们还常把数据、信息、知识混淆。简单来说,数据承载信息,知识是系统的信息。数据本是人造物,甚至可以被伪造,没有信息的数据大多没什么意义。数据常常存在噪音,我们需要专业的知识和数据处理能力,才能挖掘出数据中包含的信息。

例如,我们通过测量金字塔墓室的长宽高,得到金字塔墓室的外在数据,但是通过分析,金字塔墓室的长宽高符合勾股定理,这便是我们从数据得到的信息。

知识比信息更加抽象,更加系统。信息可能只在某种场景是正确的,但是如果要上升到作为真理的知识层面,则需要系统的信息。例如,通过测量星球的位置和时间,我们得到数据,通过数据发现,星球的运行轨迹,这就是信息,通过信息,建立模型,总结出开普勒第三定律,这就是知识。

02 数据的历史

讲完数据,我们讲讲大数据。大数据是近几年火起来的热词,数据一直存在,但是为什么最近才出现大数据热潮呢?带着问题。首先,我们讲讲数据的历史。早期的数据从观察总结而来。人类为了生存,崔生出农耕文明,但是古代人耕种过程中常常受沿岸洪水困扰,于是古代人观察天象,记录数据,判断洪水的时间,观察天象数据的过程中又崔生出了天文学。人们观察天文数据–分析数据(1年365天、每隔28-29天月亮变化一个周期等等)–建立模型(地心说、日心说)–预测未来(预测下一次洪水的到来)。所以说,数据从很早开始就给人带来价值,是人类文明的基石。

后来,随着自然科学和基础科学的快速发展,数据扮演了更加重要的地位。各种范式理论的提出,各种数学、物理学、统计学、天文学领域的真理提出,帮助人类了解所处的世界。数据为各种模型的提出和验证必不可少的条件。这个时代崔生出一大批想牛顿、爱因斯坦伟大的科学家,也铸就了一个伟大的时代,工业革命标准化生产的时代,大大解放了人类生产力,促进社会发展。

 计算机的诞生,将世界带入了信息时代。人类产生、获取和处理数据的能力得到大大提升。计算机打破了人类固有的物理距离,网络将世界相连,改变了人们的生活方式,进一步提高了人类生产力。至此,我们会发现,数据在人类文明进程中扮演重要角色,是人类文明的基石。但是为何近几年大数据热才被掀起? 

03大数据热潮的掀起

进入现代,数据的产生更加迅猛,尤其是进入移动互联网时代,每个人,每部手机都是数据来源。数据每年以40%的增量增长。另外,数据的时效性,完备性更强,那么我们说这是大数据热潮掀起的第一个原因。大数据,数据体量大,及时性强,完备性强。

接着,硬件等基础设施的强大。大量的数据产生了,但是我们该如何存储、该如何计算、该如何存储,都是一个很大的问题。幸运的是,随着硬件的不断提升,我们有能力去处理大量数据的存储、计算、传输问题。这便是第二个原因。硬件配套能够支持大数据。

再者,基础理论的进步。随着数据量的不断上升,机器学习、人工智能、深度学习等领域的理论不断演进。这为从大量数据中提取有效信息,发掘价值提供了必要的理论依据。这便是第三个原因,我们对数据的利用处理能力更强了。

最后,通过大数据,智能硬件,智能算法,智能传输,大数据出现了大量的落地场景,尤其是给人类带来了商业化的变革,大数据创造来了巨大的价值。所以说,这是第四点大数据引领了新的变革。综上,大数据在正确的时间,掀起了人类新一轮热潮。

Comments are closed.