大数据

big data

什么是大数据?

我们可以将大数据描述为这样一种数据管理难题,由于数据量、 数据速度和数据多样性方面的需求日益增加,人们无法使用传统数据库来解决这种难题。 大数据的定义很多,但其中大部分定义都包含所谓大数据的“三个 V”的概念:

大量 (Volume):数据量从数 TB 到数 PB

多样 (Variety):包括多种来源和格式(例如 Web 日志、社交媒体互动、 电子商务与在线交易、财务交易,等等)的数据

高速 (Velocity):从生成数据的时间到向用户提供可付诸行动的见解的时间, 企业对速度的要求越来越高。因此,需要以相对较短的时间(从每天一次到实时)完成数据的收集、存储、处理和分析

您为什么会需要大数据?

尽管关于大数据的宣传无处不在,许多组织仍然没有意识到他们正面临大数据问题, 或者根本没有从大数据的角度思考自己面临的问题。 一般而言,如果组织现有的数据库和应用程序已无法再扩展以应对数据量、 数据多样性和数据速度方面需求的激增,那么该组织很可能会通过采用大数据技术而获益。 若未能正确解决大数据难题,则会导致成本不断上升,工作效率和竞争力不断下降。 而合理的大数据策略则能够迁移现有的繁重工作负载, 交由大数据技术处理,并部署新应用程序以利用新的商机, 从而帮助组织降低成本并提高运营效率。

大数据的工作原理是什么?

大数据技术提供了可满足整个数据管理周期需求的新工具,因此具有技术上和经济上的可行性, 不仅能够收集并存储更大的数据集,还能对其进行分析,以发掘有价值的新见解。 在大多数情况下,大数据处理包含一种常见的数据流 – 从收集原始数据到使用可付诸行动的信息。

收集、存储、处理和分析、使用和可视化,描述分析,预测分析,规范分析。