首页 > 知识百科 > 大数据是什么?与数据库是什么联系?

大数据是什么?与数据库是什么联系?

2022-11-28 11:31:51   |  Smartbi知识百科 3119

    第一、什么是大数据?


    “大数据”这个概念是近几年开始火起来的,现在可谓是无处不在了。在了解什么是大数据之前,我们先了解一下什么是传统数据?


    传统数据就是IT业务系统里面的数据,如客户资料、财务数据等。这些数据是结构化的,量也不是特别大,一般只是TB级。对比传统数据,还有一种叫“新数据”,是来源于社区网络、互联网等渠道,包括文本、图片、音频、视频等非结构化的数据。目前全世界75%以上都是非结构化数据,而且还一直呈现爆炸性的增长。我们看看下面的图就更好理解了:


    大数据就是结构化的传统数据+非结构化的新数据。因而,大数据还具有以下特点,简称“4V”:


    Volume(大量):数据体量巨大,从TB级别,跃升到PB级别;

    Variety(多样):数据类型繁多,有网络日志、视频、图片、地理位置信息等;

    Velocity(高速):处理速度快,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同;

    Value(价值):只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。


    第二、大数据组成

    大数据系统由基础设施、平台和应用组成。对比我们平时使用的电脑,基础设施就是电脑这台硬件,平台就是装在里面的操作系统,应用就是操作系统上面的各种应用程序。


    大数据的应用五花八门,但总体上可分为“业务应用”和“数据分析”两大类。


    前者包括ERP、CRM等业务系统,后者指的是各种分析应用,包括经营分析、价值分析、人流分析等等。分析系统从业务系统获取源数据,经过分析后可以反哺业务系统,对其进行赋能(注智),让其具有智慧。


    说到这里,大家是不是觉得有点熟悉了?跟我们的BI是不是有某些联系呢?没错了,“大数据平台”和“数据分析系统”加在一起就是BI的升级版啊!既然是升级版,它与传统BI有什么区别呢?请看下面就知道啦。


    (1)成本更低廉

    去IOE,硬件采用廉价的X86,软件更多使用开源,节省成本


    (2)容灾性好

    平台部署在X86集群上,机器出问题可随时切换


    (3)扩展性好

    X86集群可根据需要随时进行扩展,提高灵活性


    (4)处理效率高

    当数据达到TB级别,处理效率显著提高


    (5)处理类型多

    可以处理结构化、半结构化、非结构化数据


    (6)进一步挖掘价值

    处理的数据量大,类型多,因而可进一步挖掘数据的价值。


    是不是有很多升级的地方呢?为了支持这些升级,大数据系统需要具备哪些功能呢?这就涉及到架构问题了。


    第三、大数据架构


    我们已经知道大数据系统由基础设施、平台和应用组成,我们现在进一步细分,请看下图:


    基础设施由通过局域网或互联网连接的X86集群组成,为大数据平台提供最基本的硬件支持。


    大数据平台由基础架构、数据处理和数据服务三部分组成:

    1)基础架构负责对基础设施进行系统管理,为数据处理提供分布式底层服务;

    2)数据处理负责数据的采集、存储、计算;

    3)数据服务负责将处理后的数据提供给上层应用使用。


    大数据应用是面向用户的各种应用系统,包括业务应用和数据分析。大数据系统的总体架构就是这样子,是不是跟我们平时见到的BI架构很像呢? 通过这个表格对比我们就更清楚了:


商业智能BI资料包

扫码添加「小麦」领取 >>>

商业智能BI资料包

扫码添加「小麦」领取 >>>

新一代商业智能BI工具

覆盖传统BI、自助BI、现代BI不同发展阶段,满足企业数字化转型的多样化需求

让数据成为增长引擎,解锁行业领先的智能BI实践方案!

前往下载
Copyright© 广州思迈特软件有限公司  粤ICP备11104361号 网站地图

电话咨询

售前咨询
400-878-3819 转1

售后咨询
400-878-3819 转2
服务时间:工作日9:00-18:00

微信咨询

添加企业微信 1V1专属服务