未来智库 > 大数据论文 > 【小议大数据与统计新思维】
    关键词:大数据统计 经济学 智能经济学
    大数据拥有庞大的数据类型和规模数量,数据类型多,数据更新快。大数据与传统数据样本相比,数据量更大,可以为研究者提供更多的数据支持,使研究者可以从多维和多角度对问题进行分析。
    一、大数据统计需的主要意义
    传统数据对与统计学来说,对于数据的样本的收集、分析、构建等环节都必须要主动进行。但是对于现代统计学来说,大数据统计学可以实现自行记录、存储、扩充所需要的数据,并且数据其具有大的存储量,可以满足存储大量数据的要求。对于传统数据来说,数据是为了特定的研究,进行针对性的采集,在通过筛选后数据的使用会受到限制。因此,许多时候收集到的数据,无法满足统计学在进行研究过程中的多元化需求。其中,数据的不可扩充性和空间有限性都对统计学的研究造成了不同程度的限制,在这一点上,大数据统与其有着较大差别,在大数据背景下,由于数据自身包含大量信息,在技术的记录和量化上具有较为明显的现代优势,并且不会受到信息量的限制。
    在研究统计学过程中,利用大数据为统计学提供了更多的层次和选择空间。此外,在样本解决过程中,大数据的大量性和多样性对统计学来说意义重大,可以对样本中出现的各种问题进行合理解决,并且可以将数据中存在的规律进行总结。在统计学中,对大数据进行应用,可以为决策者提供重要的数据支持,并且可以提高决策者的从多较角度对决策问题进行分析,提高其对问题的认知能力。
    二、大数据背景下统计思维的转变
    (一)数据梳理与分类方法的创新
    在大数据时代下,先存在数据,然后才会构成一个总体。大数据比较混乱,并且样式较多,因此在研究过程中,需要与数据自身进行准确切入,对数据的特点进行分析,依据特点对数据的特征进行观察,创新数据的梳理和分类方式,只要通过不断创新,才能确保与大数据时代的各项要求相符。
    (二)创新样本采样方式
    小数据时代,在对数据进行采样时,通常的依据特定的研究目,完成相应的采样工作,是收集数据的一种主要方式。样本虽然只是总体中的一个组成部分,但是在实际研究过程中,依据系统采集相关科学理论,依据科学对数据进行采样,可以保证数据的科学性和合理性。一般来说,系统采样信息量有限,很难满足信息化社会的需求。但是,对效率和成本进行综合考虑,在调查和采样过程中,传统方式仍然是一种比较常用的方式。因此,需要转变采样调查工程,对其应用进行拓展。
    (三)因果关系与相关关系
    通常来说,因果关系的起源是来自对经验的总结,但是随着大数据时代的来临,因果关系被推翻。大数据时代背景下,并不需要了解原因,主要核心就是通过相关关系的建立,然后实现对未来的预测。但是,在大数据时代,如果向以往一样,只是简单的了解因果关系是远远不够的,必须还要了解事物之间的相关关系。在对因果关系明确的基础上,掌握事物之间的相关关系,从而确保研究者决策的科学性和合理性,两种关系缺一不可。
    (四)统计和云技术的融合
    收集数据和统计数据技术的发展已经达到了一定高度,但是由于数据量过于庞大,在数据的收集和统计上很难完成,这也对计算数据提出了新挑战。因此,在对数据的统计和分析过程中,需要对先进的信息技术进行应用,利用统计软件(SAS、SPSS)和云技术,实现对数据的合理处理。
    三、经济学受大数据的影响
    (一)研究对象成为了主体
    在研究传统经济过程中,对数据的收集能力有限,在数据收集过程中,通常采用抽样的方式进行,在对问题进行研究工程中,经常是针对少样的样本进行,这一做法从人们对经济学的研究开始一直延续至今,并且成为了经济学研究的一种主要方法,但是采取该方法的研究受抽样质量的影响较大。例如,公众怀疑政府统计部门公布的基尼系数和物价指数。大数据时代,在很多场合下并不需要研究样本,研究对象就是总体,改变了数据的来源方式,这对数据的处理也有较为深远的影响。
    在对主体进行研究分析过程中,可以利用统计分析方法中的分组分析法,如果统计整体单位具有的特征较多,总体范围内的单位经常会形成差别,此时在进行统计分析过程中不仅需要分析总体数量的关系和数量特征,同时还要深入到总体内部的分组进行分析,分组分析方法就是依据统计分析目的要求,将研究总体依照标志进行划分,然后在整理,最后进行分析、观察发现事物之间的内在联系和规律性。例如,在我国网民的调查过程中,可以依据网民的受教育程度不同,分析其网瘾。将网民分为本科以下组、本科、硕士、本科四组,详细数据见表一。在数据采用spss17.0软件进行处理,计数资料采用%表示,资料采用卡方检验,计量资料采用[X]±S表示,资料采用t值检验,P<0.05认为差异具有统计学意义 。
    (二)研究不在基于假设检验
    传统经济学研究,通常都会依据所研究的内容提出多个看似合理的假设,在对检验建设过程中,利用数据模型完成。但是,在数据时代下,因为数据和变量足够庞大,对知识和数据的挖掘可以通过人工智能方式进行,可以得到大量的结论,与传统经济学相比不在同一数量级别上。如果大数据时代下,对假设进行检验,仍然采用传统方式进行研究,研究结果永远无法满足人们的需求。大数据时代背景下,分析处理多样化结果,既可以基于经济学,也可以基于应用,通过结果对人们的决策进行辅助。除此之外,变量的完备性使传统假设变得很尴尬。例如,对企业投入对企业自身的业绩造成的影响,不仅考虑研发投入,而且也要对企业的竞争水平、资本结构等因素进行分析,在研究过程中,需要对弹性指数进行重点分析,但是在研究过程中经常会得到其它变量的弹性系数,将会导致研究者无法掌握研究重心。
    (三)大数据对计量经济学造成的冲击
    计量经济学是建立在统计检验和回归的技术的基础,诺贝经济学奖中的一半以上人都为计量经济学家,但是大数据时代的来临,使这一情况发生了转变。例如,在对X(自编量)与Y(因变量)之间的关系进行研究时,在检验X的回归系数t时,如果相伴概率没有超过0.05,则表示两个变量之间有所关联,两个变量没有关系的概率仅为5%,在研究过程中以CNNIC 发布的 《第 31 次中国互联网络发展状况统计报告》作为案例。2012年,我国网民数来高度5.64亿人,在研究过程中,假设我国网民平均受教育程度(X)与上网时长(Y)之间关系,5%也就是2820万人,庞大的基数致使我们不能忽视这5%。
    (四)改变了统计调查
    在大数据背景下,统计调查方式发生了变化。例如,计算物价指数,可以对最新的模式进行应用。传统方式对处理统计学中的异常点,通常都是直接丢弃,但是大数据时代下则有所不同,因为样本数量多,所以异常点经常会得到重视,将其视为重点研究对象。在统计数据过程中,人们重视非结构化和原始数据,这主要因为经过加工的数据就是“二手数据”,如果在数据加工过程中出现了问题,“二手数据”势必会存在问题。
    四、结束语
    小数据时代背景下,所有的研究方法都会得到不同程度的创新,这也对在大数据时代背景下进行调查和研究的人们的提出了新的挑战。大数据背景下,必须要具有统计思维,在分析过程中,对现代科技中的一些高科技技术和手段进行应用,只有这样才能做好相应的统计研究。
    参考文献:
    [1]陈如明.大数据时代的挑战、价值与应对策略[J].中国国际信息通讯展专刊,2012
    [2]陈明奇,姜禾,张娟,廖方宇.大数据时代的美国信息网络安全新战略分析[J].全国计算机安全学术交流会,2012
    [3]孙立,杨军,潘坤友.基于大数据可用性的政府统计策略研究[J].科技管理研究,2014
转载请注明来源。原文地址:https://www.7428.cn/vipzj19831/
 与本篇相关的热门内容: