数据价值再探析
发布时间:2021-06-21 17:26:55 所属栏目:大数据 来源:互联网
导读:一、数据价值理念需要澄清 数据的价值不是数据自身的属性,是数据与应用环境互动的结果。 1.数据价值边界的研究 各地都在成立大数据局加快数据中心的建设,都在谈论数据的价值,值得注意的是,宣传越火热越容易出现概念越界,导致工作的失误,冷静探讨数据价
|
一、数据价值理念需要澄清
数据的价值不是数据自身的属性,是数据与应用环境互动的结果。
1.数据价值边界的研究
各地都在成立大数据局加快数据中心的建设,都在谈论数据的价值,值得注意的是,宣传越火热越容易出现概念越界,导致工作的失误,冷静探讨数据价值的理念很有必要。
2.数据的价值是生态环境的产物
经济学认为价值并非是数据的天然属性而是对数据应用有效性的估值,带有很大主观性的成分,价值是有立场的,同样的内容其价值因人而异,抽象的价值是不存在的,数据的价值是特定生态环境的产物,必须从数据与其应用环境的关系上去理解数据的价值。
3.数据的使用价值取决于使用效果
数据的使用价值是数据对用户目标贡献的主观评价,数据有无价值要看其贡献是否大于成本,这种评价标准与用户目标本身的价值相关,数据作为手段其价值是无法超过目标本身的,项目越重要数据价值会越高。数据价值还与用户的利用能力有关,缺乏数据处理手段、缺乏数据理解能力都会制约应用效果。对使用价值研究有助于降低成本,要有清晰的应用目标,目标不清是最大的浪费,要提升使用工具的能力并避免过量使用数据。
4.交换价值强调稳定的应用规模
人们常用石油来比喻数据资源,这是从交换价值视角强调数据资源的重要,数据资源的确很重要,但数据资源与石油资源的价值特点有很大不同,石油交易稳定且频繁能够形成价值共识,而数据资源易过时易复制且供需匹配很困难,难以形成数据价值共识,这是大数据交易中心无法成功的主要原因,数据资源长远价值的不稳定提醒大数据管理者,不是所有数据都有价值都值得保存,应当保存未来真正用得上的数据,避免垃圾数据的堆积。
二、数据价值随环境变化而改变
数据价值最大的制约因素是处理速度,信息技术的使用大幅度提高了数据处理的速度,使很多过去无法利用的数据都变得有用了。
1.数据处理的速度支撑数据价值
数据是作为工具来帮助人们实现目标,任何目标的实现都有时限,时间是数据处理最大的机会成本,时限内完不成的应用均无价值,数据处理的速度直接影响数据的价值。早期的统计数据由于是人工处理,除了汇总结果没有更多的用途,直到计算机出现数据价值才开始被人称道。
2.摩尔定律推动数据价值的提升
计算机的应用提升了数据处理的效率,摩尔定律使计算机的能力提高亿万倍才形成了社会对数据价值的重视。
3.统计数据价值的黄金期
在统计数据处理的黄金期,计算机不仅能够高效处理各种分类报表、排序等操作,还把统计数据带入统计分析阶段,统计分析软件如SPSS、SAS成为计算中心的必配软件,统计数据共享被提上日程,国家统计局对外宣称统计数据是一个巨大金矿。
4.数据库存储了数据间的关系
统计数据处理是一项工程并不是一项服务,用户必须有数据处理的能力才能使用统计数据,这使应用很难推广,数据库的发明解决了这一难题。数据库按照用户使用的方便对数据进行重组,不仅存储数据更存储数据之间的关系,用户关注的信息不仅体现在数值之中还体现在关系之中,数据间关系的存储极大提升了数据库使用的灵活性,使数据库备受欢迎。
三、互联网对数据价值的影响
互联网推动全球的数据共享,降低数据发布与数据服务的成本并把竞争带入到数据服务领域,降低了数据信息服务的价格。
1.管理信息系统与商用数据库
数据库提供的服务比统计数据处理更方便更有针对性,数据库公司把这种新型服务定义为信息服务,提出信息共享口号来推广数据库的应用,数据库最成功的应用有两类:一类是管理信息系统,该系统是利用数据库与局域网技术设计的专用业务管理系统,典型的例子是企业管理ERP系统;另一类是与广域网相结合形成的商用数据库的公开服务并大赚其钱,成为当时的明星产业。
2.互联网终结了商用数据库的辉煌
新技术不断推出新一代明星且终结了老一代明星。九十年代末互联网开始在全球大规模推广,此后再没有商业数据库明星出现了,被互联网企业明星取而代之,通用的互联网模式淘汰了商业数据库的专用网模式,使缺乏专用网壁垒保护的商用数据库深陷廉价信息的竞争之中,商业数据库的数据质量并没有降低,但是互联网竞争环境却使其收益大大降低了。
3.数据共享开创免费信息时代
互联网的最大贡献是推动了全球的数据共享,数据的发布成本几乎降为零,加上信息复制早已接近零成本,必然带来网上数据泛滥,必然带来信息服务价值下降,互联网开创了免费信息时代,越来越多的外部信息服务的竞争使政府内部信息服务的价值也下降了。
四、关于政府大数据应用
按照统计数据应用思路,以获取信息为目标的大规模数据应用才属于大数据应用;政府精细化管理所使用的传统业务数据不属于大数据应用。
1.大数据应用价值的出现
互联网推动网上数据流量大爆发,互联网巨头公司积累了超大规模的数据,开发出能够处理超大规模数据的软件工具,公司可以利用自己的大数据资源向社会提供服务。典型的例子如谷歌流感预测、阿里的市场预测等,大数据成为专有名词被用来推广这种应用及销售相关软件。
2.大数据对统计数据理念的冲击
英国人迈尔-舍恩伯格与库克耶合著的《大数据时代》对大数据的应用特点做了精辟的概括,认为大数据应用带来三大观念转变:
1.以全体数据替代随机样本;
2.强调数据规模允许数据不精确;
3.重视相关关系不追求因果关系。
大数据新观念提升了应用的效果,使之成为发现新规律新知识的重要工具。
3.相关关系对因果关系的挑战
大数据只重视相关关系的理念是对因果关系文化的挑战,原因之一是因果关系超出了大数据分析的范围;原因之二是工作改进依赖的是事实,并非都需要用因果关系来解释。机器翻译主要靠概率推算而不是语法推理,统计质量管理也是依赖数据相关关系改进质量而不依赖因果关系解释。
4.大数据分析决策的局限性
大数据分析有许多成功案例也有先天的弱点,首先是合适的大数据资源非常稀少不容易碰到;其次是大数据资源涉及的领域非常狭窄(大规模数据只能产生于专业化领域),数据量大并不意味所反映的信息就全面,大数据适合狭窄领域的决策而不适合政府的宏观决策。
五、政府精细化管理使用的数据
政府精细化管理目的是提高业务操作的效率,关注的是业务数据精准化与整体化,数据整合的任务就是把分散的管理数据组织成便于统一调用的系统,提升整体的驾驭能力。对政府业务数据的整合是数字政府的基础工作。
1.政府业务管理是数据的精准使用模式
政府使用数据通常有两种模式,一种是信息获取模式,该模式是对数据分析加工提取信息供领导层决策使用;另一种是管理操作型数据使用模式,该模式是系统直接利用数据进行操作,这是数据的精准使用模式,是面向政府业务管理操作应用,这种模式管理的是政府业务部门使用的工作数据,数据是不可替代的,这类数据的精准管理是政府精细化管理的基础。
2.数据整合的目的是实现政府数据整体化
政府数据的收集是分部门完成的,分散收集的数据必须组织成整体才能提升管理能力。这次疫情健康码的整合就是一个成功的例子,当事人的交通信息、进出商场、小区、医院等记录都通过身份证号码集中起来形成个人健康码记录,在疫情防护中发挥出重要作用。数据整合的任务是把分散的数据有效组织起来产生出数据的整体价值,业务数据跨部门调用的流畅性是政府数据整体化的标准。
![]() (编辑:承德站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

