6
036 贰月号 封面文章 iManagement 大数据的管理喻意 陈国青 当数据完全渗透到人们生活之中,大数据带来的挑战就涉及人们生活的各个方面, 在很多方面我们都可以观察到大数据时代的不同。面向大数据机遇和挑战的应对 策略是进行长期部署和短期规划,一步一步走。从长期来看,大数据的影响是深 刻的。但眼下对企业而言,应对大数据的第一步是构建 BA 能力 6 年来,“大数据”这一概念迅速流行,在业界和学界得到高度关注。事实上, “大数据”并不是从天而降的,而是时代演化的产物。当信息技术发展到云计 算、大数据时代,人们的生活渐渐发生了全面的变化。从基础研究方法到各个 学科,人们普遍感受了大数据的迫近,但我们要看到大数据之“热”背后的东西,以及企 业需要构建哪些关键能力。 计算范式进化 回顾信息技术革命对社会生活的影响,可以分为几个时代:主机(Mainframe)时 代,个人电脑(PC)时代,Web 1.0 时代,Web 2.0 时代,以及物联网 / 云计算 / 大数据 时代。主机时代主要是指以大型机为主导的 1960-1970 年代。人们若有计算需求,就要 去计算中心,把程序交给专门的工作人员负责试运行。这完全是集中式的数据管理,个 人想做计算非常不方便,而且很贵。1980 年代可以称作个人电脑时代。此时,大型计算 机的一部分功能转移到了台式个人电脑上,人们可以在个人电脑上运行一些简单的计算 功能,开始了简单的文本处理,计算开始从集中走向分散。20 世纪 90 年代 Web 1.0 兴起 了,互联网帮助人们把全世界的信息联系在一起了。但此时的互联网是单向的,我们仅 仅能够查询和获取信息,只能通过这个窗口向外看。到 2000 年前后,以互动和参与为主 要特征的 Web 2.0 出现了。原来人们只是互联网信息的被动接受者,但此时,网民可以

6刻的。但眼下对企业而言,应对大数据的第一步是构建 · 大数据的管理喻意 陈国青 当数据完全渗透到人们生活之中,大数据带来的挑战就涉及人们生活的各个方面,

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

036 贰月号 封面文章iManagement

大数据的管理喻意陈国青

当数据完全渗透到人们生活之中,大数据带来的挑战就涉及人们生活的各个方面,

在很多方面我们都可以观察到大数据时代的不同。面向大数据机遇和挑战的应对

策略是进行长期部署和短期规划,一步一步走。从长期来看,大数据的影响是深

刻的。但眼下对企业而言,应对大数据的第一步是构建BA能力6近

年来,“大数据”这一概念迅速流行,在业界和学界得到高度关注。事实上,

“大数据”并不是从天而降的,而是时代演化的产物。当信息技术发展到云计

算、大数据时代,人们的生活渐渐发生了全面的变化。从基础研究方法到各个

学科,人们普遍感受了大数据的迫近,但我们要看到大数据之“热”背后的东西,以及企

业需要构建哪些关键能力。

计算范式进化

回顾信息技术革命对社会生活的影响,可以分为几个时代:主机(Mainframe)时

代,个人电脑(PC)时代,Web 1.0 时代,Web 2.0 时代,以及物联网 / 云计算 / 大数据

时代。主机时代主要是指以大型机为主导的 1960-1970 年代。人们若有计算需求,就要

去计算中心,把程序交给专门的工作人员负责试运行。这完全是集中式的数据管理,个

人想做计算非常不方便,而且很贵。1980 年代可以称作个人电脑时代。此时,大型计算

机的一部分功能转移到了台式个人电脑上,人们可以在个人电脑上运行一些简单的计算

功能,开始了简单的文本处理,计算开始从集中走向分散。20 世纪 90 年代 Web 1.0 兴起

了,互联网帮助人们把全世界的信息联系在一起了。但此时的互联网是单向的,我们仅

仅能够查询和获取信息,只能通过这个窗口向外看。到 2000 年前后,以互动和参与为主

要特征的 Web 2.0 出现了。原来人们只是互联网信息的被动接受者,但此时,网民可以

0372014/02www.ManaMaga.com

37自己写作博客,参与维基百科的编辑,联系社

会网络等等。电脑的计算功能越来越强,越来

越融合在人们的生活之中。人们之间的信息沟

通越来越密,社会中的信息点也越来越分散。

直到近年来,出现了以物联网、云计算和大数

据为标志的新时代。此时,不是单个软件或单

个机器的革新,而是整个计算范式(Paradigm

of Computing)的变革。这是一种新型的集中式

计算:无处不在的探测感应装置、计算机网络、

移动终端、云服务、社会化媒体、数字化生活

使得数字世界和计算能力处于物理上高度分散

和分布式状态;另一方面,物联网、云计算和

大数据应用又强调信息整合、数据中心平台以

及全局视图。所以,与传统集中式不同,此时

呈现出物理上分散、逻辑上集中的新特点。

技术的发展与应用有一个刺激响应螺旋:

当某个技术突破产生时,个人和组织不管主动

还是被动都免不了要面对这项技术,思考诸如

“要不要应用这项技术,如何应用”等问题;

技术的发展又会受到这些应用要求的影响,一

直互动和循环下去。一项新技术是一个刺激,

个人和企业会响应并产生新需求,进而这些新

需求又成为新的刺激,使得技术再做出创新响

应。技术和应用需求就在这种刺激与响应中螺

旋上升。在当前新型计算范式背景下,特别是

从大数据的视角来审视我们面临的机遇和挑战,

思考对未来的管理可能产生哪些影响,具有重

要理论和实践意义。

陈国青 清华大学经济管理学院讲席教授,学术委员会主任。主要研究领

域为:商务智能与电子商务、IT战略与管理

大数据改变生活

现在关于大数据的说法比较多。

一些提法也在涌现,如认为大数据只注

重关联不注重因果、只注重总体不注重

抽样等。这些观点反映了特定场景和应

用的某些特点,但是作为大数据的一般

属性的话,目前还缺乏足够的共识。简

单说来,具有相对广泛共识的大数据特

征是所谓的 4V(Volume, Variety, Value,

Velocity)。第一,大数据意味着超常规

模数据(Volume)。与之前的大规模数

038 贰月号 封面文章iManagement

据不同的地方在于,大数据对企业来

讲意味着数据规模超越了企业本身的

内部数据,而是延伸到了企业外部,

成为一种社会化的企业数据。每个人

作为终端使用者,既是信息的使用者,

又是信息的创造者。全社会的人都与

数据发生关联,在社会活动的各个环

节,而不仅仅局限于之前的某些企业、

某些部门职能环节;这是质的变化。

第二,大数据意味着多样性(Variety)。

富媒体(Rich Media)大大扩展了人们

的数字化生活体验,全球数据和数字

流量中 70%-80% 都是视频、语音、图

像,而不是过去以二维的、规范化的、

非常简单数据形式为主的结构化数据。

多样性成为大数据的显著特征。第三,

我们处在数据的海洋之中,但与我们

企业或个人相关的数据相对说来是很

少的,所以是低价值密度的(Value)。即,

数据量的分母太大,对企业或个人决

策有价值的信息占总量的比例就很小。

所以这里有一个重要的含义,即如何

从低价值密度的数据海洋中挖掘出有

用信息,成为企业数据分析的关键。

第四,大数据的实时性强(Velocity)。

信息就像开着的水龙头一样,源源不

断地出来。人们打开手机看新闻,支

付账单,都需要得到及时响应,而不

是等到晚上再看新闻,要排个队才能

支付账单。信息是连续的,实时的,

流涌的。这种流信息是时时刻刻(Real-Time)的,

构成了大数据之“大”和无时不在。

大数据的这四个特征会给人们的科学研究方法

带来挑战,当然也会影响商业和管理。

比如说对统计理论的挑战。在传统概率统计学

中,因为做不到对总体进行采集,所以设计了许多

抽样方法,要用到测度(如均值、方差)这些概念。

在大数据背景下,很多基础的假设都需要重新检验

和审视:哪些被颠覆了,哪些可能还可以用。在所

有管理学理论中,统计是最基础的方法之一,所以

这种审视很重要。

再者,比如对信息处理的挑战。传统的信息处

理技术要应对具有 4V 特征的大数据是极有挑战性

的,一方面是测度、信息处理的基本方法,另一方

面是搜索、推荐等应用方法。大量的信息处理方法

都只能处理结构化的数据,而无法处理富媒体数据,

因而需要重新审视。譬如,30 和 31 不相等,两个数

字易于比较;而两篇博文可能只是相似,意义相接近,

等等;视频和图像的比较,更需要判断其相似性而

非“等于”。此时,数学上的“等于”就变成特殊

的个例了,多种情况下是“约等于”,或者说相似

关系。但是,已有的大量算法并不是基于“相似性”,

需要重新检验。例如,数据挖掘方法中有一种关联

规则算法叫做 Apriori 算法。这个算法是基于结构化

记录的经典算法,是许多应用方法的基础。啤酒尿

布问题就是关联规则算法的经典案例。然而,如果

现在要处理的不是一条条的记录,而是视频、音乐,

经典算法能否处理新问题就需要重新审视。第一要

审视算法是否可用,第二要审视算法是否足够有效

率。再如,现在我们搜索一个关键字可以很快得到

0392014/02www.ManaMaga.com

39结果,但搜索图片时体验还是很差的,如果要搜索

一段语音、音乐,那么,搜索的响应时间、质量和

精度都还远达不到人们的要求,是计算机学界需要

解决的问题。考虑到处理大数据需求的是流算法,

对实时性要求高,没有效率的算法势必会被抛弃。

其它的挑战还涉及数据传输与存储技术、社会分析

与计算技术、模式识别与语义分析技术等诸多领域。

当数据完全渗透到人们生活之中,大数据带来

的挑战就涉及人们生活的各个方面,除了上述基础

方法、信息处理方面的挑战,在很多方面我们都可

以观察到大数据时代的不同。比如,智能手机和平

板电脑作为一类功能强大的移动终端,通过丰富多

样的客户端应用(如 apps 等)支持人们的各种需要

(如:开展业务、网上购物、信息搜索、聊天交友、

休闲娱乐等等)。这极大地扩展了企业和个人的计

算触角,深化了社会化商务和移动商务,丰富了数

字化的社会生活。

对管理趋势的影响

大数据时代的管理喻意可以从两个方面来概括,

即:“三个融合”和“三新”。“三个融合”指 IT融合、

内外融合和价值融合。而“三新”则指大数据时代

催生的新模式、新业态和新人群。这两个方面反映

了大数据时代管理理论和实践的变化特征,其中前

者主要体现管理领域和视角上的变化,后者则

主要体现管理主体和方式上的变化。

信息技术融合 信息技术融合(IT 融合)

是指,技术与人们生活和企业运作的密不可分

性。信息技术融合有很多实例和问题,概而言之,

这对管理有两方面的意义:第一,越来越多的

传统企业管理问题已经变成或正在变成数据管

理或信息管理的问题;第二,越来越多的企业

决策已经变成或正在变成基于数据分析的决策。

在企业原先的运营框架中,IT支持、营销、会计、

战略管理、创新可能是不同的职能,但当企业

的活动和事件越来越多地用数据体现时,企业

决策就要基于数据决策。

内外融合 内外融合强调企业外部数据的

重要性。通常,企业关心内部的信息化,如

ERP 关注内部资源的整合,CRM 系统也只是与

客户建立联系,但现在,评论、口碑、商誉、

流言等各类信息都是企业外部数据,而企业还

必须关注,否则很可能会出现企业声誉危机。

所以,企业要关注内部数据与外部数据的融合,

基于内外数据的交互来做决策。用户生成内容

(User Generated Content,UGC)、公共生成内

容(Public Generated Content,PGC)正在发挥

越来越大的作用,影响消费者的购买决策、商

业舆情和企业形象,企业必须对此做出反应。

大数据对企业来讲意味着数据规模超越了企业本身的内部数据,而

是延伸到了企业外部,成为一种社会化的企业数据。每个人作为终

端使用者,既是信息的使用者,又是信息的创造者。全社会的人都

与数据发生关联,在社会活动的各个环节,而不仅仅局限于之前的

某些企业、某些部门职能环节;这是质的变化

040 贰月号 封面文章iManagement

价值融合 价值融合是指,企业因生产产品和提供服务而产生价值,消费者

在使用产品的过程中产生价值。譬如,手机制造商或者电信运营商面临着这种情

况:你生产和销售手机,会获得一些收入;但大量的价值增值并不在手机本身,

而在于顾客如何使用手机。也就是说,生产有形的产品是一种价值,在此基础上

的无形产品(如服务、内容)可能会带来更大的价值增值。所以,企业不但要关

注有形产品,还要关心附加价值,强调服务、内容等等。

新模式 很多企业在探讨大数据背景下如何转型升级的问

题,为了适应大数据的挑战会产生许多新模式,比如O2O(online

to offline,线上线下结合的商业模式)。像线下实体电器卖场,

为了适应变化要做线上电子商务平台、进行了线上线下同价、

线上定购线下提货的尝试等。而线上商城为了保证时令产品及

时到达顾客手中,就会租线下仓库、打通物流的上下游等。这

并不意味着某些公司会消失,只是企业模式会发生改变。因为

大数据情景强调企业外部知识,用户体验更重要也更丰富,比

如虚拟体验、实体体验和线上线下融合的体验。企业内部也要

有新模式。因为数据管理和基于数据分析的决策对企业越来

越重要,企业要重点增强的一个核心能力就是深度业务分析

(Business Analytics, BA)能力,而这个能力的很多方面来自商务智能和数据挖

掘技术。这种分析是有深度的、严谨的,可以辅助企业在变化的环境中做出更好

的决策。

新业态 赛博空间(Cyberspace)和众包(Crowdsourcing)、数据产业等都

是相关的新业态。以前我们可能在休息的时候玩一会儿游戏,但现在有很多人生

活在赛博空间的虚拟现实中。对有些人来讲,赛博空间是他们的“第二生活(Second

Life)”,而对另一些人来讲甚至是“第一生活”空间。他们长期生活在其中,心理、

行为可能会发生变化,也会产生一些商业机会。很多企业的主要业务就是满足这

类虚拟需求的,比如说卖秘籍的,卖虚拟装备的,卖虚拟币的。虽然人们在观念

认同上可能存在差异,但在这种新业态上确实产生了年销售额非常可观的企业。

众包是企业外部的大众为企业出创意、做设计等工作,这种新型生产组织形式还

未得到企业的足够重视,其潜力不应被低估。此外,云计算和大数据应用需要新

升级和转型成为一种必然。根据

数据密集型业务的特点,升级需

要更精细化的管理,更好地了解

客户(如:客户特征和细分、客

户行为和粘性、客户喜好和新需

求等)、更好地了解业务(如:

业务活动轨迹、 产品体验与口碑、

业务关联与因果分析等)、更好

地了解对手和伙伴(如:行业动

态与趋势、对手优势特征等)

0412014/02www.ManaMaga.com

41

责任编辑:闫敏 [email protected]

型数据平台和资源虚拟整合优化,所以数据中心产

业会兴起,这会涉及很具体的产业政策、宏观环境

等整个生态系统。

新人群 很多中老年人从 1970 年代开始学习信

息处理,应该算是信息社会的“移民”,但是现在

两三岁的儿童都能对 iPad 上瘾,是信息社会的“原

住民”。虽然从年龄上来看,在岁数上差一代两代,

但在技术进化来看,可能跨了很多代,中间隔着处

于各种技术代的人群。如果企业的员工、客户都是

这些信息社会的新生代或原住民了,那么组织行为、

绩效管理、KPI、企业文化、客户关系管理都要发生

改变。举例来说,和这些人沟通,除了面谈、聚会之外,

微信、QQ 成了更重要的沟通方式;而与老客户老员

工沟通,可能还是要采取传统套路。

BA 将成企业关键能力

面向大数据机遇和挑战的应对策略是进行长期

部署和短期规划,一步一步走。从长期来看,大数

据的影响是深刻的。但眼下对企业而言,应对大数

据的第一步是构建 BA 能力。

BA 能力是企业具有的进行数据运作和深度业务

分析的能力。以移动通讯行业为例,一方面面临语

音应用饱和、传统业务单位效益下降等压力;另一

方面也面临着移动互联网、内容经营和信息消费的

替代性和多元化服务等压力。升级和转型成为一种

必然。根据数据密集型业务的特点,升级需要更精

细化的管理,更好地了解客户(如:客户特征和细分、

客户行为和粘性、客户喜好和新需求等)、更好地

了解业务(如:业务活动轨迹、 产品体验与口碑、

业务关联与因果分析等)、更好地了解对手和伙伴

(如:行业动态与趋势、对手优势特征等)。而转

型需要更创新性的思路,如通过内容服务和新业务

平台(双边市场、LBS 服务、长尾经营(如:手机

阅读、音乐平台)、营销平台等),进行必要的模

式创新和业务重组。其中,不管是在内部运作和管

理还是外向扩展和创新方面,BA 能力发挥着关键作

用。此外,银行业也是数据密集型行业。在我国也

不乏运用 BA 技术构建竞争优势的例子(如:通过

分析客户行为和业务的关系,获取新的客户群,设

计新产品和竞争策略)。在电子商务和信息消费领域,

BA 能力作为重要的业务要素和竞争能力,在产品推

荐、消费者行为分析、创新设计、社会化媒体应用、

企业舆情预警、信息搜索服务、潜在模式辨识等方

面的作用更是举足轻重。

最后,值得一提的是,BA 能力建设仍然是一个

较为长期的任务,又是需要及时着手布局和长远规

划的任务。这涉及到业务理念、战略思维、团队建

设和知识储备。此外, 在大数据“热度”下,企业

的敏捷感测和应对响应是必要的。同时,又需要了

解其概念内涵及其管理喻意,认识到大数据只是这

种“数据商务”(数据运作和基于数据分析的管理

决策)发展趋势中的一个时代节点。随着这种趋势

走向的深化,概念内涵和管理喻意也会以不同时代

形态和节点特征丰富和发展,而 BA 能力的重要性

将日趋体现。 (本文根据采访整理,经作者确认)