BIMBA

新闻中心

【BiMBA公开课】“大数据” 孤军难奋战,亟待跨界人才“火星救援”


相关附件:
  • 136024005
  • 4624340

    什么是大数据分析?它需要哪些技能?该行业的市场前景和人才缺口有多大?12月17日,北大国发院高管培训模块课“营销3.0”的课堂上,来自美国硅谷的董晓静教授通过分享众多名企案例,结合自身经历,向学员们深入浅出地介绍了相关知识。

    董晓静是美国名校——圣塔克拉拉大学利威商学院市场营销系终身教授,该校商业分析硕士学位总监。她本科毕业于清华大学土木工程系,硕士就读于麻省理工学院,博士毕业于美国西北大学。其科研和教学方向是大数据及其在市场营销和商业决策中的应用,曾与世界多家公司合作,指导数据营销。本次课堂也成就了学员们跟董老师亲密交流的机会。

    大数据更重要的是人的分析和判断“大数据分析是用数据帮你做决策。”董老师开门见山地指出了大数据的定义。在没有“大数据”这个词之前,人们也要做很多决策,这时就不一定靠数据,可能凭经验。而现今基本所有的决策都要用数据来帮忙做,怎样才能实现呢?

    如果只会数据分析,包括统计、计算机编程,并不够。大数据真正的含义是,你不只会统计学模型或者计算机编程的基本技能,更重要的是作为人,我们理解计算机出来的结果是什么意思,怎样得出的这个结果,输入是什么,为什么要用这个模型,等等。这些不能依赖计算机,都要通过人来分析和决策。
     
    例如预测哪些因素影响销售,现有统计学的方法,可以把所有因素都输入计算机,不管是20个变量还是200个变量,计算机可剔除掉没有显著相关性的因素,帮你选出50个有用的因素,然后产生一个模型,就是你预测销售的模型。

    但是这可能会出问题。有时计算机会告诉你价格是没用的,因为根据统计学一算,价格作为变量对销量没影响,计算机就把它扔掉了。你觉得你应该扔掉价格吗?肯定不行。究竟哪些因素会影响销售,是任何数据方法都不能解决的,必须依靠人的经验判断。这是现在大数据分析经常被忽略的。

    要避免盲目分析,须了解公司运营在硅谷,有不少公司基于大数据分析而成立,创始人多是搞工程或计算机出身,其中最著名的是Facebook、LinkedIn、亚马逊、Google,合称“FLAG”。

    拿亚马逊来说,1996年成立时,它本是一家零售商,后来卖书。渐渐它发现它的价值不在于卖多少东西,而在于它有多少数据,所以它就雇佣了很多搞计算机和统计的人。“现在亚马逊慢慢意识到一个瓶颈,这些人虽然可以帮我解决问题——我给他问题,他能帮我解决——但是谁来决定他们应该解决什么问题?”

    每一个公司要想发展,有成千上万个问题。任何一个问题都可以找一堆工程师来解决,但是到底该让他们解决哪个问题?这就需要懂公司、懂商业管理的人才。

    “我认识一个硅谷的人,在一家名叫EA的游戏软件公司工作,他们团队里有一个统计系毕业的博士,在EA工作了很多年。”董老师说,有一次,这位博士通过公司收集的数据做了一个模型。大家都知道,游戏过一段时间就出新的版本和玩法,让玩家不断掏钱。如果游戏很短的时间就更新,玩家可能会因为要花的钱太多或者不适应新版本,而放弃玩这款游戏;如果游戏太长时间不更新,玩家可能会因为失去新鲜感而转投别款游戏。博士基于这点考虑做了这个模型,可以精确地计算出,第一个版本出来后,应该等多长时间再出第二个版本,会从玩家身上获得最大收益。

    故事的结局出乎意料,这个硅谷的人看完模型直接把博士解雇了,理由是:“你在我们公司做这么久了,连公司到底想做什么都不了解。”

    原来,在EA,游戏升级时间从来不看玩家,而是软件工程师只要把新版本写完了,测试过了,都准备好了就开卖。不可能按照模型说的,多等几十天——几十个软件工程师10天什么也不干,公司根本负担不起。换句话说,你的模型再复杂,方法再前端,你解决的问题对我公司没价值,那这个人对我公司就没意义。

    大数据亟需跨专业人才全球最著名的管理咨询公司——麦肯锡公司在2008年给出了一篇关于数据分析人才缺口的报告,指出到2018年,真正可以应聘数据分析职位的人要比市场需求量少14万—19万。而像前面提到的,既懂大数据分析,又懂商业管理的人才,缺口达到150万。这完全是跨学科、跨领域的,对人才的要求高很多。

    董老师说:“我当年考大学时,我妈说上商学院,女生上商学院比较好。我说商学院的人不搞数学,我从小数学好,商学院什么也学不到,我要上工程学院。所以我本科读了清华大学的土木工程专业。但现在,社会要求你双方面的技能都要有,既要有传统的工程学院或科学院方面的能力,如统计、计算机方面的知识,同时也要了解其他领域的基本概念。”

    大数据主要研究人产生的数据大数据分析有两种,一种是用计算机或机器生成的大数据。像飞机上有很多传感器,监测引擎运转是否正常。传感器会实时发回数据,这些数据应该保持在一定范围内;如果波动超过正常值,就表示有异常情况,马上就能发现。

    大数据在此用处非常大。以前飞机发动机维修是每周小修一次,每月大修一次。现在看数据就行了,出现问题再去修,节省了很多维护的费用。

    大数据分析的第二种是人产生的数据。人就是用户、客户。比方说,客户在我这个网站上做了任何事情,在这个网页上看了什么,另一个网页上看了什么,我都能看到。有的公司通过手机监控用户,你一进到商场里面,就可通过你的手机定位你什么时间、在什么地方停留多久,这就是人产生的数据。

    人产生的数据比较复杂,机器产生的数据有正常值和波动范围,但是人的行为没有正常值,各种各样的行为都可能是正常的。所以今天我们做的大数据分析,主要还是对人产生的数据分析。

    经济学能弥补统计学分析的不足做大数据分析主要需要三方面的技能,一是计算机编程,二是统计学,三是本行业的知识,该领域商业运行的模式和需求。

    大数据分析在不同公司不同阶段,发展程度不一样。发展最深的是Google、Facebook等,这些公司的创始人都是软件工程师,所以他们在大数据方面走在别人前面。

    拿Google来说,在它之前根本没有线上搜索产业,它靠大数据分析建立起搜索产业,并直接挂钩于广告。如今,Google意识到只靠懂大数据分析的人不够,又招聘了很多学经济学的人。因为Google分析的都是人产生的数据,仅靠统计学分析有局限性。统计学开创之初就不是研究人的,而是庄稼。

    1922年,现代统计学的奠基人之一费希尔(R. A. Fisher)发表关于种子的研究结果,奠定了现代统计学的理论基础。庄稼的活动指标是有规律可循的,但人跟庄稼不可同日而语。

    董老师列举了一个案例,在美国沃尔玛超市,啤酒和尿布赫然摆在一起出售,这个奇怪的举措却使两者的销量都增加了。

    “为什么会这样?有人说是因为爸爸去给孩子买尿布,为了犒劳自己,所以买啤酒。这其实不是靠大数据分析出来的。当然,也有人说这个故事是超市编造的噱头。且不管这个故事到底怎么出来的,关键是你要分析为什么会导致这种现象。

    你如果理解为什么能导致这种现象,你就可能找到影响其它商品销售的因素。沃尔玛一个店有3000多个品类,除了啤酒和尿布,还有没有别的两种产品是能放在一起卖的?该样本是否具有可推广性?这都需要充分的分析。”所有做分析的都是样本,这个样本在这里适用,在别的地方不一定适用。如果不理解数据背后真正的含义以及深层次的原因,就没办法推广到别处。

    作者:宋向明  


    分享到: