- 数据思维:从数据分析到商业价值
- 王汉生编著
- 6115字
- 2024-11-02 22:01:46
数据的商业价值
明白了什么是数据,下面讨论数据的商业价值。不要以为这个问题很简单,只有“填过坑”的小伙伴,才知道这个问题的重要性。只有说清楚了数据的商业价值,客户才容易为数据买单,数据企业才容易产生利润,数据产业中才不会有那么多的困惑。
商业价值三要素
先来思考以下问题:第一,企业靠什么活着?答:收入!即使没有现在的收入,也得有未来可预期的收入。第二,企业为了获得收入,需要做什么?答:支出。支出包括方方面面,如人力、物力、时间、空间等。收入减去支出,就是利润。但是,在资本当道的今天,利润可以暂时是负的,没有问题,因为很多利润为负的企业的估值都非常高。究其原因是大家看好企业未来的利润。第三,没有任何企业对自己未来的收入和支出是100%确定的,因为这里面有很大的不确定性,而不确定性带来的是什么?答:风险。而且企业可能还会涉及一些重大的风险,这些风险所导致的损失是很难用货币计量的。例如,桥梁倒塌、锅炉爆炸。这就是熊大关于数据的商业价值理论框架的三个关键词:收入、支出、风险。任何数据产品,如果可以帮助客户,在这三个方面中的任何一个方面实现可量化的改进,那么这个数据的商业价值就比较容易说清楚,否则非常困难。
收入
从一个数据从业者的角度,可以先检讨一下,你的数据产品能否为客户带来额外的收入。请注意,是“额外”。
例1-1 50碗豆浆的价值
假如客户是卖豆浆的,以前没用你的数据分析,他每天卖100碗。用了你的数据分析后,每天能卖多少呢?如果还是100碗,那么数据分析的价值在哪里?如果是150碗,那么你的价值就体现出来了。这个价值的大小就是额外的50碗豆浆!作为数据分析服务的提供者,是否就可以将这50碗豆浆作为基准进行收费了?
例1-2 最理想的额外收入———新兴市场
最理想的额外收入应该是什么?熊大认为是新兴市场。例如,“五一”小长假,大家要开车出去玩,堵车是必然的,那么能否出一个堵车险?每堵车1分钟,保险公司给你赔付1块钱,补偿一下你那郁闷的心情。看似不错的主意,保险公司为什么不做呢?因为传统的保险公司没有技术手段可以实时监控一辆车的状态。它不知道你是否堵车,更不知道你堵了多久。但是,有了车联网数据,这个故事就改变了。新兴的车联网数据,催生了一种全新的保险产品,带来了一个纯粹增量的新兴市场。
例1-3 百度付费搜索广告
为什么很多广告主对百度的付费搜索广告非常依赖?因为百度的付费搜索广告确实为他们带来了收入的增加。为什么百度可以做到这点?一个最基本的原因是,通过对用户搜索数据的深入分析,理解用户意图,进行精准匹配。所以,对于诸如医疗、教育、电商等行业而言,百度的广告投入能够直接带来销售收入。这就是数据分析的价值:收入!
支出
有朋友说,我们的数据分析距离市场销售端有点远,不能给客户直接增加收入,但是,能给客户节约不必要的支出,也就是成本,你看这样行吗?当然行啊,而且更好!为什么?因为收入的增加往往具有很强的不确定性,但是成本却在自己的预算控制范围内,相对而言更具可控性。
前文提到要开辟一个新兴的堵车保险市场,但是这个新兴的市场到底能带来多少额外的收入呢?非常不确定。再比如说,超市现有100个收银员,但是通过技术改造,数据分析,合理排班,发现80个就可以了。直接节省了20个收银员的人工成本,这是非常确定的事情。因此,如果数据分析可以节省支出,那更好,因为更靠谱、可控性更强!
例1-4 呼叫中心运营改进
呼叫中心最重要的成本是什么?人工坐席成本。如果通过数据分析可以精确把握电话呼入量的规律,就可以合理安排坐席。其中,包括应该安排多少全职坐席、多少兼职坐席。为此,数据分析可以通过研究电话呼入量与星期几的关系、与一天中时间段的关系、与企业重大市场行为的关系,甚至与天气状况、空气污染之间的关系来解决这个问题。如果技术进一步提高,可以通过准确的语音数据分析理解客户意图。那么,这能带来多大的成本节省?是不是人工坐席成本就可以被彻底省略了?这就是数据分析带来的价值。
例1-5 开关车窗电机的设计寿命
我们绝大多数汽车制造的技术标准都是来自欧美国家。这些制造标准都是为欧美的消费者建立的,虽然适合他们的驾乘习惯,却未必适合我们。例如,鉴于国内空气污染的严峻现实,北京司机每天开车窗的次数很少,熊大可能好多天都不开一次。有数据分析表明,平均而言,一个司机一年也就开关车窗1000次左右(平均一天3次)。假设一辆车的设计寿命是10年,那么在车的整个使用生命周期内,也就需要开关车窗10000次。为了保守起见,我们再增加一个量级,那就是10万次。也就是说,从设计的角度,我们只需要一个能够承受10万次开关车窗的电机就可以了。但是,我们的实际设计标准可能是50万次,这是一个多么巨大的设计浪费。中国汽车的产量有多大呢?以上海汽车为例,根据2016年不准确数字,集团整体产量大概是600万辆!还有很多其他汽车制造商。深入的数据分析能够带来多少成本的节省?
例1-6 电视视频接口的调整
有一次参加一家企业的融资发布会,正巧坐在旁边的朋友来自一家国内领先的电视机制造企业,他分享了一个非常有趣的数据价值案例。以前电视机制造出来售卖给消费者后,制造商同消费者之间的关系就中断了,因此,制造商并不非常明确消费者是如何使用电视机的。不过,现在有了物联网技术,制造商可以慢慢地了解消费者的习惯了。例如,他们发现某一款电视机的用户中,只有大概1 %的用户还在使用那种非常老式的、梯形的VGA视频接口。那么,只有这么少的用户在使用这个接口,是否还需要生产、制造、安装这个接口呢?基本不需要。于是在后来批次的电视机生产中,这个接口就被取消了。仅此一项,为企业每年节省的成本有多少?上亿元!这就是数据分析带来的价值。
例1-7 电视机遥控器的改良
如今的电视机遥控器设计得十分复杂,按钮数量繁多,但是我们会使用其中的几个呢?熊大自己看电视,就只需要电源开关,以及频的“+”和“-”,可能还需要一个音量键。其他的按键几乎不用。那么这种设计是不是冗余的?成本是不是可以节省?恐怕不好回答。因为制造商并不明了熊大这样的用户有多少?是非常有代表性,还是有一定代表性但代表性不强,又或者完全没有代表性?类似地,我们还可以检讨,电脑上需要那么多USB接口吗?或者是不够用?现在的台式机、笔记本还需要光驱吗?以前我们很难做这样的决策,因为我们不知道用户如何使用这些设备。但是,现在物联网的兴起让这样的数据分析正在变成现实,这就是物联网数据的商业价值所在。我们期待物联网技术进一步成熟的明天,会给我们带来新的启发,带来更好的设计、更低的成本。
风险
还有朋友说,我的数据产品第一不能增加收入,第二不能直接节省成本,但是可以控制风险,这样的数据有商业价值吗?当然有。事实上,风险的度量有两种情况:第一种情况是风险根本没办法通过货币度量,是独立于收入或者支出的另外一个维度;第二种情况是风险就是连接收入和支出的一个转化器。对风险的把控,或者可以增加收入,或者可以降低成本。
对第一种情况而言,风险可能是人的健康甚至生命。如果有任何一种数据分析,能够改善人们的健康状况,甚至可以挽救生命,它的价值恐怕是不可想象的。从这个角度看,凡是同医疗、健康、生命保障相关的数据分析,都是值得关注的。例如,如果有一种可穿戴设备能够在无创伤的情况下,测量各种血液指标(如血糖),这会为众多的糖尿病患者带来什么样的福音?又例如,通过对人类基因组的数据分析,找到同某种致命癌症强相关的基因,这能否改变病人未来的命运?它的价值又如何?
除了人以外,重大设施设备的风险恐怕也是我们不愿意承担的。如果一座桥梁坍塌,会失去多少生命?一个发射塔发生故障,会不会带来社会的恐慌?一个发电锅炉爆炸,会造成多大的损失?这些都不容易通过货币衡量。但有一点可以确定的是,这都是人们不愿意接受的风险。如果通过数据分析,时刻监控桥梁的状况,及时维修保养,那桥梁坍塌的概率就非常小。如果通过数据分析,及时了解发射塔的工作状况,也许它每年的故障率就会有显著的下降。如果通过探头数据,完全把握发电锅炉的运行状态,就可以避免锅炉爆炸的风险。这就是数据分析带来的价值。
再研究第二种情况。对于这种情况而言,风险同收入和支出之间是可以相互转化的。例如,很多商业银行都有网上申请系统,允许用户通过互联网直接申请信用卡或者其他金融信贷产品。为什么要在网上做?因为流量大、成本低、效率高,但缺点是风险比较大,而且有些通过线下面签才能提供的材料无法获得。怎么办?那就只能提高在线申请的门槛,降低通过率。这样做的优点是什么?安全,把坏人拦在外面,而缺点是“错杀”了很多好人。而好人之于银行就是客户,就是收入。为什么会错杀好人?因为不了解他们,缺乏信任,无法实现风险管控。这是一件非常遗憾的事情。那么机会来了,如果你能够为这家银行提供独特的数据分析,帮助它更加准确地区分哪些线上申请者是好人,哪些是坏人,银行就可以放心大胆地给更多的人发卡放贷,进而增加收入。这样的数据分析,谁能否认它的价值呢?那么这样的价值是如何实现的?主要是通过把控风险提高收入。同时,因为风险把控做得好,坏账率就低,因此还节省了催收成本。这给我们的启示是,对风险的把控还可以转化为对支出的节省。难怪有从业者说,对于消费金融企业而言,风险把控部门做的不仅仅是风险把控,同时还是市场,还是销售。因为风险敞口的控制直接影响市场和销售收入。这样的数据价值是否清晰?所以数据商业价值的第三个关键词是:风险!
政府价值
目前所有的讨论都是偏向企业的。这似乎忽略了数据产业的另外一个极其重要的参与者:政府。政府一方面制定市场规则,另一方面还掌握着巨大的数据资源(公安、通信、医疗等),以及预算。政府的重大决策也非常需要数据的支持。那么,数据之于政府的价值又如何体现呢?非常有趣的是,这个问题似乎也可以从收入、支出、风险三个要素考虑。但是,面向的对象主要不是政府自己,更多的是每一个公民。通俗地讲,如果数据分析能够帮助政府更好地服务社会,让普通公民的收入有所增加,支出有所降低,风险有所规避,这就是数据之于政府的价值。
公民收入
从政府的角度看,哪些方面关乎普通公民的收入呢?例如,增加就业,降低税负,提高福利等,都同增加普通公民的收入相关。更具体地说,比如,通过对招聘广告的文本分析,可以洞察市场需求,并提供相应的教育培训机会,就有可能增加就业,带动GDP。狗熊会媛子小分队曾经做过一个案例,通过对大量招聘广告的文本语义分析,解读市场对各种工作经验的需求,对各种分析技能的渴望,以及在最终薪酬上的表达。通过数据分析,可以量化BAT这样大型互联网公司工作经验在薪酬上的表达;通过数据分析,可以理解产品经理工作年限在薪酬上的体现;通过数据分析,可以理解数据分析师应该具备什么样的编程技巧(如R,python),最好具备什么样的大数据计算能力(如Hadoop,Spark),以及这些专业技能在薪酬上的反映。通过诸如此类的数据分析可以了解市场需要什么样的数据分析人才。从政府的角度,这样的信息对于设计相关学科的发展规划意义重大。相关合理的决策会带来普通公民就业率的增加,进而带来收入的增加。
公民支出
数据分析能否帮助政府科学决策,进而降低普通公民的成本?答:可以。以医保为例,大量的公共资金聚集在一起,但是它的使用效率是否足够高呢?是否还有改进空间?是否存在一定数量的骗保行为?这是非常重要的,因为骗保行为损害的是所有参与医保计划公民的公共利益。骗保行为所带来的后果是公共医疗成本不必要的提高。那么能否通过数据分析将这些骗保行为人自动识别出来,并施以相应的惩罚教育措施呢?再考虑医院,能否通过对医院的各种收入、支出的数据分析,理解普通群众看病贵的根本原因在哪里?昂贵医疗费用所产生的收入到底去了哪些地方?能否进行相关的制度建设?这不仅可以节省群众的医疗成本(节省费用),同时还能增加优秀医生的实际收入(增加收入)。
公民风险
数据分析能否帮助政府进行科学决策,降低普通群众的风险呢?答:可以。任何一个国家的政府所能够支配的社会安全保障资源(如公安民警)是有限的。如何通过对有限的公共安全资源的合理利用,尽可能地保障群众的生命财产安全,这是一个永恒的话题。例如,能否通过对各种公开以及非公开刑侦数据的合理分析,更加准确地锁定吸毒人群,尤其是有重大公共影响力的人群,并实施制止教育措施?能否通过对各种数据的综合分析,做到对恐怖事件的提前预警?能否通过对各种流量数据的监控,做到提前规避一些重大公共安全事件(如踩踏)?这就是数据分析之于政府风险管控的价值。
可以量化的参照系
数据分析的价值体现在三个要素上,但要实现它的价值还需要一个重要的因素:可以量化的参照系。其中包括两个关键词:量化和参照系。
90%?你咋不上天啊?
某天,一朋友说:“熊大,我最近给客户做了一个客户流失预警模型,准确度75%!”我一听,挺靠谱。但是,他却垂头丧气地表示,对方老总很不满意,认为这个准确度太差,连90%都不到!熊大心里倒抽一口凉气,心想:90%,你咋不上天啊!大家是否能意识到困惑在哪里?客户对预测精度没有合理的预期,因为没有合理的参照系。在没有参照系的情况下,客户就只好参照小学生的考试成绩,认为90%甚至99%才算优秀!这就是困惑所在,那么应该怎么做呢?应该给他树立一个合理的参照系。为此,我们可以先弄清楚一个问题:客户在没有你的情况下,自己能做多好?在你到来之前,客户自己是否有流失预警得分,这个得分准确度如何?我们发现,其实很多时候,客户从来没有评价过,自己根本不知道。你帮他看看,十有八九惨不忍睹。这时候你可以这么说:某某总,您看,之前咱们这边的精度是65%,已经做得不错了(夸奖一下对方)。但是,现在咱们双方共同努力,这个精度提高到了75%。为此您可以节省多少不必要的支出,或者增加多少额外的收入,等等。你看,这样是不是就更有说服力?因为你确立了一个可以量化的参照系。而这个参照系就是客户现有的系统。如果没有这个参照系,又想说明75%的精度是有价值的,是不是无比艰难?
有句“名言”:预测不准是常态,预测准确是变态。什么意思?之所以做数据分析,做模型预测,就是因为面对的数据是带有强烈不确定性的。如果一个数据可以被精确预测(例如,今年我30岁,明年一定31岁),这样的数据分析就没有价值了。有价值的数据分析,就是要在不确定性中,尽可能多地发掘价值。因此,预测不准必然是常态。
但是,预测不准(至少达不到100%完美准确),并不代表没有价值。就像前面的案例一样,预测不准的结果可能是有巨大价值的,但是需要找到一个合理的参照系。
例1-8 个性化推荐系统
你做了一个个性化推荐系统(例如图书推荐系统),最后发现转化率是8%,请问:价值何在?如果同线下商店比,8%的转化率是比较低的。这意味着100个客户进入我的店铺,只有8个人下单,剩下的92个人都空手离开。这是一个令人失望的结果。但是,在线上环境中,这就不好说了。从事这行工作的朋友一定知道,8%是一个非常高的数字。为什么?因为如果没有优秀的个性化算法推荐保障,这里的转化率可能是4%,1%,甚至是0%。有了这样一个合理的参照系,数据分析的价值才能够充分表达出来。
温馨提醒:进入狗熊会公众号(CluBear)输入文字:“价值”,听熊大音频!