封面
版权信息
自序
在麻瓜和魔法师之间作出选择
什么样的人才能在下一个时代生存和发展
用数据说话,做最棒的魔法师
作出让世界尊重的原始创新
Part1 大数据时代,用数据说话
01 从万物皆数到万事皆数
主动或被动,我们都是数据贡献者
一切都被记录,一切都被分析
四大方面,让数据指数级增长
02 从十数九表到数态万千
结构化数据
非结构化数据
03 从隔水相望到阡陌交通
地点数据
个人数据
数据与数据,1+1远大于2
04 大数据驱动新工业革命
计算:第三次工业革命的新能源
数据:第三次工业革命的新材料
证析:第三次工业革命的先进工艺技术
个性化:大数据时代最显著的商业特征
Part2 大数据1.0:分析
05 统计呈现洞见
抓出非法的MCC套用
打击“电老鼠”
“抓获”过度医疗和骗保行为
识别社交网络中的垃圾用户
新浪微博面临的三大问题
快递员的通话记录蕴藏哪些商机
付费节目点播最多的是什么
06 关联蕴含价值
关联规则挖掘
协同过滤
关联分析是寻找因果关系的利器
07 预测指导决策
点击购买类预测
基于移动轨迹的位置预测
链路预测
大数据预测的主流方法是什么
Part3 大数据2.0:外化
08 寻求外部数据的帮助
从行为数据预测学生考试成绩
从食堂打卡记录中“定位”孤独人群
从社会计量标牌洞察人力资源管理
预测离职率和升职率
行为数据让非法集资无所遁形
09 自身数据的外部价值
45个关键词实时预测流感趋势
阿里巴巴的“淘CPI”指数
10 机器学习,数据外化最神奇的利器
机器学习三板斧1:特征
机器学习三板斧2:模型
机器学习三板斧3:融合
Part4 大数据3.0:集成
11 数据交易:数据资源的汇聚地
科研数据共享
政府数据开放
全国可流通数据的目录体系
12 数据城堡:数据人才的竞技场
Kaggle,数据科学之家
数据城堡,Kaggle模式的中国尝试者
13 创新工厂:数据技术的嘉年华
大数据创业公司的困境
大型传统企业信息化的难题
构建大数据挖掘平台
建设大数据创新工厂
结束语
成为大数据企业
Step 1.全面数据化
Step 2.整理数据资源,建立数据标准,形成管理规范
Step 3.建设数据管理平台
Step 4.建立海量数据的深入分析能力
Step 5.建设外部数据的战略储备
Step 6.建立数据的外部创新能力
Step 7.推动自身数据的开放与共享
Step 8.数据产业的战略投资布局
致谢
更新时间:2019-01-03 01:25:38