——专访北pg电子模拟器商务统计与经济计量系主任、教授,,,,,,“狗熊会”首创人王汉生

王汉生,,,,,,pg电子模拟器商务统计与经济计量系系主任、教授、博士生导师,,,,,,现兼任北京大学商务智能研究中心主任,,,,,,曾任嘉茂荣聘教授(2014-2015),,,,,,蓝天环保讲席教授(2015-2016)。。。他照旧微信公众号“狗熊会”首创人、美国统计学会Fellow(2014)、国家优异青年基金获得者(2016)。。。
张无忌更爱谁??AlphaGo怎样学习打麻将??《琅琊榜》是怎样写就的??透过数据剖析的视角,,,,,,这些家长里短的话题摇身一变,,,,,,进入了pg电子模拟器商务统计与经济计量系主任王汉生教授的新书《数据头脑》中,,,,,,折射出关于商业价值的点点思索,,,,,,通俗又不失深刻。。。王汉生教授的新书将在外人看来有些高深莫测的“数据”扎实落地,,,,,,连系电商、征信、车联网、物联网、互联网广告等各行业的富厚案例,,,,,,通过结构化数据、图像、文本等多样的数据类型,,,,,,由点及面,,,,,,由浅入深地解答商业数据剖析的基本问题,,,,,,通过数据头脑的运用去挖掘商业价值。。。
正如百分点集团董事长及CEO苏萌在《数据头脑》的序言中所言“机械头脑带来了工业革命,,,,,,数据头脑则引爆智能革命。。。”天下瞬息万变,,,,,,智能化时代即将到来,,,,,,而企业未来要想获得长足生长,,,,,,数据头脑的应用应当是一个要害。。。王汉生教授及他的“狗熊会”希望通过自身起劲为当今企业治理者和相关行业从业者带来一些启示。。。

“狗熊”们的智慧与汗水
他有着众多令人仰慕的头衔——教授、学者、博导、专家……但与这些“高峻上”的头衔有些“反差萌”的是王汉生教授另一个广为人知的身份——“狗熊会”里的“熊大”。。。
“狗熊会”的雏形是王汉生教授和学生组织的大数据讨论组,,,,,,随着讨论组的影响力一直扩大,,,,,,加入人数越来越多,,,,,,2013年11月,,,,,,“狗熊会”微信公众号正式建设,,,,,,生长至今已有四万余名关注者,,,,,,成为百家争鸣的数据剖析前沿平台。。。教授、博士生、MBA学生、本硕同砚以及企业治理者都能在这里找到一席之地,,,,,,让研究和实践擦出火花,,,,,,迸发将数据转化为价值的灵感。。。
王汉生教授介绍说“狗熊会”以“聚数据英才,,,,,,助工业振兴”为使命。。。为了包管这个平台有牢靠且高质量的产出,,,,,,王汉生教授在“狗熊会”建设之初就招呼数位对数据研究有热情的先生成为精品案例组的组长,,,,,,向导同砚们一起举行案例开发和数据科学科普。。。他们从业界寻找数据科学的现实问题,,,,,,并试图寻找解决这些问题的可行途径,,,,,,在此历程中便逐渐积累起一批翔实的数据剖析案例。。。
而作为一名抱有理想主义的先生,,,,,,王汉生教授也想通过“狗熊会”为更多对数据感兴趣的人们提供一个学习平台,,,,,,转达数据头脑,,,,,,汇聚智慧实力。。。因此,,,,,,从今年最先,,,,,,“狗熊会”开启了线上“人才妄想”,,,,,,“报名火热水平凌驾了我的预期,,,,,,现在第二期报名人数已经凌驾三百多,,,,,,竟然尚有来自外洋院校的同砚。。。”王汉生教授介绍说,,,,,,“人才妄想”提供极为严苛和高强度的数据剖析相关训练,,,,,,为期一个月的学习,,,,,,同砚们要自己学会装置R语言软件,,,,,,下载数据包,,,,,,学会获取数据,,,,,,并将原理运用于数据剖析中,,,,,,两三天就要完成一个使命,,,,,,偷懒一次便会被镌汰……王汉生教授强调他拒绝回覆简朴的问题,,,,,,他勉励同砚们自由、自动地探索。。。“全靠他们自己往上爬,,,,,,我只给他们递绳子。。。”因此,,,,,,“人才妄想”对同砚们身心素质要求极高,,,,,,“千淘万漉虽辛勤,,,,,,吹尽狂沙始到金。。。”最后能坚持下来的学员一定有着过人之处,,,,,,他们也成为“狗熊会”案例研究的中坚实力。。。
“狗熊会”的成员们总是戏称自己为“熊孩子”,,,,,,他们代表着好奇心、倾覆性和创立力。。。他们因对数据的热爱和兴趣群集在一起,,,,,,一次次地面临挑战和品评,,,,,,又一次次地收获前进与惊喜,,,,,,最终将效果凝聚为由程序、语音、视频、PPT组成的一个个生动的教学案例。。。
随后,,,,,,这些案例最先了商业化,,,,,,并借此获得了更大的影响力。。。经由几番探索,,,,,,现在狗熊会的精品案例以会员制的形式对外提供,,,,,,分为机构版和简化后的个人版。。。或许10所学校引入了案例举行教学,,,,,,尚有不少个人订阅者。。。
在狗熊会平台有了相当的沉淀之后,,,,,,王汉生教授本妄想将内容举行整合,,,,,,进一步成为数据剖析的课本,,,,,,在编辑的历程中,,,,,,却发明内容更适于通俗阅读,,,,,,于是就有了图文并茂的《数据头脑》一书,,,,,,它既不限于历史文献,,,,,,也不囿于数学公式,,,,,,而是使用“狗熊会”积淀的精品案例用滑稽生动的语言将“数据”请下神坛,,,,,,与这个精彩的天下打成一片。。。
数据提炼价值,,,,,,头脑毗连实践
在数据工业蒸蒸日上的今天,,,,,,“狗熊会”和《数据头脑》都是王汉生教授教授将数据与商业连系的实践。。。大数据的研究和商业化实验正在快速积累,,,,,,作为在领域里恒久耕作的学者,,,,,,王汉生教授有着亲自体会和独到看法,,,,,,他的履历也正在社会上掀起更大的波涛。。。
数据不但是数字,,,,,,文本、视频、图像,,,,,,通常可纪录的即数据。。。随着科技立异,,,,,,能够获取的数据越发多元,,,,,,数据量级的增添也扩展了应用的可能性,,,,,,因此数据剖析也是时代性议题。。。亚马逊前任首席科学家Andreas Weigend说“数据是新的石油”,,,,,,从数据中提炼商业价值是这个时代的机缘和挑战。。。
怎样将数据转化为商业价值??王汉生教授介绍说,,,,,,首先是要将营业问题转化为可用数据剖析的问题,,,,,,要实现这一点,,,,,,就需要将回归剖析的要领论贯彻到组织的每一个人中去,,,,,,就需要数据头脑。。。这是《数据头脑》讨论的焦点。。。王汉生教授给我们举了一个简朴的案例:某企业有一百多辆大卡车,,,,,,每个车上都装有车联网的装备,,,,,,收罗到大宗的数据。。。治理者想通过这个数据改善公司驾驶员的驾驶行为,,,,,,这即是一个营业问题。。;;;毓槠饰龅耐纺苑绞骄褪撬妓髟趺窗颜飧鲇滴侍饽鸪梢桓鍪菘善饰鑫侍狻。。数据剖析简朴来讲就是要把X、Y变量说清晰,,,,,,如违章纪录、油耗、司机驾龄、车型、路段等,,,,,,建设数据剖析的使命,,,,,,剖析相关性。。。这时,整个的营业问题就已经酿成一个可执行的数据剖析问题了,,,,,,便有了突破口。。。
工业中,,,,,,最早切入数据剖析的是电商,,,,,,然而,,,,,,受限于强烈竞争,,,,,,这个领域并没有形成自力的数据剖析企业。。;;;チ,,,,,,个性化推荐也通过数据剖析实现了营业上的优化。。。王汉生教授以为,,,,,,在古板行业,,,,,,征信、金融、包管、汽车等数据剖析可以有差别的应用场景,,,,,,且市场规模能够支持自力的数据剖析企业,,,,,,是数据工业的向阳所在。。。
那数据剖析的商业价值又体现在哪些方面呢??王汉生教授总结了三个典范要素:一是提高收入,,,,,,二是降低本钱,,,,,,三是降低风险。。。另外要实现它的价值还需要一个可量化的参照系。。。因此,,,,,,许多首创数据企业的产品虽然炫酷但却少有人买单的基础即是无法知足这三个要素,,,,,,缺乏商业价值。。。虽然整体上行业的竞争名堂尚未确定,,,,,,州产品要履历一个大浪淘沙的历程。。。但“预测禁绝是常态,,,,,,预测准确是失常”,,,,,,数据型企业并非要一味追求准确和完善,,,,,,而脱离了实现商业价值。。。生长数据产品的基础矛盾是商业情形的不确定性和预测的精度要求。。。这时间,,,,,,无妨留有余地举行迭代,,,,,,而通过产品立异解决不完善的问题。。。他举了Farecast的例子,,,,,,这是一个预测机票波动来资助旅客优化的模子,,,,,,平均可以镌汰20%的本钱。。。虽然关于每个个体来说模子未必有用,,,,,,但只要样本足够大,,,,,,企业就可以疏散风险,,,,,,实现商业价值,,,,,,抵达共赢的效果。。。
从专业的角度,,,,,,王汉生教授普遍接触业界,,,,,,与不少数据剖析企业都有一手的接触和相助。。。这些履历让他相信,,,,,,只要有敏锐的商业直觉,,,,,,行之有用的数据产品终会泛起。。。不但云云,,,,,,数据剖析的未来也会是多元化生长,,,,,,将在差别工业的应用中爆发更多的可能性。。。好比,,,,,,文天职析可以进入IP定价,,,,,,进入文学和历史,,,,,,“也许一最先我们做的事情看起来特殊无邪,,,,,,可是我以为只要有趣就好,,,,,,深入做多了可能就有意义了,,,,,,就找到蹊径了。。。”
陪同中国数据工业一起生长
1998年王汉生从北京大学概率统计专业结业,,,,,,后赴美国威斯康辛大学攻读博士学位,,,,,,之后在美国的研究机构任统计师。。。抱有教育理想的他厥后选择回到母校,,,,,,到pg电子模拟器治理学院任教,,,,,,继续从事数据统计相关的研究。。。而随着大数据工业的兴起,,,,,,统计学拥有了更为辽阔的舞台,,,,,,王汉生教授得益于自身深挚的学术积累和辽阔的视野平台,,,,,,在数据剖析这一领域一直深耕。。。数年的耕作让他对大数据的运用有着专业的敏锐和卓越的洞见,,,,,,国家工业政策的支持也让他对大数据的远景充满乐观。。。他相信数据剖析能走进越来越多的行业中,,,,,,产品迭代能够创立出更多有用的模子和应用场景。。。
然而,,,,,,他有些担心的是,,,,,,现在大数据的专业研究保存重理论轻实践的倾向,,,,,,没有很好地与工业应用连系,,,,,,因此学术不可很好地施展影响力,,,,,,“我从不嫌疑未来各人会以为统计学的智慧极其主要,,,,,,可是统计学的先生和教授们重不主要那可能就是一个重大的问号了。。。”因此,,,,,,他对自身的角色、定位有着差别的看法。。。作为锐意立异的学者,,,,,,他以为,,,,,,关于学者的评价不应囿于揭晓几多文章,,,,,,对社会的孝顺才是最主要的权衡指标。。。要从对业界、对社会的孝顺这一角度出发,,,,,,一名学者就需要对商业、社会的生长有清晰的思绪和独到的判断,,,,,,学术研究就需要瞄准实践中的现实问题,,,,,,以创立价值为导向。。。作为一名西席应该架一座桥,,,,,,教书育人,,,,,,买通学术能力和营业能力对接、联系、强化的平台,,,,,,作育未来的首脑。。。
对教育抱有理想,,,,,,对数据工业的生长抱有使命感,,,,,,王汉生教授对团队提出了口号,,,,,,要“陪同着中国数据工业一起生长”。。。他打造的“狗熊会”,,,,,,教过的学生,,,,,,写过的案例和素材,,,,,,相助的企业……这些都在潜移默化地资助数据剖析与商业价值对接。。。《数据头脑》一书也是这个目的的一部分,,,,,,将数据剖析能力推向一个更大的平台,,,,,,让数据头脑走向公共,,,,,,这既是时势所趋,,,,,,也是时代生长的先决条件。。。