2020年12月26日下昼,,,pg电子模拟器2020级商业剖析硕士班学术沙龙委员会举行了本学期第五期学术沙龙活动,,,活动幸运约请到北京大学国家生长研究院统计学副教授张俊妮教授,,,为同砚们带来了主题为“商务剖析中的因果推断”的学术分享。。。。
一、为什么因果推断对商务剖析而言主要??
张俊妮教授提到因果推断的洞察力可以资助识别客户的痛点,,,为产品开发提供信息,,,并提供更个性化的体验。。。。例如我们知道用户提交客户支持通知单是由于对怎样使用新功效不清晰,,,而不是对该功效自己不知足,,,那么我们可以集中精神改善关于怎样使用该功效的相同,,,而不是更新或停用该功效。。。。在更细腻的层面上,,,因果推断使数据科学家和产品剖析师能够凭证视察数据回覆因果问题,,,尤其是当A/B测试不可能时,,,或者从设计优异的实验中获得更多的看法。。。。她以Uber作为例子,,,指出在高条理上,,,因果推断资助我们在Uber平台上为客户提供更好的用户体验。。。。

二、怎样剖析基于视察性研究获得的数据??
在现实生涯中,,,许多时间我们是基于视察性研究获得的数据。。。。视察性研究(Observational Study)是指研究工具属于处理组照旧控制组不是由随机化而定的,,,研究者在自然状态下对研究工具的特征举行视察、纪录。。。。因此,,,相比于随机试验,,,我们不可基于处理变量对视察性数据直接划分为视察组和处理组,,,来研究因果效应。。。。针对视察性研究的因果推断要领包括倾向分要领、断点回归、双重差分、工具变量等差别的要领。。。。其中,,,张教授向我们重点介绍了倾向分要领。。。。

三、怎样使用倾向分要领剖析视察性数据??
张教授介绍倾向分是给定已视察的自变量,,,个体属于处理组的概率。。。。对处理分配机制的要害假设是给定已视察的自变量,,,个体属于处理组照旧控制组不依赖潜在效果。。。。倾向分将多维的自变量总结成了一维,,,很容易凭证它对自变量举行匹配或分层(stratification),,,使视察性数据看起来像通过随机实验获得的数据。。。。接下来,,,张先生以某大型多玩家在线角色饰演游戏的数据作为例子。。。。其中处理变量为有没有朋侪一起玩,,,效果变量是在处理时点之后某段时期内有现金消耗,,,使用倾向分要领匹配处理组和控制组后,,,剖析处理组和控制组的消耗金额引出响应的因果效应大。。。。,,从而得出对营业改善有启发的改善。。。。

四、随机实验的主要性
最后,,,张俊妮教授再次提到随机实验的主要性,,,她说由于在现实生涯中有太多混淆因素,,,且视察性研究的因果推断要领未必能去掉混淆因素的影响,,,因此需要使用随机实验来解决。。。。而A/B测试是最简朴的单因素实验设计,,,她提到更好的实验设计是,,,同时思量多个因素,,,并寻找它们最好的组合。。。。

嘉宾简介:张俊妮教授是北京大学国家生长研究院统计学副教授,,,2002年于美国哈佛大学取得统计学博士学位。。。。她曾担当pg电子模拟器助理教授、副教授、北京大学商务智能研究中心副主任、pg电子模拟器责任与社会价值中心副主任,,,曾获北京大学立项课本奖励、北京大学优异班主任奖励及北京大学教学优异奖。。。。张俊妮教授的研究领域主要包括贝叶斯生齿统计学、因果推断、数据与文本挖掘,,,在Journal of the American Statistical Association, Journal ofEducational and Behavioral Statistics, Statistica Sinica, ComputationalStatistics and Data Analysis, Journal of Chemical Physics, 治理天下, 经济学季刊等海内外刊物上揭晓多篇文章。。。。