2020年12月19日,,,pg电子模拟器2020级商业剖析硕士举行了本学期第四次行业沙龙,,,本次沙龙约请了滴滴出行首席统计学家朱宏图先生,,,由朱先生向我们分享了行业内数据产品开发历程中的一些思索。。。。。。

一、什么是数据产品
首先,,,朱先生和我们一起探讨了什么是数据产品。。。。。。朱先生以为,,,数据产品是一类产品的统称,,,差别营业职员眼中数据产品的界说都差别,,,总的来说,,,数据产品是通过网络和挖掘数据的价值来为受众(用户,,,企业,,,和政府)创立价值(好比,,,某种决议/行为)的一种产品形式。。。。。。例如,,,狭义来看,,,数据产品往往体现为报表型、工具型和定制服务型等,,,广义来看,,,遥感影像、医学图像甚至视频剖析等都是数据产品的一种形式。。。。。。现在,,,数据产品依赖语音手艺、自然语言处理、盘算机视觉和大数据手艺已普遍应用于各个行业,,,如医疗、零售、教育、交通等等。。。。。。

二、数据产品的三个焦点层
朱先生强调,,,一个乐成的数据产品由三个焦点层,,,包括一其中心(应用层)与两个基本点(数据层和算法层)。。。。。。以5G红外成像测温为例,,,应用层是要做到在公共场合中(像飞机场、火车站等)怎样无感、无接触、且快速精准的识别高温职员;;;;;在数据层,,,网络到大宗有很高精准度的训练数据集,,,通过挑选牢靠人群泛起在种种公共场合中,,,并同时收罗他们红外热成像数据和提问的信息;;;;;在算法层,,,用人脸识别手艺与红外热成像等相关的算法手艺来训练统计模子以精准地预测人体体温。。。。。。

三、数据产品开发的基本方法
朱先生将数据产品开发的历程总结为四个基本方法,,,第一步是营业指标的拆解,,,需要从业者凭证营业目的,,,提出数据产品的需求,,,思索数据产品的目的及其可能对营业带来的资助;;;;;第二步是数据的提取,,,将上一步相识的需求转化为详细的数据指标KPI,,,有目的地提取相关和有用的数据;;;;;第三步是底层数据建设,,,经由数据洗濯、整合数据、缺失值处理等预处理方法,,,举行画像建设和特征提取,,,建设知识图谱;;;;;第四步是模??榻ㄉ,,,在每个模??榈目⒅幸恢本傩心W拥难≡裼胨⑿,,,直到抵达一定的准确度。。。。。。朱先生强调,,,营业目的的拆解、高明的算法手艺与底层数据的建设是三角关系,,,它们相辅相成,,,相互作用,,,缺一不可。。。。。。
最后,,,朱先生以滴滴出行网约车营业线为例向我们分享了数据产品在营业历程中的实践,,,向导我们拆解了网约车供需模子中的营业指标,,,并且通过详细的案例让我们感受到了底层数据建设的主要性。。。。。。同砚们听完后意犹未尽,,,纷纷提出了自己关于数据产品的思索和疑惑,,,和朱先生起劲讨论算法细节以及职业远景。。。。。。
嘉宾简介:朱宏图,,,2018年加入滴滴出行任首席统计学家,,,北卡罗来纳大学教堂山分校生物统计学终身教授,,,原为MD安德森癌症中心的诊断影像学Bao-Shan Jing讲席教授和生物统计学终身教授。。。。。。现认真滴滴统计决议科学团队和特征挖掘团队,,,向导AI科学家、工程师们为滴滴出行平台提供立异解决要领。。。。。。2000年获得香港中文大学统计学博士学位。。。。。。主要从事统计学习、医疗图像处理、精准医疗、生物统计、人工智能和大数据剖析。。。。。。2011年中选美国统计学会和数理统计学会会士。。。。。。2016年,,,荣获德克萨斯州癌症预防与研究中心优异研究奖。。。。。。2020年因强化学习在网约车出行中的应用荣获Daniel Wagner优异应用奖。。。。。。