7

COS 访谈第 8 期:北大光华王汉生老师

 3 years ago
source link: https://cosx.org/2013/09/data-sciencs-series-interview-of-wanghansheng/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

COS 访谈第 8 期:北大光华王汉生老师

王汉生 / 陈昱

关键词:COS 访谈; 数据科学; 统计之都

受访人:北大光华王汉生教授;采访人:陈昱

简介:王汉生教授现任北京大学光华管理学院商务统计与经济计量系副系主任。1998 年北京大学数学科学学院,概率统计系,统计学本科,2001 年美国威斯康星大学麦迪逊分校,统计学博士。现为国际统计协会 (International Statistical Institute)、美国统计学会(American Statistical Association)、美国数理统计协会(Institute of Mathematical Statistics)、英国皇家统计协会(Royal Statistical Society),以及泛华统计学会(International Chinese Statistical Association) 会员。

2013 年 9 月 23 日,在结束了 “狗熊会” 的每周一聚后,王汉生老师在他的办公室接受了统计之都的采访。

注:关于 “狗熊会” 请点击这里

一、您觉得统计学最好玩的是什么问题?

我觉得最好玩的还是分析数据,就像今天我们看到的可视化数据(上午袁晓如教授向狗熊会展示了一些数据可视化技术),从数据到结果之间的过程,我觉得这是比较好玩的。

二、据说您本科毕业后三年威斯康辛博士毕业,有啥秘籍么?

三年毕业,没有啥秘籍!是这样的:博士一般有四年毕业,因为你有一年要在找论文,找 topic,实际上这是比较痛苦的过程,我的 topic 是我的导师——他是 too nice——帮我定义好了一个数学问题,那就是做一份家庭作业,就是稍微大一点的家庭作业,所以没有啥秘籍,就是我的老板 too nice!(王老师的老板 http://www.stat.wisc.edu/~shao/

三、坊间传闻一大波搞 cs 的人觊觎数据分析这块肥肉(如果是的话),您觉得统计学的杀手锏在哪里;或者说找工作时候,学 N 年统计的人怎样露一手就能 beat 掉非统计专业的(或者说非专业统计的)人。

嗯,我觉得计算机跟我们差别还是蛮大的,像今天袁老师来讲这个的话,那在数据的处理能力上和交互式的设计上面肯定人家是专家,肯定 beat 不了,是吧!我们能做的可能就是 model 方面,我们擅长一些 forecast 的东西。还有事我觉得最重要的可能不是 beat 掉计算机的人,是要 beat 掉自己,我们要有业务知识,你得有这个行业知识才行!为什么我们学统计的不好找工作,因为,前面你采集数据、处理数据的能力肯定不如搞计算机的,后面你讲故事、谈业务的能力不如管理专业和营销的,那么两边都挤那就很难受。我觉得一定要有业务知识,懂点业务知识可能会算俩 sample mean,会做俩 linear regression 就搞死一大票人对吧~

四、统计之都的学生读者越来越多了,最近我们也搞了个高校联盟,有三十多位来自五湖四海的学生精英,您能给正在学统计的本科生和硕士博士一些建议么?学术方面的和将来找工作实用方面的都可以。

我没什么特别好的建议,我觉得最重要保持好奇心。我们自己读书读那么多年,还有做研究,其实好多年都是像瞎子一样,不明白自己在干什么,其实仔细想想就是我们做研究,关注的这些题目,表面上看是个人兴趣的结果,其实实际上不是这样的:比方说当年有十个人,每个人的兴趣都非常不一样,然后社会选择了两个方向是重要的,那么就有社会资源投到这两个方向上,后来这两个方向它就成了。从外人的角度来看,这两个人的兴趣选择挺牛的,做成了。实际上不是这样的,是社会选择的结果,那么统计学也一样,社会发展到现在,社会对我们会做什么样的选择,会提出什么样的要求,我觉得就是要保持这样的好奇心,你才知道自己在干什么。我自己对移动互联网啊、电子商务这些感兴趣,我每天早上的习惯就是关注科技和互联网俩频道,那里面哪有和统计学有半点关系,但那里面会告诉我整个行业在怎么发展,他的发展会对统计学产生怎样的可能的影响。然后我才会知道我自己在做的方法可能干什么用,要有这个大地图,这个大地图可能是绝大多数人——包括我们自己——都没有的。我觉得学术方面啊,找工作啊,都是这个好奇心挺重要的。搞明白自己在干啥!

五、您思考过得最难的问题是什么,想了多久?思考人生除外。

最难的问题,就是博士快毕业的时候,不知道自己要去 Industry 还是 Academia,想不明白这个问题,有时候觉得自己在学校里,初中、高中、本科啊、研究生啊,在学校呆很多年了,有时候就想去工业界试试看,有时候也觉得去工业界天天上班,也不是自己想要的。思考了很久,搞不清自己想要干什么。所以后来真正去工业界工作工作了一把才知道 OH MY GOD 那不是我想要干的事情,太安静了,实在不 social,会在公司里面搞死的。

——不过我觉得去公司工作挺好的啊

你去看看就一下就知道了。所以我的博士在他们想正式跟我做研究之前想实习我是鼓励的,去看一看,是不是想要的 life,看一看真是挺好的,也许你去了之后觉得挺好的,就不要来读博士了,搞得脑袋有大,对吧!

六、王老师家小孩儿在上幼儿园吧,有没有把他培养成统计学家的想法?

不想。随他便吧,我不想两个人回家了还要谈论 MLE,那多没意思啊,最好谈点啥别的。

七、 推荐两本书吧!要求,一本统计相关的,一本离统计十万八千里的。

哎呀,和统计学相关的还真没有一本书给我留下特别深的印象——我是指他的思想性不是技术性,所以真没什么。离统计学十万八千里的书…… 可能我不太爱读书——诶对!我比较喜欢读我们前一届院长张维迎老师的书,他的有很多书我没仔细看过,但我看过一本,名字我忘记了,大概是讲信誉的产权基础(《产权、政府与信誉》编者按),他给我一个很深的印象就是我们曾经认为的一个十分个性化的人的道德品质的问题实际上在社会层面是有他的产权基础的,你看到一个人信誉不好,两个人信誉不好,如果是很大比例坏,可能是社会机制出了问题。当然不同学者有不同看法了,但我觉得内个给我一个启发就是:在微观层面看到的问题都是很随机的,但你把他放到宏观层面就能看到一些系统性的东西,思考一些不一样的问题。

八、大家都在谈大数据,也请您这位统计 “大家” 谈谈吧!

我觉得大数据么,就是一个忽悠的名词,我不认为有了这个大数据这个社会会有什么根本性的变化,原来做数据分析的现在还做、将来也做,原来不做数学分析的、现在不做、将来也许会做,但他有一个好处就是会让这个世界如此高度一致的认为数据重要,我觉得这是一个有贡献的地方。如果没有这么一个忽悠的概念,也不会在这么多不同的领域谈同一个事情, 但它也许很快就会过去,但数据分析会永远留下来。

九、最近统计学有没有什么让您特别兴奋的研究动向?

我觉得没什么让我特别兴奋的动向。我觉得我自己研究的这些让我特别兴奋:就是中文文本、社交网络还有轨迹数据。

十、请评价一下统计之都吧!(为了证明小编不是想说 “请您高度赞扬一下统计之都”,请多批评指正)

统计之都就是名字太土了,人都特好!哈哈哈哈哈哈哈……

最后我们在一片欢声笑语中结束了这次愉快的采访。

王汉生教授现任狗熊会会长、北京大学商务智能研究中心主任、北京大学光华管理学院商务统计与经济计量系系主任。现为 ISI, ASA, IMS, RSS, ICSA 会员,ASA 会士 (2014 年 6 月 23 日更新)。王汉生

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

← COS 访谈第 9 期:Hadley Wickham 因果推断简介之八:吸烟是否导致肺癌?Fisher versus Cornfield →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK