6

统计之都访谈第 43 期:孤峰顶上求大道,红尘浪里取乾坤 -- 张志华访谈

 2 years ago
source link: https://cosx.org/2022/04/interview-of-zhihua-zhang/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

统计之都访谈第 43 期:孤峰顶上求大道,红尘浪里取乾坤 -- 张志华访谈

关键词:cos 访谈; 统计学; 教育; 发展; 八卦

采访与审校:常象宇、孔令仁、聂宇舟、梁杰昊、向悦、王小宁、魏太云;微信编辑:孔令仁

统计之都编辑部按:张志华老师是北京大学数学科学学院概率统计系和统计中心教授。之前曾经先后任教于浙江大学和上海交通大学,任计算机科学教授。张老师主要从事机器学习、统计和数值计算的交叉学科研究。

本次访谈由统计之都组织。其中,常象宇等主笔采访大纲,孔令仁、聂宇舟、梁杰昊、向悦、王小宁、魏太云于 2022 年 1 月 8 日下午对张志华老师进行面对面采访,常象宇线上接入。为了方便读者阅读,在文字中加了小标题,下面是访谈正文。访谈内容纯属个人观点,不代表任何机构和组织。

张志华老师主页:https://www.math.pku.edu.cn/teachers/zhzhang/

1. 从上交到北大,从计算机到统计

统计之都 :张老师您好,很荣幸再次采访您。上次采访您的时候是 2015 年(COS 访谈第十九期:张志华教授),那时您还在上海交通大学工作。您 2018 年从上交计算机系离开,到北大数学科学学院工作,在很多人看来跨度还是很大的。是什么促使您调到北大工作,并进入概率统计系呢?

张志华 :谢谢统计之都采访!是你们上次的采访把我介绍给中国统计界,让我也有了点小名气。从上交到北大因素比较多,我个人考虑主要有:

第一,当时在上海交大计算机系任教时,有经费考核要求,每个教授每年需要完成一定额度的经费。然而我不太善于社交,申请项目经费能力比较差,不太适应这种比较有狼性的文化。

第二,我曾经在加州大学伯克利分校有学习与工作经历。由于我的合作导师 Michael Jordan 同时是计算机和统计的教授,当时安排我先在计算机系一年,后来又在统计系一年,那个经历对我来说非常的重要。所以我回到国内工作的时候,特别是在浙大和上交工作的时候,虽然我在计算机系,也是非常积极参与两所学校统计学科建设。当时在浙大参与了统计中心的成立,在交大的时候也申请并获批了统计专业的博士生导师。不过,这些都比较务虚。比如在上交由于名额限制,没有指导过统计专业的学生。所以后来有机会到北大统计,选择也是自然而然的,我自己对加入统计还是比较期待的。我还是希望统计和计算机同时有正式职位,这对我和我学生会更有帮助,但国内没有这种合聘机制。

第三,我个人的经历比较丰富,去过很多地方,在很多学校学习与工作过,所以对于这种流动比较习惯,对于多去一个城市及学校感觉也挺好的,希望能多感受不同的文化,接触不同风格同事和学生。其实,我计划今后写一本书,记录我待过的这些学校和交往这些人,甚至书名已经想好了,叫做《我的大学,我的人生》。

统计之都 :您感觉在上交计算机系与在北大概率统计系做研究有何差异呢?

张志华 :因为我在上交和北大的时候已经是教授了,没有晋升压力,也没有其他太多的诉求。所以相对而言,差异没那么大,基本都可以按照自己的意图去做事。而且我在这三所学校包括浙大,比较幸运在教课方面我也比较自由,没有硬性地去安排教什么课,都是可以按照自己的想法和意愿教课。

虽然在授课的自由度方面没有差异,但是文化上还是有所不同的。因为这是:北大 / 上海交大,统计 / 计算机科学。计算机的节奏快、有压力,研究方向更新快,周围的人都是很有狼性,所以你也不能成为羊。反过来,北大统计是在数学学院下,没有计算机的那种需要资源压力,但对于教课比较重视。我在课程教学方面,在北大就比在上海交大和浙大要多一些。

统计之都 :那么您觉得这两种风格各有什么优缺点吗?

张志华 :这个问题很好。当时来北大之前,和 Michael Jordan 教授咨询过。他说,计算机方面的高活跃度不等于是坏事情,因为这种研究可以比较快地迭代。而统计慢一点也有好处,对于基础和理论能更从容地思考,可以做一些更长远的研究。

统计之都 :刚刚提到您的开课,在疫情前我们中的一些小伙伴也曾经去您的课堂上蹭课。似乎您在北大开设的课程每次都不一样,可以为我们介绍一下吗?

张志华 :最早开设的是《数据科学中的统计方法》,这个课当时是因为 1 位同事离职,我临时接手的。当时没有疫情其他学校还可以来旁听。之后开设的是《贝叶斯统计》。北大统计一直有这门课但是之前没有老师教。我们都知道统计有两个学派,频率和贝叶斯。国内可能做贝叶斯统计的学者比较少,但是从机器学习的角度上来看,贝叶斯统计更贴近些。我到北大统计工作,一定要有自己的特色,所以教贝叶斯也有这方面的考虑。

后来,《深度学习》比较流行,我学生刚好翻译了《深度学习》(作者是 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville ),所以学院建议我来讲。紧接着我又开设了《强化学习》相关的课程。这两门课很火爆,给我带来了北大数学之外的一些影响,有时走在北大校园路上会有学生过来打招呼。记得有次和几位同事一起在食堂吃中午饭,当时在讨论什么样教学是好的,大家认为获得学生认同就行。刚好我在排队买饭时候,一位陌生学生过来和我打招呼,说是软件工程博士生,刚参加完博士毕业典礼马上要离校,修过深度学习课,所以特意过来和我告别,还希望今后有机会能回校听我的课。所以这个课很有成就感,但是也很累。期间我还应上海交大俞勇老师邀请,去给 ACM 计算机试验班讲了一学期《强化学习》,每周四晚上去上海,周五上、下午各教 2 节课,晚上回北京。之后还在中科院科学计算国家重点实验室教了 2 周《强化学习》短暑课。所以那个学期感觉非常疲惫,对教课有点恐惧了。

数学老师教课相对比较注重系统、强调数学基础,而计算机的课比较直接、重应用动手。其实计算机的学生很多也是想学点这种数学的东西的,所以数据科学、计算机科学等专业选修人数比较多。这两门课程对于数学学院的贡献没那么大,所以我还是要回归给统计作贡献才好。

于是我上学期(2021 年春学期)开了一门《统计思维》,也是希望能够对统计课程做一点改革,是受计算机科学的《计算思维》启发。我觉得统计专业课有点多了,是不是能少开些门课,把统计的那些精髓的东西浓缩为两、三门课。当时我是把基本的方法大致介绍了,以 Larry Wasserman 的《统计大全》(All of Statistics)那本书为基础,加上 Efron&Hastie 的《计算机时代的统计推断》(Computer Age Statistical Inference)。开设的结果目前看来不是特别成功。因为其他课都在开,你又教这门课,学生就会觉得内容重复了。不过我们统计几位同事最近又讨论这门课,大家觉得课的想法还是很好的,现在是想把统计思维放在低年级,计划讲一些统计的历史、文化,讲述一些统计方法的思想给没有经过任何统计训练的学生,让他先了解一下统计的大致脉络。

我这个学期(2021 年秋学期)上的是高维概率,这个课我建议人民大学统计学院等院系开。这个课是 2018 年的时候,我们看到了 Roman Vershynin 的 High-Dimensional Probability with Applications in Data Science 书,先让我的研究生他们去读,他们都觉得非常好,非常有用。2020 年秋学期我讲了一次。这门课北大数学学院的本科生和博士生反响应该还是比较好的,因为它是概率、组合、机器学习、理论计算机和统计有关的一个基础课,又比较现代,可以马上用于研究。

我下学期(2022 年春学期)将开设《理论机器学习》,这个是为博士生首次开设的,我现在正在找教学资料。

2. 统计学和机器学习、人工智能

统计之都 :您认为统计与机器学习的关系到底是什么?您是如何看待的?

张志华 :我个人认为没有本质上的区别。而且现在很多人认为:机器学习是现代统计学;机器学习是统计和计算机科学的一个交叉融合。当然两个学科的出发点可能不一样,计算机没出现的时候,我们就有统计了,已经在做数据分析了;而机器学习是伴随计算机发展而发展起来的,它最开始的目的是让计算机具有学习能力,但是后来转变思路,要从数据里构造算法,然后基于算法做预测或决策,这个目的和统计实际上是一样的,都是希望从数据中产生价值,殊路同归。两者都需要计算技术和方法。但是因为学科的不同起源,理论关注的角度有些不一样。统计可能更偏向于模型,常用分析的数学手段;而计算机更强调的是计算,常用组合的数学手段。比如说计算机侧重研究的是计算的复杂度、有效性;统计研究这个方法的时候,理论则强调相合性、渐进正态性,但两者往往都用概率做工具。当然各自发展起来的理论相互都应该兼容并收。

统计之都 :您能给想做机器学习理论的同学一些建议吗?

张志华 :要做机器学习理论方面的研究,一定要看偏理论的一些书籍,例如《高维概率》、foundations of machine learning 等。做理论不要那么急,要好好学数学。博士生培养:提出问题、定义问题(包装问题 / 讲故事)、解决问题等。可能由于我们文化背景不同,咱们中国学生在提出问题和定义问题方面能力先天相对弱些。所以我觉得我们一定要在基础理论上比他人至少强半格。这样别人提出了一个问题,我们凭借好的理论基础很快跟进并改进结果,尝试做出几个这种工作,后续自己自然而然也就会提出问题和定义问题了。理论问题不像做工程,理论不需要帮手,不能寄希望于老师直接给问题,要多读论文、多听报告、勤思考,然后自己找问题。

统计之都 :我们还想了解一下,因为我们知道您为了推动机器学习在统计学科的发展,去年年底在现场统计研究会中成立了机器学习分会,想请您讲一下这个分会成立的历程,还有未来的发展目标。

张志华 :2017 年底,郁彬老师来北大访问,她对于国内的统计和机器学习的发展很关心。问我在北大待了一年多了,对于统计和机器学习在北大有什么贡献。我说好像我还不太被认可,因为统计学界觉得机器学习属于计算机。她鼓励了我一下,说 Michael Jordan(他原本在 MIT,后受 Breiman 强烈举荐引进到伯克利)在美国花了近十年时间,我也需要再花十年。我说,再过十年我都该回家养老了,既然国际上已经有了这样的一个共识,那么我们没必要从头再来。当时她比较重视这个事情,所以后面在概率统计系座谈的时候和当时现场统计研究会的理事长房祥忠老师说了这个事情,于是大家商量了一个措施,在研究会下面成立一个机器学习分会。于是我在 2018 年春天就开始申请,一直到 2021 年 6 月获批。当时我已经不抱希望了,可能大家还是不太认同机器学习。但是很幸运还是获批了。分会计划今后每年针对博士研究生开设暑期基础前沿课程,比如今年我们可以考虑讲高维概率论这门课,而明年讲高维统计。希望实现把推进机器学习在统计学科发展这个使命交给你们这些年轻一代学者与学生的愿景。

统计之都 :六年前的采访中,我们就聊到了大数据这个概念,那时候您就指出了其只是现象,并非学科。而与六年前相比,更大的名词,数据科学,人工智能,智能科学等纷纷涌现。您觉得它们是否为学科呢?

张志华 :这些在宏观意义上来讲可以算作学科,但是对于本科生,统计和计算机更加适合作为专业存在。无论是数据科学、人工智能还是智能科学等名词,基本上都可以理解为统计和计算机的融合发展产物,有些领域计算机的成分比统计要多,有些则统计的成分多于计算机。那么这些学科有没有带来新的元素呢,我想还是有的,带来很多新研究问题和课题,特别是观念。传统的统计学思想仍然有用,同时应该充分和现代的方法、技术结合起来,在现在这些新的场景以及问题中发挥其更大的价值。当然统计和计算机科学也需要因应数据科学和人工智能的发展做些课程修订和更新。

再具体谈人工智能。我们知道计算机有一个所谓的发展三阶段。第一个阶段是怎么把计算机造出来;第二阶段是造的计算机如何更加高效;第三阶段则是计算机如何能够在不同领域得以应用。那我们现在谈的人工智能实际上就是计算机在各个领域的应用,所以说人工智能本质上就是处于计算机学科的范畴,是其发展第三阶段体现。实际上统计也是一样的,现在需要找到各种不同的领域来将之运用。因此我认为在本科阶段数据科学这些学科是更加适合作为辅修专业存在的,比如对于物理、化学、材料等等这些专业的学生,可以提供一个辅修数据科学的机会,让他们学习数据科学的这些方法以及应用思路,来解决自己专业内的问题,就是非常合适的。而现在设置的数据科学专业学到最后,就会发现实际上也还是在跟着统计的培养方案走或者在统计和计算机之间拼接,没有特别新的课程。当然通过设置数据科学本科专业,建立新的培养方案,以此促进统计专业的培养方案革新,像人大这样做也是好的思路和举措。

我们发展学科不能刻舟求剑、缘木求鱼,应该多在内涵下功夫。数据科学这个学科在本科教育阶段需要开一些新课把数据科学的基础先建立起来。国外现在很多大学就是这样做的,最近出版一些很好的书,比如 High-Dimensional ProbabilityMathematics of Data ScienceFoundations of Data Science。他们已经走在我们前头了。

统计之都 :2021 年,Alpha Fold 系列在生物学蛋白质结构预测上获得了巨大成功。因此,最近学界出现了很多 AI for Science 的声音,您是如何看待这种声音的?其中利用统计学、数据科学与人工智能知识的跨学科交叉研究应该如何开展?

张志华 :这些成果的确让人兴奋。我们注意到现在这些进展大部分是由 Google、DeepMind 等公司做出的。一个学科的研究发展是有多种驱动模式的:个人兴趣驱动、学科发展驱动、市场驱动、资本驱动等。相比于大型公司,其研究由市场驱动、资本驱动,学校可能并没有那么多的资金和资源,因此也许把精力更多地放在兴趣驱动和学科发展驱动这一层面是更好的选择,同时着力培养高水平人才。DeepMind 聚集了一批世界顶级科学家,他们大都是接受博士项目训练的,如果他们毕业于我们学校,我想我们大学就成功了。

从统计这个角度来说,AI for Science 这个技术思路并不新。例如,生物统计、计量经济学等等其实就是一直在做这样的事情,AI for Science 目前来说也还是在应用机器学习算法到某些科学领域。这个角度上来看,统计实际上是走在前列了。

统计之都 :最近,统计之都发起了纪念 Breiman 经典文献 "Two Cultures"20 年的大讨论(Breiman 访谈录 |《统计建模:两种文化》20 周年纪念),并有很多人去展望未来统计与数据科学的融合与发展,您是否愿意展望一下未来呢?

张志华 :Breiman 的经历给了我们很大的启发。他首先是概率学家,数学很好。然后他有丰富社会实践的经验,做了十几年咨询,然后又回到伯克利当教授。所以他可以做出那些成果出来,他写的书有理论,也有实用的算法。他是一个纯粹人,是深度学习出现之前最伟大的机器学习专家。

现在很多学校,包括 CMU,Yale,UPenn 都把统计改成统计与数据科学系了。并不是说统计过时了,统计肯定是要继续发展的,发展肯定是要有更新的。因此,统计我觉得他还是个王牌学科,而数据科学的确为它带来了很多新的观念。

我去年在中国 R 大会上讲过一个报告,最后总结说了三句话。第一句话是说中国的统计学一定要能够应对机器学习带来的机遇,如果没有很好地把握住这个机会,那么中国的统计学就很难赶上世界一流的脚步;第二句话是,如果中国的机器学习不去和统计做深入的融合,那么很可能还是仅仅停留在一些应用领域,而很难在方法理论上做出很好的创新;第三句话则是如果中国的机器学习和统计学发展不起来,那么想要从根本上突破我国人工智能领域面临卡脖子困境可能只是一个美好的愿景。

3. 本科生培养

统计之都 :统计学科在数据科学这个方面应该如何设置自己的本科教育体系呢?

张志华 :为了培养人才,我们国家比较流行采用拔尖实验班的方式,给予实验班一些特殊的资源。但现在我更想谈的一种方式是设置两种培养体系,其中一个教学内容更难,更加现代,让有能力的学生使用这样的培养体系;另外一个则相对简单,适合大部分同学使用。这两套体系兼容,由同学们自行选择。北大已经在做统计专业 A、B 两种培养方案。

然后总的来说,对于本科生培养有几点需要强调。

首先是加强基础,对于统计专业一般来说概率论、数理统计、随机过程这三门课是最为基础重要的,所以需要把这几门的深度、广度、现代程度在本科生教育阶段进行加强,其余的统计专业科目则可以弱化些或浓缩些,而加强一些计算课程,比如我发现 Yale 数据科学项目负责人 Daniel A. Spielman 教授开设了计算与优化(S&DS 631)非常现代。我和人大吕晓玲老师深入讨论过,我们觉得还可以增开计算机系统导论。我刚才提到统计思维,就是设想能否通过两三门统计课,把基本的统计思想、方法基本都覆盖了。如果今后继续从事统计研究和应用,只要基础打牢了,统计一些知识学起来也不会太难。统计学不是有个非常著名的 "过拟合" 现象吗?这说明过度训练不见得是好事。

统计之都 :您可以具体说明一下教材的问题吗?

张志华 :我们的教材一方面是陈旧,另一方面是较为碎片化。因为在我们国家很多情况下写教材是为了评职称,然而相比来说国外的一些经典书目,作者是为了能够写出传世作品,而且往往作者是这个领域的 "大家"。

统计之都 :您是怎么看待本科生科研这个问题的?

张志华 :我曾经指导过浙大求是班、上海交大 ACM 班、清华姚班、北大图灵班的学生本研,经历还是很丰富的。我认为本科生觉得教学内容有些陈旧,希望能参与到研究课题是很正常的。我曾经带的本研学生,就是参加组会然后读论文读书。在竞争还没有那么激烈的当时还是挺好的,大家通过本研的方式接触到了真正科研当中有用的基础知识,了解到了前沿的内容思想;而且可以了解到自己平时课堂上学的哪些知识是真的有用的,自己又欠缺哪些知识,把被动的学习转化为主动学习,从而找到自己的研究兴趣,也可以扩大自己的眼界,了解不同学校的科研情况并与自己的研究兴趣相结合,为自己未来保研以及出国提供准备。

但是现在的本研风气,特别是有些领域,就完全以发论文为导向,学生和老师都奔着这一致的目标。当然如果做本研时发现了一个很好的问题然后做出来发了论文是很好的,发论文是个水到渠成的过程。我都听说有些 AP 同时带一、二十个本科生科研,而学生同时找四、五个实验室做本研。老师方面找人干活,学生是免费劳动力。这个事情变成类似生意了:顾客、老板、中介样样俱全。我这里并不想去指责谁,只是把这个现象提出请大家正视。

统计之都 :这种追求快速造文章的本研风气会对以后做真正研究有什么危害?

张志华 :第一,可能对科研失去了敬畏之心。大家对科研总是应该有个敬畏之心或者谨慎感。第二,科研习惯还有品味可能会被带偏。一个学生跟着做本研肯定会受到合作老师的一些影响,比如在价值观和研究品味方面。就好像一张白纸,已经被一个老师涂画过了。如果涂的好还行,如果涂的不好,那对于今后博士生的老师就比较难受了,可能要花很多时间来改变研究品味,也不一定能改好。第三,你天花板可能其实是很高的,你现在本研就跟着一个热衷于灌水的老师,他就这一个高度和格局,他就把你挡住了。你看看世界顶级名校有多少本科生会去做这个事情。

统计之都 :对于以后有志于科研的学生您有什么建议?

张志华 :一是要和老师多多交流,但老师和学生是平等的,老师说的话学生也要有自己的判断,不能说什么就听什么。然后就是同学之间要形成良好的氛围,大家一起,比如说我看到一本有意义的书,大家可以组织一个读书会。每周大家一起过一下书内容,把书难题讨论一下,这样子可以互相促进。对于本科生,解决问题不是首位,最重要的是知识的积累。同时尝试找到可以合作的志同道合朋友。

4. 博士生的培养

统计之都 :国家的未来发展肯定需要更加多的人才,而博士成为了其中最为重要的一股力量。您觉得除了我们谈的统计的本科教育,那么硕博阶段培养,如果希望与数据科学,人工智能等研究相关,如何进行培养才是您理想中的方式呢?

张志华 :这是非常重要的问题,是个系统工程,肯定不是我可以考虑的事情。

作为一线导师,我觉得培养博士有三个维度:第一个就是给自己找帮手。我现在做个课题项目,招一个博士生作帮手帮我干活。第二个维度,为这个学科发展续香火。比如说我是统计教授,如果我们这代人退休了,但统计是要继续发展的,那么要培养学科的接班人。第三,最重要的,是要为国家储备人才。后两个维度其实和第一个维度不冲突。

目前我们培养能干活的博士还是有能力的。但是真正最顶级的博士,可能只有个别现象,应该还没有形成像美国那样有规模、成体系的培养能力。原来我们可以依靠美国来帮我们培养最顶级的人才,但现在我们经济发展到这个阶段肯定是不可以的。老百姓不答应,咱们国家也不答应。一个国家能否有能力培养出世界一流的博士是其成为发达国家的一个基本特征。我们那个时代读博士大多数人是为了改变命运,现在国家经济发展起来了,我想至少很大一部分人不需要通过读博士来改变命运或谋生存。不通过科研出人头地、追求财富,而是为兴趣、爱好或使命。简单说,就是需要一批纯粹的学者形成一股纯粹学术力量。坊间流传一句戏语,“中国传统文化精髓是由一帮纨绔子弟创造的”。

统计之都 :时代变化是非常快的,而硕博的教育体系变化相对滞后。同时不同的学生又处于不同发展学习阶段,所处的学校也不同。那么硕博学生自身应该如何应对呢?

张志华 :教育体系调整不会这么快的,就是学生应该怎么去调整自己的这种学习和研究内容。以咱们数据科学为例。按照知识体系有三块。第一个就是基础课,数学分析、线性代数等等。所以一年级的时候,我觉得这个还是很重要的。你不能够太老是想这个有什么用,它再枯燥你也得把它咽下去,这个是一个没办法的事情,因为你没有这个基础是不行的。第二个刚才说的是就是这个专业基础。那么数据科学这个专业基础是什么?我觉得至少我们现在是在探索。概率论、数理统计这些我觉得没有任何问题。第三个是专业课,可以尝试接触世界顶尖大学的课程资源,像斯坦福、MIT 很多的资源都是公开的。

学生也要学会自我发展。一方面就是说你们要相信自己,就是不能把自己太低估了,当然也不能太膨胀了。其实,老师并不见得比你们高明。我原来和北大元培学生接触比较多,我从他们那里学到很多,特别是对教育的理解。

统计之都 :您是如何遴选学生和指导学生科研的?

张志华 :我一般会和学生当面聊聊。主要想了解 我们之间是否有一些基本一致的价值观,是否可以顺畅交流,是否能建立互信等是我比较在意的。总之,招学生主要是看缘分,相互是否看对眼。

我带学生基本上是比较放手,不会把学生当成是自己的附属,什么事情都可以一起商量,不会强迫他们做不愿意做的事,这方面的胸襟我还是有的。自由和平等是做学问的灵魂。当然自由不能没有界限,不能胡来。另外,我经常跟他们灌输,学术上只有英雄,没有权威和领导。Michael Jordan 是统计学和机器学习英雄,但我没觉得他是权威。碰到疑难,我也会向他请教,他会给建议,但并不会吩咐我得如何做。有时也告诫学生,如果今后当教师,要善待自己的学生。

我和其他老师一样,也希望能培养出最顶级学生。我有时候看 NBA,他们总在谈论一个联盟新秀,今后发展模板是詹姆斯还是哈登。这个很有意思,我觉得可以借鉴。我让学生在他关注研究方向找对应的发展模板,最好是顶级大学的助理教授或者副教授,看他的轨迹,他在研究什么问题。所以我一般要求学生去选 1、2 个心仪模板,你不一定能达到他的高度,但至少你有一个借鉴轨迹,或者说你有一个目标。

我比较强调每个学生应该有自己的独立研究方向,当然也鼓励他们之间合作。在这个实验室里面你要有一个自己最强的东西,如果那个东西他人搞不定,会来找你合作,不然没有人会和你合作。我学生虽然论文发表并不见得很突出,但是他们大多是自带体系毕业。

我对学生的学识方面要求比较细些,希望能给他们准备毕业之后 3-5 年的知识储备,再多的年限我就没能力了。所以我会推荐他们读一些基础书,有些看起来或许与研究没那么直接,比如,我让他们读 Information, Physics, and ComputationRandom Matrix TheoryElliptic Curves 等。不是强迫所有人都得读,自愿。当然他们自己也会根据自己需求找书约几个人一起读。研究有时也需要点运气和灵气,可遇不可求。但是知识积累总是可以通过勤奋获得的。即使研究做得一般,有扎实学识今后也还是可以立足的。

另外,我觉得老师最重要一个方面的是心理调节。有些惰性学生,就推动一下。而有些跑得比较快的,则适当给他踩一下刹车。有些学生自信心太爆棚了,你不能让他太膨胀。有些学生自信心不够的,则要给他一些鼓励。

统计之都 :您北大的学生很多都并非计算机科班出身,您是如何培养他们的计算能力的?

张志华 :我原来有一个做法,一般会让他们去公司锻炼一段时间。我在工业界有些朋友同事,我请他们安排有针对性工程项目,帮学生把动手能力给带一下,同时了解工业界文化。通过实习,有些学生选择工业界,有些学生则坚定走学术。现在实验室有学生动手能力还不错,我们也有这些计算的资源,有锻炼动手条件。所以,实习做法看他们自己意愿。

5. 八卦时刻

** 统计之都:** 很多人在批评目前国内学校对青年教师科研的评价机制,比如数 A 刊、A 会的数量。您理想中的评价机制是什么样的?

张志华 :有一句话 “孤峰顶上求大道,红尘浪里取乾坤 ",你可以在孤峰顶上求大道,也可以去红尘浪里取乾坤。有的人想要做大问题,有的人追求论文数量,我觉得都应该理解,但重要的是要建立不同评价体系,什么样的人都应该有其上升渠道,而不应该只有一条晋升渠道。可以发现一个有趣现象,比如统计,美国最顶级学校的博士生发表论文有时不太多,反而是中等学校的学生论文多:最顶级学校的博士生可能没有太多论文,但可能认为他有潜力,照样可以去顶级学校做教职,中等学校的学生论文可能对其就业是非常重要的。当然博士毕业后五年之内,毕业学校很重要,但五年之后学校声誉就不起作用,得看本事了。

在我们国家:比如 30 年前我们都发中文论文,那时候能发 SCI 绝对是积极的,但我们现在可能会嘲笑 SCI。我们不能让所有人都去憋大招,这也不现实,但如果有些人愿意走这个,我们也要给他体面的生活和上升的渠道。

统计之都 :计算机一年几千篇顶会,都被考评认可,但统计一般不太认可会议文章,只认顶刊文章,而这些文章全球一年总发表量也就两三百篇。您如何看待这个现象?

张志华 :期刊、会议有很多论文这没有什么问题,但我们不能把这个当作一个评价体系,而应该把发学术论文视为学术交流,有了成果就发出来交流,通过交流发现可能有对有错有好有坏。

原来很多会议就是为了交流,比如数学虽然不认会议,但不等于不办会议,会议论文就是第一时间把成果和大家交流。我国数学家华罗庚有句话很精辟:“早发表,晚评价”。有了成果应该早点发出来,但应该等大家认同了,我们再去评价。而现在很多成果还没出来,社交媒体推特就出来了。

现在中国的发展就到这个阶段,没有全面的评价体系,或者说没有能力去评价有影响力的研究,所以只能数数。我们不是说多发论文有什么问题,而是不应该过度评价或炒作。学术需要回归宁静,宁静致远!

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计月读(2022 年 2-3 月) →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK