AI 社区有多排外?「外行人」观点引发争议
2018-08-31
人工智能近年来发展迅猛,也引起了很多其它领域研究者的关注。越来越多有关AI+传统领域的研究正出现在 Nature、Cell 等重要期刊上。然而隔行如隔山,对于其它行业的人们来说,AI 研究社区似乎并不如看起来那么友好。
近日,蒙特利尔 Jewish General Hospital 的生物统计学家 Alexia Jolicoeur-Martineau 在社交网络中抱怨 AI 研究社区排外,吐槽 Yoshua Bengio 的言论引起了业内人士的注意。AI 领域的学者 Ian Goodfellow 等人纷纷表示关注。众所周知,人工智能领域能有今天的发展离不开开源、arXiv 分享精神的帮助,但这次讨论给了我们从另外一个角度看待问题的机会。
值得一提的是,在成为医疗行业的科学家之前,Alexia 自己有计算机科学和统计学背景(她有数学和计算机学士学位,以及统计硕士学位)。
Alexia Jolicoeur-Martineau 的 Twitter 内容如下:
我们需要讨论一下这一问题。我把其他 AI 研究者(有的来自蒙特利尔,有的不是)也拉入了讨论,因为我认为这个问题非常重要。
这个问题不止关乎蒙特利尔,还关乎整个 AI 生态。
除了诟病一些小的沟通问题,人们总是在赞美这个社区的伟大,但没有人注意到这个社区有多么封闭、排外。
在小组讨论中,我只听 Yoshua Bengio 提过一次「NGO」(非政府机构),学界和业界是最常出现的两个字眼,好像这个社区非此即彼。事实并非如此,NGO 是存在的,里面是一些因为不堪忍受学术界虐待/盘剥而出走的人。
或者仅仅是因为他们无法解决政治和环境问题(此类文章比比皆是)。因此,许多人像我一样屡次尝试申请读博,但还是被拒之门外。
如果其他像我一样有 10 篇统计学方面的论文(8 篇已发,其中两篇是第一作者)和 2 篇 AI 方向论文(未发表)的人也屡次遭拒,那么这说明一个问题:一大批才华横溢的人才被拦在这个社区之外。
如果绝口不提这些人,也不考虑将其纳入讨论小组,那么我们相当于假装他们并不存在。有人提到了这一漏洞百出的流程,说想要申请读博非常困难,Joelle Pineau 的答复是这一问题将尽快得到解决。
Pineau 提到了另外的 20-40 个博士点。很抱歉这并不是问题的解决之道。她还提到有 300 人申请他们的GAN研究项目,她说,申请者或许应该转向其它更有趣的项目。
这表明她不会再接收 GAN 方向的申请者。这点合情合理,因为决定接收谁做自己的学生是她的权利,但这表明这一领域门槛很高,仅仅增加几个名额并不能解决问题。
在这 300 个对 GAN 感兴趣的申请者之中,可能有 50 个天分极高的人才不得不停止该方面的研究,转而投向其它不相关的岗位或产业。
我们失去了那么多乐意在学界之外进行科研(不计报酬)的人才。但在研讨小组中我们连他们的存在都没有提到,这更加重了 AI 社区生态的封闭、排外感。我们至少应该承认这一点!
我坚信,以后有了基本收入之后,这些研究人员即使不在学术界也会做研究;同时,还有很多 AI 的业余爱好者在空闲时间进行 AI 方面的研究,我们不应该因为这些人没有华丽的头衔而忽视他们。
我的建议是,在学界之外创建一些尽可能国际化的 AI 实验室,里面没有论资排辈,任何人都能提出项目,并/或成为一名 PI(不需要任何华丽的头衔)。如果大家对这个主意感兴趣,我很乐意继续展开。
我没有足够的资金启动这样一个艰巨的项目,但我坚信这才是未来,我们需要停止维持这个社区一切都好的假象,不再假装那些学界、业界之外的人不存在,或拒绝承认他们是「真正的研究者」(虽然没在讨论小组中听到过,但之前听到很多人这么说)。
Alexia 希望申请 GAN 方向的博士遇阻,她的遭遇引起了 GAN 发明者 Ian Goodfellow 的关注:
来自一家医院的生物统计学家正在抱怨融入 AI 研究社区的困难,她既不属于人工智能学界,也不属于工业界。
其他人或许就没有这么冷静了,Alexia 的观点在 Reddit 上引发了热烈的讨论,其中不乏对于机器学习界长篇大论的辩护。
BeatLeJuce 对此表示:
就我所知,机器学习是一个最为开放、包容的研究社区之一——但现在人们都被惯坏了,因而忽略了这一点。明确点说:几十年来,人工智能社区一直在努力,所以我们的研究成果对每个人都是可望又可及的。现在我们的大部分研究都在 arxiv 上免费分享,大部分代码也都在 GitHub 上分享。ICLR 是第一批试图通过创建 openreview.net 来公开进行审查的大会之一。
我们大部分书也是免费的,比如 Goodfellow、Mackay 和 Tibshirani 等人的书。第一批成功的 MOOC 是由机器学习者开设的,第一批高影响力的 MOOC 平台也是由机器学习者创建的:吴恩达和 Koller 创办了 Coursera,Thrun 创办了 Udacity。你甚至可以在推特上给世界一流的研究人员发消息,并与之展开这样的讨论。所以,我认为机器学习站在了无障碍研究的前沿。
我们并没有故意去孤立任何人,也没有把任何参加科学领域活动的人排除在外。有人抱怨过因为没有博士学位而不得参与高能物理研究社区吗?或者计算机架构社区吗?又或者其它任何研究领域吗?如果你想写一篇关于量子化学的论文,直接写就好,没人会阻止你。但如果你想参与该研究领域的讨论,你得让其他量子化学家相信你的研究有价值。就这么简单,机器学习同样如此。
对此,唯一的问题是:1)ML 非常火热非常潮,每个人都想加入;2)在 ML 中,我们总是尽己所能地让所有材料和信息对其他人开放,所以人们以为入学门槛很低,即使没受过正规教育,他们也能实现这些。但事实是,大多数时候,人们确实缺少正规教育,因为有很多技能 MOOC 还没有传授:如何写好 ML 论文,如何区分质量高的论文和不怎么样的论文。
理论上来说,你当然可以参与 AI 研究,即写自己的论文。而如果它被拒收了,那说明有 3 个人看过并且都认为它不够好。这很可能意味着这个想法或者研究方案不符合标准。的确,也许 5 或 10 年前,如果你在 CIFAR 或 MNIST 取得了好成绩,一次没有理论依据的简单黑客攻击可能会给你带来一篇不错的论文。但现在不会了,因为这个领域已经成长了。所以,如果你读了旧论文并认为「我本来可以这么做」,那你可能是对的。但要记住,情况已经大不一样了,这些论文中的大部分现在已没法实现。
论文评审会要求清晰的解释、误差条和理论依据等等,因为我们要弄清楚什么是真正有效的,以及为什么有效。我们不是想刻薄,而是想彻底弄清楚。我们是科学界,这是我们的工作。虽然你不一定非得有博士学位才能成为科学家,但有个博士学位确实有用。即使有些科学家没有博士学位,但请你明白!这些人是非常特殊的存在,在整个社区里占很小的比例。以 C. Olah 和 Dyson 为例子的人可以滚蛋了,因为这些人显然不明白这二者是怎样特别的存在。对于普通人来说,规则很简单,且相当直接:如果你想成为科学家,那就接受对科学家的培训——取得博士学位。
我知道,有些人抱怨说博士学位很难获得,我也听到了这样的声音。这个领域现在非常流行和热门,所有一些有名气的人会被博士申请洪流给淹没。你听得没错,洪流!所以,有时候进入一个好的研究所没那么容易,因为我们既没有时间也没有资源来接受所有申请人。这意味着,有些人即使有实力,也可能不会被接受。这很糟糕,但对此我没有任何解决办法。
但要求我们「更包容」有点牵强。我认为我们已经足够包容了,而且我在开头就提到了这一点。我们非常欢迎每一个社区之外的人向任何 ML 会议提交其研究报告。如果你的论文足够好,你就能够发表它。如果不是,那请你做得更好。很抱歉,我们没时间教你如何写好论文和进行适当的实验,因为我们已经被学生给淹没了。
john_8_32_表示:
这种想法太荒谬了,就相当于在说我的申请被拒了,所以整个博士申请系统都很糟糕。我很同情那些申请被拒的人,他们也是一心想成为科学家,但这一领域已经被炒得太热了,而且研究院名额有限,无法满足这么大的需求。学术界确实有太多太多的问题存在,但除了研究院压力过大使得研究人员精疲力竭之外,我不觉得她指出的问题戳中痛点。
如果其他像我一样有 10 篇统计学方面的论文(8 篇已发,其中两篇是第一作者)和 2 篇 AI 方向论文(未发表)的人也屡次遭拒,那么这说明一个问题:一大批才华横溢的人才被拦在这个社区之外。
统计学和机器学习是非常不同的领域,有着不同的目标和标准。我看了她的论文,看起来是挺不错的统计学论文,但论文得以发表在另外一个领域并不能说明她的 ML 论文有多好。一些终身教授的论文也经常被拒。很明显,同行评审是有瑕疵的,但这种言论是相当奇怪的。同时也给一丝鼓励:我认为被拒有助于写出更好的论文,而不是世界末日。
这表明她不会再接收 GAN 方向的申请者。这点合情合理,因为决定接收谁做自己的学生是她的权利,但这表明这一领域门槛很高,仅仅增加几个名额并不能解决问题。
确实,在资源有限的世界,即研究所里,「门槛」对于资源分配是有必要的。
我的建议是,在学界之外创建一些尽可能国际化的 AI 实验室,里面没有论资排辈,任何人都能提出项目,并/或成为一名 PI(不需要任何华丽的头衔)。如果大家对这个主意感兴趣,我很乐意继续展开。
我没有足够的资金启动这样一个艰巨的项目,但我坚信这才是未来,我们需要停止维持这个社区一切都好的假象,不再假装那些学界、业界之外的人不存在,或拒绝承认他们是「真正的研究者」(虽然没在讨论小组中听到过,但之前听到很多人这么说)。
处于学术界和工业界之外的人们的研究成果基本上没有发表。科学是让人们分享知识的社区,如果不能读到你的论文,没有人会感受到你的影响力。从科学的角度来说,你或多或少是不存在的。这点说起来很令人难过,但这就是我们积累知识的方式。
Alexia 的遭遇并不是罕见的例子,同样投身医疗领域的 noelsusman 表示:
我是一名肄业博士生(提前退学了,目前拥有硕士学位),现在在一所医院研究机器学习。
我认为学术界已经遭到破坏,但不是因为原贴中提到的任何一个因素。从医疗界的角度来看,我们是有太多(而不是太少)的人在做研究。作为一个群体,我们并没有好好利用那群涌入到 GAN 研究的人们的成果。
我所在的这家医院仍然在使用简单的启发式方法来评估再入院风险。我们目前所处的阶段,只要拟合一个 logistic 回归到一些基础的诊断数据就能显著改善原来的状况。但这并没有发生,因为我们有太多这样的问题需要解决,却没有足够的人手。这是个很困难的问题,因为(a)医院没有用不完的资金;(b)我们的人力资源不足,因为薪资水平竞争不过技术公司。在街对面就有这样一家公司,我能在那里做相同的事情并拿到多 20% 的薪水。
我确实希望有更简单的方式让外行人进入学术界。我现在在做的研究是新颖的、可发表的,并且我也乐意分享,但我不知道如何解决更大的问题。
人工智能现在已经成为热门学科,即使对于 AI 领域之内的人来说,2019 年申请博士学位的难度也已大幅超过往日。相信随着人工智能的发展,这样的讨论还会愈演愈烈。