智源探索者 | 黄文灏:我有一个理想,就是让AI“落地有声”

智源探索者 | 黄文灏:我有一个理想,就是让AI“落地有声”

黄文灏,北京大学博士,北京智源人工智能研究院健康计算研究中心技术负责人。

近年来主攻人工智能、深度学习、自然语言处理研究,对人工智能技术在金融行业的应用有丰富的实战经验;全职加入智源研究院之前,曾任微软亚洲研究院研究员,负责自然语言理解,实体抽取,对话理解以及人机协同等研究工作,相关成果应用在微软自然语言理解平台 LUIS,Office,Teams,Bot Framework 等产品中,影响用户超过 30 亿。

在 AAAI、Transactions on Intelligent Transportation Systems 等人工智能顶级学术会议和高影响因子 SCI 国际期刊发表论文二十余篇。


用AI技术赋能生命科学研究,在某些流行病、罕见病和重大疾病上共享数据和解决方案,加速人类疾病的诊疗进程。这将是一套技术端通用的理论和研究方法,除医疗外,也有潜力应用于生物、材料、医学等方面,解决重大共性问题。对我而言,这项工作相比单纯的学术研究更加有魅力。

Q:智源健康计算研究中心,想做什么了不起的事儿?
智源健康计算研究中心(以下简称“健康计算中心”)成立于 2021 年 8 月,我们的愿景是通过人工智能技术推动健康领域从孤立、开环走向协同、闭环发展,实现更智能的个人健康管理,更有效的公共健康管理。
现阶段,我们重点关注生命健康方向,希望用AI技术加速某些流行病、罕见病和重大疾病的诊疗进程。

Q:我们有什么长期的目标规划?
未来 1-3 年,我们将重点研究 AI for Life Science 方向 ,与生命科学领域的专家合作,在基础层面上全面探索「AI+大健康」的研究课题、方法路径、外部合作以及人才储备等,加速生命健康领域的科研进程及相关成果转化。
目前我个人的研究方向集中在两方面:一个是基于生物识别的自然语言处理研究;另一个是探索自然语言处理方法与结构研究的有机结合。

Q:目前,国内「AI+大健康」研究的整体现状如何?
总的来说,几乎处于起步状态。未来要想取得实质性突破,关键要看研究方向的选择,以及是否会有更具前瞻性的「前沿成果」问世。
在 Life Science 领域,一项技术是否被定义为「前沿」,要看它在社会层面的价值,也就是这项技术是否解决了前人没有解决的重大研究课题,例如艾滋病、埃博拉病毒等。这是大多数研究机构努力的方向,也包括我们。

Q:为什么觉得这件事值得做?
AI for Life Science 是两大科学领域相互推动和成就的过程,二者的相互碰撞是一条必然要尝试和探索的路径。自 AlphaFold 发布后,有更多学者关注到 AI 在 Life Science 领域应用的价值和潜力,相信不久之后会有更多突破性成果问世。
从大环境来看,目前国家政策、产业前景和人群基数等方面都为 AI for Life Science 发展做好了准备,我们现在加入正当其时。

从技术角度来看,AI 在生命科学领域有足够大的应用空间。Life Science 蕴含着海量高维数据,例如在疾病检测方面,一个基因序列的分析不仅仅是几个样本和十几个测量值,往往是成百上千个基因或者检测结果;在药物发现方面,需要从 10 的 60 次方的庞大数据库中寻找一个特定的分子/化合物。这些并不复杂但工程量巨大的工作,对 AI 来说是一件非常轻松的事——AI 擅长从海量数据中发现和总结规律。

更重要的是,材料、化学、能源等多个领域都存在类似的科研困境,一旦在生命科学方向打通这项技术或方案,AI 可能改变多个科学研究领域的科研范式,加速相关重大课题的研究进程。


AI for Life Science 是前沿交叉学科,需要极强的科研魄力与组织能力。智源是一个能够连接学术资源和产业资源的平台,有利于把最好的科研成果落地到产业界。

智源足够开放,能够与国内外各领域的顶尖学者密切合作,团结力量做大事。各种跨院校、跨学科的合作项目,为相关研究提供了充足的学术资源。

智源有足够的耐心支持研究者踏实搞科研,不功利,不追求短期商业价值,相比“数量”更看重质量。

我们团队中有做出“史上最强麻将 AI”的大神,也有图灵奖得主 Yoshua Bengio 的学生。今年团队规模预计扩展到 50余人。


Q:智源的健康计算中心,有什么优势?
智源的格局是最难得的:不追求短期内的商业价值,不考虑短期内的论文发表量,更重视有影响力或者真正有价值的研究。
老老实实遵从科研规律,反而更有概率产出重要成果。比如 DeepMind 的一个项目,100 多人的团队做了 5 年的时间,中间也没有太多论文发表,机构不但没有停止科研支持,而是持续增加力度,最后得出了一个特别有影响力的结果。
国内研究机构中,智源的理念和实力上更具备相似的优势。同时智源是非营利机构,能够更好地避免短期功利导向所带来的困扰。

Q:在智源工作,您个人有什么收获?

智源是一个可以连接国内学术资源和产业资源的平台,有利于把最好的科研成果落地到产业界。

在这里,我们能够接触到前沿研究的专家、学者,开展学术交流;也可以与众多企业展开合作,近距离了解产业应用现状,从实际场景中发现需求,指导科研方向。这两点对于科研人来说非常重要,任何有价值的科研都不能闭门造车。我想这也是智源作为新型研发机构最吸引人的地方。

在智源工作的这段时间,我最大的体验就是“自由”,我们可以根据兴趣自由选择研究方向和课题,任何科研想法都有表达和交流的空间。健康计算研究属于一个大门类,它有很多细分的研究方向。部门刚成立时,我们希望整个团队 All in 生命健康方向,攻关高水平科研的同时兼顾落地应用,智源领导层对我们的目标和想法都表示支持,并且提供了很多合作资源。诸如此类的很多决定权都在我们研究员自己手里。

Q:我们的团队怎么样?
特别为我们的团队骄傲,我们有 20 多位研究员(包括实习生),简单列举几位优秀的小伙伴:
叶启威,曾在微软亚洲研究院(MSRA)工作,2021 年全职加入智源。他在 MSRA 与团队合作研发了打败人类顶级选手的超级麻将 AI Suphx。麻将的复杂度远高于围棋、象棋等其他棋类,Suphx 比 AlphaGo 还要复杂N个量级。
付杰,在机器学习领域有多篇论文发表,主要研究药物发现、元学习、生成模型、强化学习和 NLP 等方向。他从新加坡国立大学博士毕业后,一直在蒙特利尔大学 Mila 实验室做博士后研究,之前曾跟随 2018 年图灵奖获得主、人工智能泰斗级人物 Yoshua Bengio 做研究。
特别值得一提的是我们的首席科学家鲁白老师。鲁白老师是清华大学教授,神经科学领域的顶级专家,在大脑发育和精神健康领域做出了一系列重大发现。他为我们在生物领域的探索提供了重要指导,也为我们引荐了很多相关领域的合作专家。

Q:我们目前有哪些合作伙伴?
基于智源独特、中立的科研定位,我们与国内众多优质的科研机构和高校建立了合作关系。例如在 AI for Life Science 方向,与清华智能产业研究院(AIR)合作,共同探索前沿研究课题;在健康管理维度,与医院合作,采用 2H2C 的模式进行用户孵化。
在高校资源方面,清华大学计算机系、自动化系,北大计算机学院,人大数学学院以及海德堡大学等都是我们的合作伙伴。当然,智源内部的科研管理机制,是我们实现高效自由探索的最强后援。


智源的科研氛围鼓励自由探索,有更高的容错率和耐心,使研究员摆脱“唯结果论”带来的压力与惶恐,更专注于研究本身。真正聪明的人是不那么需要“激励”的,他们都有明确的目标。我们所能做的是给理想更多支点,为他们提供现实土壤。看到研究成果落地现实场景,为社会和人类创造价值时,这种成就感相比有形的激励,更震撼人心。

Q:团队欢迎什么特质的小伙伴?
一是对前沿研究和工程问题充满热情,希望做出有影响力的工作。二是具有钻研精神,喜欢把问题做到极致。
我还非常认同一个观点:“做研究的人一定要有写代码的能力”。我们并不会特别区分研究人员和工程师,希望他有写论文的能力,也有做科研落地的能力。

Q:我们如何做研究?
我们团队习惯聚焦一个大问题,然后大家从不同角度提供解决思路,最后综合所有方案作出最优解。
我不太希望整个团队的研究方向过于分散,两三个人做一个项目,这种更像是传统的高校模式。在具体工作中,我们鼓励小伙伴尝试自己感兴趣的方向,只要有充分的意愿,且研究方向有可能性的,我们都是鼓励的。
“足够大的容错和宽容度”,是我们团队对于科研探索的态度。我相信,在不断尝试和调整过程中慢慢沉淀下来的经验总结会成为我们团队最宝贵的财富。

Q:团队氛围怎么样?
自由开放,不打卡,自行把握工作节奏。团队成员有相同的价值观,有自驱力,都希望做出有影响力的工作,处于一种高度信任与精神共鸣的氛围中。
中午团队常常一起去食堂吃饭,说说笑笑,工作是一件特别开心的事。对了,智源食堂的早餐和午餐都很不错!

Q:为什么现在是加入团队的好时机?
目前国内 AI for Life Science 研究都在起步阶段,我们的团队正处于大空间、高自由的探索期,拥有无限可能的机会。期待大牛的加入,与我们共同探索爆发性的前沿科技成果。

更多人工智能相关,请关注智源研究院

编辑于 2022-04-06 11:54