朱松纯(Song-Chun ZHU),1968年出生于湖北鄂州 [22],博士,计算机视觉专家、统计与应用数学家、人工智能专家,北京通用人工智能研究院院长, [49]北京大学讲席教授,北京大学智能学院院长,清华大学基础科学讲席教授, [13]中国人民政治协商会议第十四届全国委员会委员 [15]。
朱松纯于1991年从中国科学技术大学计算机专业毕业 [14];1992年赴美国留学,先后获得哈佛大学计算机专业硕士、博士学位;1996年博士毕业后在布朗大学应用数学专业从事博士后研究;1997年至1998年担任斯坦福大学计算机系人工智能实验室讲师;1998年至2002年担任俄亥俄州立大学计算机系与认知科学中心助理教授;2002年进入加州大学洛杉矶分校统计系与计算机系工作,历任副教授、正教授;2005年参与创建湖北莲花山研究院并任院长;2010年至2020年二次担任美国视觉、认知科学、AI领域跨学科合作项目MURI首席科学家;2017年在美国洛杉矶创立暗物智能科技;2020年回国筹建北京通用人工智能研究院,并同时担任北京大学讲席教授、清华大学基础科学讲席教授、北京大学人工智能研究院院长;2021年创建北京大学智能学院并任院长 [12]。
- 职 业
- 教育科研工作者
- 主要成就
- 2003年获得马尔奖
2011年当选为电气和电子工程师学会会士 - 性 别
- 男
- 学 历
- 研究生
- 学 位
- 博士
1968年,朱松纯出生于湖北鄂州梁子湖边的长岭镇 [22]。小时候,听城里来的人说计算机能和人下国际象棋,他感到十分好奇,长大了想当科学家的想法在年少的朱松纯心里扎根 [31]。
- 初入科研
1986年,考入中国科学技术大学计算机科学技术系。大学期间,他对人工智能产生了兴趣,不仅去旁听人工智能导论课程,还选修了研究生课程——神经网络课。大三时,他给生物系认知科学实验室老师写信,申请获得了参与早期视觉注意机制研究的机会 [31],在此期间读到英国学者大卫·马尔的著作《视觉》 [43]。
1991年,从中国科学技术大学计算机科学技术系毕业 [33],获得学士学位。并以全系第二名成绩被保送攻读硕士学位,但当时无法在中国国内找到视觉与认知交叉方向的导师,于是放弃保送研究生的资格,一心想出国深造,连续两年的申请都没成功 [48],他只好一边做研究,一边寻找机会 [43]。
- 赴美留学
1992年3月18日,收到了来自美国哈佛大学的大信封,成功被哈佛大学录取;9月,前往哈佛大学(Harvard University)计算机专业攻读硕、博士研究生,师从数学家大卫·曼福德(David Mumford,1974年获得菲尔兹奖,1975年当选为美国国家科学院院士)教授 [34]。
1993年,在哈佛大学完成全部课程,获得硕士学位 [48]。
1996年,从哈佛大学毕业,获得博士学位。
- 高校工作
1996年,博士毕业后跟随导师大卫·曼福德前往美国布朗大学(Brown University)应用数学专业从事博士后研究工作。
1997年,进入美国斯坦福大学(Stanford University)工作,担任计算机系人工智能实验室讲师。
1998年,进入美国俄亥俄州立大学(The Ohio State University)工作,担任计算机系与认知科学中心助理教授。
2002年,进入美国加州大学洛杉矶分校(University of California, Los Angeles)工作,担任统计系与计算机系副教授,在此工作期间在加州大学洛杉矶分校建立了视觉、认知、学习和自主中心。
2006年,晋升为美国加州大学洛杉矶分校统计系与计算机系正教授。
2008年,带领团队转向认知领域的研究 [51]。
- 社会工作
2010年—2015年,首次担任美国视觉、认知科学、AI领域跨学科合作项目MURI首席科学家。
2015年—2020年,第二次担任美国视觉、认知科学、AI领域跨学科合作项目MURI首席科学家(Principal Investigator)。
2020年9月,以人工智能战略科学家的身份回国,创建北京通用人工智能研究院,出任院长;同时担任北京大学讲席教授 [5] 、北京大学人工智能研究院院长 [11]、清华大学基础科学讲席教授 [4]。
2021年1月,在北京大学元培学院设立通用人工智能实验班,并于4月在清华大学设立通用人工智能因材施教培养计划;11月,创建北京大学智能学院,出任院长 [8-9]。
2023年1月,创建跨媒体通用人工智能全国重点实验室,出任实验室主任;1月,当选为中国人民政治协商会议第十四届全国委员会委员 [15];3月,当选为中国人民政治协商会议第十四届全国委员会提案委员会委员 [17];8月,当选为亚洲社会仿真学会名誉会长 [19]。
朱松纯的研究成果集中在以下四个时期和领域:
一、视觉的统计建模与计算理论——为马尔的视觉理论建立统一的数理模型
1995年—2005年期间,朱松纯与导师大卫·曼福德、同事以及博士生,为计算视觉创始人大卫·马尔(David C. Marr)提出的早期视觉(early vision)概念,包括纹理(texture)、图像基元(Texton)以及原始简约图(primal sketch)等建立了一个统一的数理模型;提出统计建模的最小最大熵原理(minimax entropy principle);将神经学和心理学的发现,植入统计物理的吉布斯模型(Gibbs Model),从而导出一类新型的马尔科夫随机场的概率模型(FRAME),并将该模型扩展到中层视觉模型,描述形状与格式塔(Gestalt)组成原则;发现自然图像的尺度不变与尺度变化的统计规则,将各种视觉模式及其对应的数理模型映射到一个连续的熵频谱(entropy spectrum)和信息尺度(information scaling);进一步研究了各种模型之间跳转和感知转化(perceptual transition)的机制,与博士生王亦洲导出感知尺度空间理论(perceptual scale space)。
1990年代,朱松纯发展了两类新的非线性偏微分方程(PDE)。一类用于图像分割,将PDE连接到统计图像模型的这项工作在ICCV 2013上获得了赫尔姆霍茨奖。另一类称为GRADE(Gibbs Reaction and Diffusion Equations,吉布斯反应和扩散方程)于1997年发表,并在计算机视觉领域首次采用Langevin动力学方法进行推理和学习随机梯度下降。 [16]
1999年—2010年期间,朱松纯与其首位博士生屠卓文提出用数据驱动的蒙特卡洛马尔可夫链方法(Data-Driven Markov Chain Monte Carlo)求图像分割和解译(Image Parsing)问题的全局最优解;与其博士生Adrian Barbu提出了Swendsen-Wang Cut的蒙特卡洛算法,在通用的概率采样(sampling)计算中,实现大的状态跳转,突破传统方法计算的瓶颈问题。该领域的这一进步使拆分合并运算符在文献中首次可逆,并且比吉布斯采样器和跳跃扩散方法快了100倍。这一工作获得第九届国际视觉大会颁发的马尔奖,并重新激起了同行对于图像解译工作的兴趣。
2006年—2015年间,朱松纯提出了概率随机的与或图(and-or graph)模型来表达上下文相关图语法(graph grammar),重启了模式识别领域创始人傅京孙倡导的句法模式识别框架;提出时空因果与或图(Spatial,Temporal,Causal And-or graph STC-AOG)为物体、场景、事件和因果关系建立统一的模型,并用于场景与事件的解译任务。 [16]
三、提出人工智能的“暗物质”——研究视觉与认知的物理与社会常识
自2010年以来,朱松纯将计算机视觉与认知科学、自然语言理解、机器人等学科相结合。
•视觉与认知科学的结合:实现物理常识的推理(比如物体和场景的物理属性、使用功能、行为的因果率)和社会常识的推理(比如人的意图、动机、目的),由此丰富了对场景和事件的理解的内涵。
•视觉与自然语言理解的结合:通过人机情景对话来获取常识,并于2010年率先从图像和视频的解译图中自动产生文本描述的I2T (Image Parsing to Text Generation)方法。
•视觉与机器人的结合:提出了自主机器人与人类深度协作的认知构架和通讯协议,以达到共境(shared situation)、共识(shared model)、共行(shared plan)、和共同价值观(shared value)。
四、探索迈向通用人工智能的新的研究路径——“小数据、大任务”范式 [3]
2017年,朱松纯发表了一篇AI科普文章 《浅谈人工智能:现状、任务、构架与统一》在文中,朱松纯将行业中流行的数据驱动型深度学习研究称为“大数据、小任务”范式。该范式使用大量标注的数据为每个特定任务训练神经网络,导致AI模型无法解释、应用范围狭窄等。与之相反,朱松纯提出了“小数据、大任务”的范式,主张以此范式来实现通用人工智能。
朱松纯团队构建了一个大规模、物理逼真的VR/AR环境,用于训练和测试负责执行大量日常任务的自主AI智能体。这些智能体整合视觉、语言、认知、机器学习和机器人技术等领域的能力,在此过程中发展物理常识和社会常识,并使用认知架构与人类进行交流。该项工作获得2019年ACM图灵大会最佳论文奖。
朱松纯团队还提出了构建通用智能体的“心”与“理”的UV双系统理论。其中U系统表征客观世界和人类社会的状态和规律,简称“理”,即势能函数。V系统表征智能体的主观价值,简称“心”,即价值函数;智能体应该由“心”(V系统)驱动“理”(U系统),即由价值驱动其决策和行为,让智能体自主产生和完成任务,实现为机器立“心”,从而迈向通用人工智能 [3]。
根据2022年2月北京大学人工智能研究院网站显示,朱松纯先后在国际顶级期刊和会议上发表论文350余篇 [3],代表性论文如下:
发表时间 | 论文名称 | 作者 | 刊载于 |
---|---|---|---|
1995年 | FORMS: A Flexible Object Recognition and Modelling System | Song Chun Zhu,Alan L | International Conference on Computer Vision |
1995年 | Region Competition: Unifying Snakes, Region Growing, Energy/Bayes/MDL for Multi-band Image Segmentation | Song Chun Zhu,Tai Sing Lee,Alan L | International Conference on Computer Vision |
1996年 | Region Competition: Unifying Snakes, Region Growing, and Bayes/MDL for Multiband Image Segmentation | Song Chun Zhu,Alan L | Trans on Pattern Analysis and Machine Intelligence |
1996年 | FRAME: Filters, Random fields, and Minimax Entropy - Towards a Unified Theory for Texture Modeling | Song Chun Zhu,Ying Nian Wu,David Mumford | IEEE Conference on Computer Vision and Pattern Recognition |
1996年 | FORMS: A flexible object recognition and modelling system | Song Chun Zhu,Alan L | International Journal of Computer Vision |
1997年 | Learning Generic Prior Models for Visual Computation | Song Chun Zhu,David Mumford | IEEE Conference on Computer Vision and Pattern Recognition |
1997年 | Minimax Entropy Principle and Its Application to Texture Modeling | Song Chun Zhu,Ying Nian Wu,David Mumford | Neural Computation |
1997年 | Prior Learning and Gibbs Reaction-Diffusion | Song Chun Zhu,David Mumford | Trans on Pattern Analysis and Machine Intelligence |
1998年 | Stochastic Computation of Medial Axis in Markov Random Fields | Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
1998年 | GRADE: Gibbs Reaction and Diffusion Equation | Song Chun Zhu,David Mumford | International Conference on Computer Vision |
1998年 | Filters, Random Fields and Maximum Entropy (FRAME): Towards a Unified Theory for Texture Modeling | Song Chun Zhu,Ying Nian Wu,David Mumford | International Journal of Computer Vision |
1999年 | Embedding Gestalt Laws in Markov Random Fields | Song Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
1999年 | Equivalence of Julesz and Gibbs Texture Ensembles | Ying Nian Wu,Song Chun Zhu,Xiuwen Liu | International Conference on Computer Vision |
1999年 | Fundamental Bounds on Edge Detection: An Information Theoretic Evaluation of Different Edge Cues | Scott Konishi,Alan L. Yuille,James M. Coughlan,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2000年 | Integrating Bottom-Up/Top-Down for Object Recognition by Data Driven Markov Chain Monte Carlo | Song Chun Zhu,Rong Zhang,Zhuowen Tu | IEEE Conference on Computer Vision and Pattern Recognition |
2000年 | Learning in Gibbsian Fields: How Accurate and How Fast Can It Be? | Song Chun Zhu,Xiuwen Liu | IEEE Conference on Computer Vision and Pattern Recognition |
2000年 | Order Parameters for Minimax Entropy Distributions: When Does High Level Knowledge Help? | Alan L. Yuille,James M. Coughlan,Song Chun Zhu,Ying Nian Wu | IEEE Conference on Computer Vision and Pattern Recognition |
2001年 | Example-Based Facial Sketch Generation with Non-parametric Sampling | Hong Chen,Ying-Qing Xu,Heung-Yeung Shum,Song Chun Zhu,Nanning Zheng | International Conference on Computer Vision |
2001年 | Introduction by Guest Editors | Alan L. Yuille,Song Chun Zhu,David Mumford | International Journal of Computer Vision |
2001年 | Visual Learning by Integrating Descriptive and Generative Methods | Cheng-en Guo,Song Chun Zhu,Ying Nian Wu | International Conference on Computer Vision |
2002年 | What Are Textons? | Song Chun Zhu,Cheng-en Guo,Ying Nian Wu,Yizhou Wang | European Conference on Computer Vision |
2002年 | A Generative Method for Textured Motion: Analysis and Synthesis | Yizhou Wang ,Song Chun Zhu | European Conference on Computer Vision |
2002年 | Image Segmentation by Data-Driven Markov Chain Monte Carlo | Zhuowen Tu,Song Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2003年 | Modeling Visual Patterns by Integrating Descriptive and Generative Methods | Cheng-en Guo,Song Chun Zhu,Ying Nian Wu | International Journal of Computer Vision |
2003年 | Statistical Modeling and Conceptualization of Visual Patterns | Song Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2003年 | Towards a Mathematical Theory of Primal Sketch and Sketchability | Cheng-en Guo,Song Chun Zhu | International Conference on Computer Vision |
2004年 | Modeling Complex Motion by Tracking and Editing Hidden Markov Graphs | Yizhou Wang ,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2004年 | Analysis and Synthesis of Textured Motion: Particles and Waves | Yizhou Wang ,Song Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2004年 | Multigrid and Multi-Level Swendsen-Wang Cuts for Hierarchic Graph Partition | Adrian Barbu,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2005年 | A Generative Model of Human Hair for Hair Sketching | Hong Chen,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2005年 | Image Parsing: Unifying Segmentation, Detection, and Recognition | Zhuowen Tu,Xiangrong Chen,Alan L. Yuille,Song Chun Zhu | International Journal of Computer Vision |
2005年 | Cloth Representation by Shape from Shading with Shading Primitives | Feng Han ,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2006年 | Composite Templates for Cloth Modeling and Sketching | Hong Chen,Zi Jian Xu ,Ziqiang Liu,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2006年 | A Generative Sketch Model for Human Hair Analysis and Synthesis | Hong Chen,Song Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2006年 | A Stochastic Grammar of Images | Song Chun Zhu,David Mumford | Foundations and Trends in Computer Graphics and Vision |
2007年 | Layered Graph Match with Graph Editing | Liang Lin,Song Chun Zhu,Yongtian Wang | IEEE Conference on Computer Vision and Pattern Recognition |
2007年 | Primal sketch: Integrating structure and texture | Cheng-en Guo,Song Chun Zhu,Ying Nian Wu | Computer Vision and Image Understanding |
2007年 | Mapping Natural Image Patches by Explicit and Implicit Manifolds | Kent Shi,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2008年 | A hierarchical and contextual model for aerial image understanding | Jake Porway,Kristy Wang,Benjamin Z. Yao,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2008年 | A Hierarchical Compositional Model for Face Representation and Sketching | Zijian Xu ,Hong Chen,Song Chun Zhu,Jiebo Luo | Trans on Pattern Analysis and Machine Intelligence |
2008年 | An integrated background model for video surveillance based on primal sketch and 3D scene geometry | Wenze Hu,Haifeng Gong,Song Chun Zhu,Yongtian Wang | IEEE Conference on Computer Vision and Pattern Recognition |
2009年 | Evaluating information contributions of bottom-up and top-down processes | Xiong Yang,Tianfu Wu ,Song Chun Zhu | International Conference on Computer Vision |
2009年 | Flow mosaicking: Real-time pedestrian counting without scene-specific learning | Yang Cong,Haifeng Gong,Song Chun Zhu,Yandong Tang | IEEE Conference on Computer Vision and Pattern Recognition |
2009年 | From image parsing to painterly rendering | Kun Zeng,Mingtian Zhao,Caiming Xiong,Song Chun Zhu | ACM Transactions on Graphics |
2009年 | Learning mixed templates for object recognition | Zhangzhang Si,Haifeng Gong,Ying Nian Wu,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2010年 | Discovering scene categories by information projection and cluster sampling | Dengxin Dai,Tianfu Wu ,Song Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2010年 | Layered Graph Matching with Composite Cluster Sampling | Liang Lin,Xiaobai Liu,Song Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2010年 | Learning Artistic Lighting Template from Portrait Photographs | Xin Jin,Mingtian Zhao,Xiaowu Chen,Qinping Zhao,Song Chun Zhu | European Conference on Computer Vision |
2011年 | A Numerical Study of the Bottom-Up and Top-Down Inference Processes in And-Or Graphs | Tianfu Wu ,Song Chun Zhu | International Journal of Computer Vision |
2011年 | C4: Exploring Multiple Solutions in Graphical Models by Cluster Sampling | Jacob Porway,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2011年 | Image representation by active curves | Wenze Hu,Ying Nian Wu,Song-Chun Zhu | International Conference on Computer Vision |
2011年 | Parsing video events with goal inference and intent prediction | Mingtao Pei,Yunde Jia,Song-Chun Zhu | International Conference on Computer Vision |
2012年 | Cost-Sensitive Top-Down/Bottom-Up Inference for Multiscale Activity Recognition | Mohamed R. Amer,Dan Xie,Mingtian Zhao,Sinisa Todorovic,Song Chun Zhu | European Conference on Computer Vision |
2012年 | Intrackability: Characterizing Video Statistics and Pursuing Video Representations | Haifeng Gong,Song Chun Zhu | International Journal of Computer Vision |
2012年 | Learning Hybrid Image Templates (HIT) by Information Projection | Zhangzhang Si,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2013年 | Beyond Point Clouds: Scene Understanding by Reasoning Geometry and Physics | Bo Zheng ,Yibiao Zhao,Joey C. Yu,Katsushi Ikeuchi,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2013年 | Human Attribute Recognition by Rich Appearance Dictionary | Jungseock Joo,Shuo Wang,Song-Chun Zhu | International Conference on Computer Vision |
2013年 | Learning AND-OR Templates for Object Recognition and Detection | Zhangzhang Si,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2013年 | Learning and parsing video events with goal and intent prediction | Mingtao Pei,Zhangzhang Si,Benjamin Z. Yao,Song-Chun Zhu | Computer Vision and Image Understanding |
2013年 | Scene Parsing by Integrating Function, Geometry and Appearance Models | Yibiao Zhao,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2014年 | Animated Pose Templates for Modeling and Detecting Human Actions | Benjamin Z. Yao,Bruce X. Nie,Zicheng Liu ,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2014年 | Detecting potential falling objects by inferring human action and natural disturbance | Bo Zheng ,Yibiao Zhao,Joey C. Yu,Katsushi Ikeuchi,Song-Chun Zhu | IEEE International Conference on Robotics and Automation |
2014年 | Integrating Context and Occlusion for Car Detection by Hierarchical And-Or Model | Bo Li ,Tianfu Wu ,Song-Chun Zhu | European Conference on Computer Vision |
2014年 | Unsupervised Learning of Dictionaries of Hierarchical Compositional Models | Jifeng Dai,Yi Hong,Wenze Hu,Song-Chun Zhu,Ying Nian Wu | IEEE Conference on Computer Vision and Pattern Recognition |
2015年 | Attributed Grammars for Joint Estimation of Human Attributes, Part and Pose | Seyoung Park,Song-Chun Zhu | International Conference on Computer Vision |
2015年 | Joint action recognition and pose estimation from video | Bruce Xiaohan Nie,Caiming Xiong,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2015年 | Learning 3D Object Templates by Quantizing Geometry and Appearance Spaces | Wenze Hu,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2015年 | Understanding tools: Task-oriented object modeling, learning and recognition | Yixin Zhu,Yibiao Zhao,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2016年 | Inferring Forces and Learning Human Utilities from Videos | Yixin Zhu,Chenfanfu Jiang,Yibiao Zhao,Demetri Terzopoulos,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2016年 | Inferring human intent from video by sampling hierarchical plans | Steven Holtzen,Yibiao Zhao,Tao Gao,Joshua B. Tenenbaum,Song-Chun Zhu | IEEERSJ International Conference on Intelligent Robots and Systems |
2016年 | Learning And-Or Model to Represent Context and Occlusion for Car Detection and Viewpoint Estimation | Tianfu Wu ,Bo Li,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2016年 | Learning Social Affordance for Human-Robot Interaction | Tianmin Shu,Michael S. Ryoo,Song-Chun Zhu | International Joint Conference on Artificial Intelligence |
2016年 | Robot learning with a spatial, temporal, and causal and-or graph | Caiming Xiong,Nishant Shukla,Wenlong Xiong,Song-Chun Zhu | IEEE International Conference on Robotics and Automation |
2017年 | A glove-based system for studying hand-object manipulation via joint pose and force sensing | Hangxin Liu,Xu Xie ,Matt Millar,Mark Edmonds,Feng Gao 0013,Yixin Zhu,Veronica J. Santos,Brandon Rothrock,Song-Chun Zhu | IEEERSJ International Conference on Intelligent Robots and Systems |
2017年 | Alternating Back-Propagation for Generator Network | Tian Han ,Yang Lu ,Song-Chun Zhu,Ying Nian Wu | AAAI Conference on Artificial Intelligence |
2017年 | CERN: Confidence-Energy Recurrent Network for Group Activity Recognition | Tianmin Shu,Sinisa Todorovic,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2017年 | Inferring Human Attention by Learning Latent Intentions | Ping Wei ,Dan Xie,Nanning Zheng ,Song-Chun Zhu | International Joint Conference on Artificial Intelligence |
2017年 | Jointly Recognizing Object Fluents and Tasks in Egocentric Videos | Yang Liu,Ping Wei ,Song-Chun Zhu | International Conference on Computer Vision |
2017年 | Learning social affordance grammar from videos: Transferring human interactions to human-robot interactions | Tianmin Shu,Xiaofeng Gao,Michael S. Ryoo,Song-Chun Zhu | IEEE International Conference on Robotics and Automation |
2017年 | Mining Object Parts from CNNs via Active Question-Answering | Quanshi Zhang,Ruiming Cao,Ying Nian Wu,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2018年 | A Causal And-Or Graph Model for Visibility Fluent Reasoning in Tracking Interacting Objects | Yuanlu Xu,Lei Qin,Xiaobai Liu,Jianwen Xie,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2018年 | Attribute And-Or Grammar for Joint Parsing of Human Pose, Parts and Attributes | Seyoung Park,Bruce Xiaohan Nie,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2018年 | Examining CNN Representations With Respect to Dataset Bias | Quanshi Zhang,Wenguan Wang,Song-Chun Zhu | AAAI Conference on Artificial Intelligence |
2018年 | Generalized Earley Parser: Bridging Symbolic Grammars and Sequence Data for Future Prediction | Siyuan Qi,Baoxiong Jia,Song-Chun Zhu | International Conference on Machine Learning |
2018年 | Intent-Aware Multi-Agent Reinforcement Learning | Siyuan Qi,Song-Chun Zhu | IEEE International Conference on Robotics and Automation |
2018年 | Single-View 3D Scene Reconstruction and Parsing by Attribute Grammar | Xiaobai Liu,Yibiao Zhao,Song-Chun Zhu | Trans on Pattern Analysis and Machine Intelligence |
2018年 | Where and Why Are They Looking? Jointly Inferring Human Attention and Intentions in Complex Tasks | Ping Wei ,Yang Liu,Tianmin Shu,Nanning Zheng ,Song-Chun Zhu | IEEE Conference on Computer Vision and Pattern Recognition |
2019年 | A tale of two explanations: Enhancing human trust by explaining robot behavior | Mark Edmonds,Feng Gao 0013,Hangxin Liu,Xu Xie ,Siyuan Qi,Brandon Rothrock,Yixin Zhu,Ying Nian Wu,Hongjing Lu,Song-Chun Zhu | Science Robotics |
2019年 | Learning Virtual Grasp with Failed Demonstrations via Bayesian Inverse Reinforcement Learning | Xu Xie ,Changyang Li,Chi Zhang 0017,Yixin Zhu,Song-Chun Zhu | IEEERSJ International Conference on Intelligent Robots and Systems |
2019年 | MetaStyle: Three-Way Trade-off among Speed, Flexibility, and Quality in Neural Style Transfer | Chi Zhang 0017,Yixin Zhu,Song-Chun Zhu | AAAI Conference on Artificial Intelligence |
2019年 | Self-Supervised Incremental Learning for Sound Source Localization in Complex Indoor Environment | Hangxin Liu,Zeyu Zhang ,Yixin Zhu,Song-Chun Zhu | IEEE International Conference on Robotics and Automation |
2019年 | Understanding Human Gaze Communication by Spatio-Temporal Graph Reasoning | Lifeng Fan,Wenguan Wang,Song-Chun Zhu,Xinyu Tang,Siyuan Huang | International Conference on Computer Vision |
2019年 | Unsupervised Disentangling of Appearance and Geometry by Deformable Generator Network | Xianglei Xing,Tian Han ,Ruiqi Gao,Song-Chun Zhu,Ying Nian Wu | IEEE Conference on Computer Vision and Pattern Recognition |
2020年 | A Competence-Aware Curriculum for Visual Concepts Learning via Question Answering | Qing Li,Siyuan Huang,Yining Hong,Song-Chun Zhu | European Conference on Computer Vision |
2020年 | A massively parallel and scalable multi-CPU material point method | Xinlei Wang,Yuxing Qiu,Stuart R. Slattery,Yu Fang,Minchen Li,Song-Chun Zhu,Yixin Zhu,Min Tang ,Dinesh Manocha,Chenfanfu Jiang | ACM Transactions on Graphics |
2020年 | Congestion-aware Evacuation Routing using Augmented Reality Devices | Zeyu Zhang ,Hangxin Liu,Ziyuan Jiao,Yixin Zhu,Song-Chun Zhu | IEEE International Conference on Robotics and Automation |
2020年 | Cooperative Training of Descriptor and Generator Networks | Jianwen Xie,Yang Lu,Ruiqi Gao,Song-Chun Zhu,Ying Nian Wu | Trans on Pattern Analysis and Machine Intelligence |
2020年 | Graph-based Hierarchical Knowledge Representation for Robot Task Transfer from Virtual to Physical World | Zhenliang Zhang,Yixin Zhu,Song-Chun Zhu | IEEERSJ International Conference on Intelligent Robots and Systems |
2020年 | “暗”,不止于“深”——迈向认知智能与类人常识的范式转换 | 朱毅鑫,高涛,范丽凤,黄思远,Mark Edmonds,刘航欣,高枫,张驰,綦思源,吴英年,Joshua B.Tenenbaum,朱松纯 | Engineering |
2021年 | Monocular 3D Pose Estimation via Pose Grammar and Data Augmentation | Xu Yuanlu,Wang Wenguan,Liu Tengyu,Liu Xiaobai,Xie Jianwen,Zhu Song-Chun | IEEE Transactions on Pattern Analysis and Machine Intelligence |
2021年 | Cooperative Training of Fast Thinking Initializer and Slow Thinking Solver for Conditional Learning | Xie Jianwen,Zheng Zilong,Fang Xiaolin,Zhu Song-Chun,Wu Ying Nian | IEEE Transactions on Pattern Analysis and Machine Intelligence |
2021年 | Hierarchical Human Semantic Parsing with Comprehensive Part-Relation Modeling | Wang Wenguan,Zhou Tianfei,Qi Siyuan,Shen Jianbing,Zhu Song-Chun | IEEE Transactions on Pattern Analysis and Machine Intelligence |
2022年 | Scene Reconstruction with Functional Objects for Robot Autonomy | Han Muzhi,Zhang Zeyu,Jiao Ziyuan,Xie Xu,Zhu Yixin,Zhu Song-Chun,Liu Hangxin | International Journal of Computer Vision |
2022年 | Understanding Physical Effects for Effective Tool-Use | Zhang Zeyu,Jiao Ziyuan,Wang Weiqi,Zhu Yixin,Zhu Song-Chun,Liu Hangxin | IEEE Robotics and Automation Letters |
2022年 | In situ bidirectional human-robot value alignment | Yuan Luyao,Gao Xiaofeng,Zheng Zilong,Edmonds Mark,Wu Ying Nian,Rossano Federico,Lu Hongjing,Zhu Yixin,Zhu Song-Chun | Science Robotics |
2022年 | 可解释工智能导论 | 杨强 ,范力欣, 朱军,陈一晰 ,张拳石 ,朱松纯 | 中文信息学报 |
2023年 | 通讯式学习——统一的机器学习模式 | 袁路遥, 朱松纯 | Engineering |
2023年 | Communicative Learning: A Unified Learning Formalism | Yuan Luyao,Zhu Song-Chun | Engineering |
2023年 | Guest Editorial: Introduction to the Special Section on Graphs in Vision and Pattern Analysis | Bai Song,Torr Philip H.S,Krishna Ranjay,Li Fei-Fei,Gupta Abhinav, Zhu Song-Chun | IEEE Transactions on Pattern Analysis and Machine Intelligence |
2023年 | Rearrange Indoor Scenes for Human-Robot Co-Activity | Wang Weiqi,Zhao Zihang,Jiao Ziyuan,Zhu Yixin,Zhu Song-Chun,Liu Hangxin | 2023 IEEE International Conference on Robotics and Automation (ICRA) |
2023年 | Diffusion-based Generation, Optimization, and Planning in 3D Scenes | Huang Siyuan,Wang Zan,Li Puhao,Jia Baoxiong,Liu Tengyu,Zhu Yixin,Liang Wei,Zhu Song-Chun | 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) |
参考资料来源: [23] |
- Monte Carlo Methods作者名称 Adrian Barbu作品时间2020
- Springer
- Computer Vision: Statistical Models for Marr's Paradigm作者名称 Song-Chun Zhu作品时间2021
- Springer
- Computer Vision: Stochastic Grammars for Parsing Objects, Scenes, and Events作者名称 Song-Chun Zhu作品时间2021
- Springer
- Cognitive Models for Visual Commonsense Reasoning作者名称 Song-Chun Zhu作品时间2021
- Springer
(参考资料来源: [23])
获奖时间 | 授予单位 |
---|---|
2019年最佳论文奖(Best Paper Award) | 中国图灵大会(ACM TURC) |
2020年最佳论文奖(Best Paper Award) | ICML Workshop on Bridge Perception and Reasoning |
参考资料来源: [24] |
获奖时间 | 荣誉表彰 | 授予单位 |
---|---|---|
1992年 | 哈佛大学研究生院奖学金(Harvard Fellowship) | 哈佛大学艺术与科学研究生院(Harvard Graduate School of Art and Sciences) |
1995年 | 哈佛大学工程领域Ali Jury奖 | 哈佛大学 |
1999年 | 马尔奖荣誉提名(Marr Prize honorary nomination) | 第7届国际计算机视觉大会 |
2001年 | 杰出青年科学家奖(Young Investigator Award) | 美国海军研究所(Office of Navy Research) |
2001年 | 青年教授奖励基金(Career Award) | 美国国家科学基金会(National Science Foundation) |
2001年 | 斯隆奖(Sloan fellow) | 斯隆基金会(Alfred P. Sloan Foundation) |
2003年 | 马尔奖(Marr Prize) | 第9届计算机视觉国际大会 |
2007年 | 马尔奖荣誉提名(Marr Prize honorary nomination) | 第11届国际计算机视觉大会 |
2008年 | 第二届阿加沃尔奖(J. K. Aggarwal Prize) [25] | 国际模式识别协会 |
2009年 | “长江学者”讲座教授 | 中国教育部 |
2011年 | 电气和电子工程师学会会士(Fellow) | 电气和电子工程师学会(IEEE) |
2013年 | 赫尔姆霍茨奖(Helmholtz Test-of-Time Award) | 第14届国际计算机视觉大会 |
2017年 | 计算建模奖(Computational Modeling Prize) | 国际认知科学学会(Cognitive Science Society) |
2023年10月 | ||
参考资料来源: [2] |
2023年2月11日,朱松纯在北京大学智能学科战略研讨会上的讲话以署名文章《以有组织科研推进原创性、引领性创新》刊登在2023年2月18日在《光明日报》上,他提出疑问“为什么近年来世界各国科研人员成倍增长、经费越来越多、科研条件越来越好,却产生不了根本性的科学发现?” [45]。在他看来,重大基础性原创性科学成果“难产”的主要原因在于,与过去相比,当前的科研驱动力、科研组织模式、科学问题的复杂性均发生了改变。尤其是在现行科研组织模式下,科学研究在全球范围内成为一种职业,“写本子”“数论文”“比引用量”之风日盛,群体越来越大,而科学研究越来越同质化、“内卷”,产生了显著的马太效应 [44]。
朱松纯认为,以有组织科研为引领,要重点突破三个方面:(一)站在新的历史转折点,凝聚新的战略驱动力,形成新的战略思维;(二)坚持自由探索与有组织科研相结合,孕育新的科研范式和评价机制;(三)以有组织的科研模式打通“学研产”创新链条 [44]。
- 通识专业
2021年年初,清华大学和北京大学两校联手深化人才培养体系改革,由朱松纯领衔打造通用人工智能实验班,开设交叉学科课程,探索通用人工智能前沿基础研究和顶尖人才培养新模式 [14] 。
2021年,朱松纯分别在北京大学元培学院和清华大学自动化系成立“通用人工智能实验班”,面向人工智能未来发展方向,打造全新的本博贯通的课题体系,并发布《通用人工智能人才培养计划》白皮书,培养通用人工智能方向的“通识、通智、通用”型国际顶尖复合型人才 [14]。
2023年,由朱松纯领衔,北京通用人工智能研究院与北京大学、浙江大学、上海交通大学、中国科学技术大学、武汉大学、华中科技大学、北京理工大学、电子科技大学和北京邮电大学共9所高校参与的通用人工智能协同攻关合作体人才培养计划在北京正式启动,9所高校共同探索通用人工智能人才培养新模式 [20]。
朱松纯在加州大学洛杉矶分校、北京大学、清华大学等高校任教期间,先后指导了计算机科学和统计学专业的硕士生、博士生、访问博士生和博士后 [26]。
时间 | 姓名 | 论文题目/研究主题 | 层次 |
---|---|---|---|
2002 | Zhuowen Tu[CS] | Image Parsing by Data-Driven Markov Chain Monte Carlo | 博士 (Ph.D) |
2004 | Cheng-En Guo[CS] | A Mathematical Theory for Texton and Primal Sketch | |
2005 | Adrian Barbu[CS] | Cluster Sampling and Its Applications in Segmentation, Stereo and Motion | |
2005 | Yizhou Wang[CS] | Modeling Complex Motion: Photometric, Geometric, Topological, and Dynamic Aspects | |
2005 | Feng Han[CS] | Computing 3D Scene From A Single Image by Bottom-up/Top-Down Bayesian Inference | |
2006 | Romeo Maciuca[Stat] | MCMC Analysis: First Hitting Times, Visiting Scheme, and Auxiliary Variables | |
2007 | Zijian Xu[Stat] | A Hierarchical Compositional Model for Representation and Sketching of High-resolution Human Images | |
2009 | Kent Shi[Stat] | Mapping Natural Image Patches by Explicit and Implicit Manifolds | |
2010 | Jacob Porway[Stat] | A Hierarchical and Contextual Model for Learning and Recognizing Highly Variant Visual Categories | |
2011 | Zhangzhang Si[Stat] | Learning And-Or Templates for Object Recognition by Information Projection | |
2011 | Mingtian Zhao[Stat] | A Statistical and Computational theory for the Art of Painting | |
2011 | Tianfu Wu[Stat] | Integration and Goal-guided Scheduling of Bottom-up and Top-Down Computing Processes in Hierarchical Models | |
2011 | Benjamin Yao[Stat] | Learning Spatial-Temporal Models for Understanding Actions and Events in Video | |
2012 | Wenze Hu[Stat] | Integrating 3D and 2D Representations for View-invariant Object Recognition | |
2013 | Brandon Rothrock[CS] | Stochastic Image Grammars for Human Pose Estimation | |
2014 | Maria Pavlovskaia[Stat] | Mapping Highly Non-convex Energy Landscapes in Clustering, Grammar and Curriculum Learning | |
2015 | Jungseock Joo[CS] | Visual Persuasion in Mass Media: A Computational Framework for Understanding Visual Communication | |
2015 | Yibiao Zhao[Stat] | A Quest for Visual Commonsense: Scene Understanding by Functional and Physics Reasoning | |
2016 | Seyoung Park[CS] | Attribute Grammar for Joint Parsing of Human Attribute, Part and Pose | |
2016 | Amy Morrow[Stat] | Learning and Inferring Perceptual Causality from Videos | |
2016 | Dan Xie[Stat] | Inferring the Intentions and Attentions of Agents from Videos | |
2017 | Weixin Li[CS] | Joint Image-Text Topic Detection and Tracking for Analyzing Social and Political News Events | |
2017 | Bruce Nie[Stat] | Spatial-Temporal Hierarchical Model for Joint Learning and Inference of Human Action and Pose | |
2017 | Yang Lu[Stat] | Coupling and Learning Hierarchical Generative and Descriptive Models for Image Synthesis and Analysis | |
2017 | Chengcheng Yu[Stat] | Single View 3D Scene Reconstruction Using Visual Commonsense | |
2018 | Hang Qi[CS] | Joint Spatial, Temporal, and Causal Inference and Restricted Turng Test via Storyline Queries | |
2018 | Yixin Zhu[Stat] | Visual Commonsense Reasoning: Functionality, Physics, Causality, and Utility | |
2019 | Yuanlu Xu[CS] | 3D Scene and Event Understanding by Joint Spatial and Temporal Inference and Reasoning | |
2019 | Siyuan Qi[CS] | Task-oriented Visual Understanding of Scenes and Events | |
2019 | Nishant Shukla[CS] | Utility Learning, Non-Markovian Planning, and Task-Oriented Programming Language | |
2019 | Tianmin Shu[Stat] | Social Scene Understanding: ?Group Activity Parsing, Human-Robot Interactions, and Perception of Animacy | |
2019 | Yang Liu[Stat] | Learning Fluents for Task Representation | |
2019 | Tao Yuan[Stat] | A Cognition Platform for Joint Inference of 3D Geometry, Object States, and Human Belief | |
2020 | Mitchell Hill[Stat] | Learning and Mapping Energy Functions of High-Dimensional Image Data | |
2021 | Hangxin Liu[CS] | Robot Imitation by Action Understanding, Mirroring, and Interactions | |
2021 | Siyuan Huang[Stat] | Human-like Hollistic 3D Scene Understanding | |
2021 | Xu Xie[Stat] | Robot Learning from Interactions with Physics-realistic Environment: Constructing Big Task Platform for Training AI Agents | |
2021 | Zilong Zheng[CS] | Multimodal Conversation Modeling via Neural Perception, Structure Learning, and Communication | |
2021 | Feng Shi[CS] | Adaptive AI algorithms & Unified Hardware Acceleration | |
2021 | Lifeng Fan[Stat] | A Hierarchical Computational Framework for Social Interaction Understanding | |
2021 | Tengyu Liu[CS] | Hierarchical Modeling of Human-Object Interactions: from Concurrent Action Parsing to Physics-Based Grasping | |
2021 | Ruiqi Gao[Stat] | Effective Learning of Descriptive and Generator Models and Learning Representations for Grid Cells and V1 Cells | |
2021 | Erik Nijkamp[Stat] | Learning Descriptive and Generative Models with Short-Run MCMC | |
2021 | Mark Edmonds[CS] | Learning How and Why: Causal Learning and Explanation from Physical, Interactive, and Communicative Environments | |
2021 | Arjun Akula[Stat] | Gaining Justified Human Trust by Improving Explainability in Vision and Language Reasoning Models | |
—— | Luyao Yuan[CS] | on Communicative Learning and Referential Game for Concept Learning | |
—— | Xiaofeng Gao[Stat] | on Multi-agent Collaborations and Explainable AI | |
—— | Yixin Chen[Stat] | Holistic Scene and Event Parsing | |
—— | Chi Zhang[CS] | A Unified Framework for Concept Learning from Few Examples: IQ-Test and Number Sense | |
—— | Shu Wang[Stat] | Fluent Calculus and Task Space in Real World Scenes | |
—— | Qing Li[Stat] | Language Grounding and Alignment in Multi-Agent System | |
—— | Sirui Xie[CS] | The Interactions and Convergence of U and V | |
—— | Pan Lu[CS] | Scenario-Based Problem Solving with Joint Image-Text parsing and Commonsense Reasoning | |
—— | Ziyuan Jiao[ME] | Robot Manipulation, Causal Action Planning and Motion Planning | |
—— | Baoxiong Jia[CS] | Joint Scene and Event Parsing and Prodiction | |
—— | Zeyu Zhang[CS] | Tool Manipulation | |
—— | Yizhou Zhao[Stat] | Learning and Communication in Multi-agent System | |
—— | Steven Gong[CS] | Scenario-Based Problem Solving | |
—— | Muzhi Han[ME] | Robot Action Planning based on Scene Understanding and Cognitive Reasoning | |
—— | Jonathan Mitchell[CS] | Joint Scene and Activity Understanding | |
—— | Liang Qiu[EE] | Social and Conversational Agents | |
—— | Yining Hong[CS] | Neural Symbolic Reasoning, Automated Math Problem Solving and Commonsense Reasoning | |
—— | Xiaojian Ma[CS] | Robotics and Multi-agent Systems | |
—— | Dequan Kong[Stat] | Statistical Modeling and Learning | |
—— | Xu Chao[Stat] | Scene Understanding | |
—— | Qian Long[CS] | Multi-Agent Systems | |
1999—2000 | Xiuwen Liu | Texture modeling and Julesz ensemble | 博士后(Postdocs) |
2003—2006 | Hong Chen | Human face, hair, and cloth modeling and sketching | |
2007—2009 | Haifeng Gong | Intrackability: An information Theoretical Criterion for pursuing Hybrid Video Representations | |
2007—2009 | Liang Lin | Layered Graph Matching | |
2009—2011 | Mingtao Pei | Event understanding and Intent Prediction in Video | |
2011—2014 | Tianfu Wu | Decision policy and learning and-or graph for object detection and tracking | |
2012—2013 | Bo Zheng | 3D scene parsing by reasoning physical stability and risk | |
2012—2014 | Kewei Tu | Joint video and text parsing, query answering, and grammar learning | |
2013—2015 | Xiaobai Liu | Attributed grammar for scene understanding, camera calibration and 3D reconstruction | |
2013—2015 | Wei Liang | Container recognition and causality inferrence | |
2014—2015 | Caiming Xiong | Robot Learning from demonstrations | |
2014—2018 | Quanshi Zhang | Webscale lifelong Communicative Learning | |
2015—2017 | Ping Wei | Inferring the Mind of Agents in Video: Belief, Intent, and Attention | |
2016—2017 | Jianwen Xie | Generative and Decriptive Models (Deep Networks) for Learning | |
2016—2018 | Changsong Liu | Communicative Learning and Situated Dialogues | |
2018—2020 | Yixin Zhu | Cognitive Robots | |
2018—2020 | Keze Wang | Explainable AI and Learning with small labelled examples | |
2009—2011 | Zhi Han | Video Primal Sketch: A Middle Level Generic Representation of Video | 访问博士 (Visiting Ph.D) |
2011—2013 | Shuo Wang | Scene Modeling and Recognition with Tangram Model | |
2011—2012 | Ping Wei | Modeling 4DHOI and Concurrent Action and Affordance | |
2012—2013 | Jifeng Dai | Unsupervised learning for co-segmentation and image parsing | |
2014—2016 | Li Bo | Modeling Occlusion for vehicle detection, parsing, and fluent reasoning | |
2016—2018 | Wenguan Wang | Joint parsing of human poses, attributes and actions by QA learning | |
2017—2019 | Zhenliang Zhang | Mixed reality for robot learning | |
2017—2019 | Zhixiong Nan | Visual attention and intention inference | |
注:CS为计算机科学(Computer Science);Stat为统计学(Statistics)。参考资料来源: [26] |
- 开学典礼讲话
2021年9月2日,朱松纯作为北京大学元培学院的导师代表,在北京大学元培学院2021级开学典礼上讲话时,就“钱学森之问”谈到:中国正在走向世界舞台的聚光灯下,中国科技已然跻身世界前列。通过几代人的积累,国家比任何时候都具备了条件,也有了足够的底气和信心:能够通过内生的机制培养出具有国际视野和勇于担当的杰出人才与学术领袖 [40]。
- 毕业典礼讲话
2022年6月20日,朱松纯作为北京大学智能学院院长,他在北京大学智能学院2022年毕业典礼上的讲话给毕业生提了三个问题:“未名之问”“人生之问”“时代之问”。(1)未名之问:湖边怎么见不到学生?他希望学生一定要学会慢下来,多给自己一点思考和发呆的时间。不纠结于一时的苦乐,不紧盯眼前的得失,不去争眼前的高低。要学会选择,放下那些不重要的事物,才能看得更清、走得更远。(2)人生之问:我是谁?未来的人生一定不会是一帆风顺的,通过不断调整自己的UV系统,从活着、到活得好、到活得明白、活得有意义的升华,成就自己精彩的人生。(3)时代之问:我们的高等学府到底要培养什么样的人才?答案就藏在入学时都要学唱的《燕园情》的歌词里:“眼底未名水,胸中黄河月。”“胸中黄河月”代表了每个中国人应该关注民族的前途和命运,毕业后有一大批同学即将奔赴中国科技企业,以青春之我服务国家科技发展战略,传承北大智能人科技报国的传统 [36]。
2023年7月1日,朱松纯作为北京大学智能学院院长,他在北京大学智能学院2023年毕业典礼上的讲话选取“智能时代”这个主题,希望毕业生作为北大智能人,要做智能时代的先知、先觉、先行者。先知者,要提前预判时势的到来;先觉者,要率先觉悟到时代的使命;先行者,要勇于引领时代的变革。希望毕业生不断提升自我的认知架构和价值体系,形成更大格局的对时代发展趋势的清醒认知、对时代根本使命的率先觉悟、对引领时代变革的笃志力行,做智能时代的先知、先觉、先行者,以中国之思想,创世界之科技,如此才能在时代的潮起潮伏中不断做出正确选择 [35]。
- 教授茶座
2021年3月12日,朱松纯受到北京大学学生工作部邀请,在“教授茶座”与青年学生分享个人求学与研究的经历、探讨科学精神和人生价值,他尝试从文学、科学、哲学三个层面解读《赤壁赋》,从苏轼的经历与哲思中学习人生的定位 [41]。
- 围炉夜话
- 紫冬讲坛
2023年3月27日,朱松纯参加清华大学自动化系在中央主楼接待厅举行的“紫冬讲坛”该学期的首场活动,作了题为“以中国之思想,创世界之科技”的专题报告 [38]。
- 临湖智库沙龙
2023年9月15日,朱松纯参加在北京大学禄岛举行的第四期“临湖智库沙龙”,作了主题为“为人文赋理:从通用人工智能视角解读中国思想”的报告。他总结了指导人工智能的三个哲学思想。第一时期是西方哲学思想为人工智能的逻辑、表达与推理等方面提供了理论框;第二时期是儒家“格物致知”思想承接下产生的数理模型,概率建模与随机计算占据主导地位;现阶段,智能体必须由“心”驱动,才能研发出自主的AI [37]。
- 委员科学讲堂
2024年1月5日,朱松纯参加在北京举行的全国政协“委员科学讲堂”,以“为机器立心——迈向通用人工智能”为题作讲座。他从通用人工智能的基本特征出发,结合人工智能在中国的发展,阐述对推动原创性、引领性科技创新的思考。他认为每个人都是通用智能体,研究通用人工智能其实也是开启人类认识自我的新阶段,通用人工智能与传统中华文化都是研究人性的本质, 是一体两面。他指出,通用人工智能的研究将极大推动文理交叉与学科融合 [39]。
- 治理网络暴力
朱松纯作为全国政协委员,对于治理网络暴力,他从技术层面提出建议,如组建平台算法治理独立专家委员会,发挥人工智能技术效率优势,拟定网络生态评价标准。“具体包括制定用户画像颗粒度、个人隐私采集的范围标准;制定推送信息的多元化标准,杜绝信息茧房的形成;制定平台生态污染指数,指数涵盖违规行为数量规模、事件恶劣性与传播范围、举报频次等因素,定期在显著渠道发布,限期整改。” [28]
- 发展新一代人工智能
朱松纯在《北京大学校报》第1635期第1版上撰文《为机器立心,为人文赋理——建设世界一流智能学科》,对于加快发展新一代人工智能提出:1.着力打造智能科学领军人才培养的摇篮;2.以通用人工智能为抓手,建设世界一流智能学科;3.搭建起人工智能与文理医工交叉平台;4.以有组织科研实现原创性、引领性科技创新 [29]。
- 政协提案
2023年全国两会期间,全国政协委员朱松纯递交了两份关于人工智能的提案 [42]。
在提案《加强人工智能科教体系建设,助力科技自立自强与高质量经济发展》中,朱松纯提到,当前基础与高等教育的能力远远不能满足人工智能的科研快速发展以及企业对于人才的需求,存在一些问题。朱松纯建议,由教育部牵头,委托北京大学等顶尖高校制定覆盖中小学阶段的人工智能一体化课程体系,引入社会力量加强教师培训,加强建设人工智能课程配套设施、研学基地与科普基地,并在有条件的高校加大人工智能专业的本硕博招生录取规模。同时,他也提出,在北京、上海等教育资源优势地区可以参照“清华大学丘成桐数学领军计划”和“北大物理学科卓越人才培养计划”机制,进行超常儿童的选材育才体系建设;而在教育资源相对薄弱的地区,可通过AI辅助促进教育的公平性、降低教学成本、补充该地区师资力量 [42]。
在提案《加快通用人工智能战略布局,抢占全球科技与产业发展制高点》中,朱松纯则谈到了通用人工智能的研究与发展问题。朱松纯认为,通用人工智能将会在安全、产业、社会治理等诸多领域产生颠覆性影响,是未来10-20年国际科技竞争的战略制高点。因此他建议,将通用人工智能提升到当代“两弹一星”的高度。由中央统筹部署,凝聚人才、科研、产业与资本的优势力量,规范发展路径,尽快出台我国通用人工智能发展路线图,建立测试标准,规划底层的认知架构、 核心算法、操作系统、编程语音、体系结构与芯片,形成“学研产用”的创新链条,在通用人工智能这个新兴的战略领域,抢占全球科技与产业发展制高点 [30]。
- 接受采访
2024年3月10日,全国政协十四届二次会议第三场“委员通道”集体采访活动在北京人民大会堂举行,全国政协委员朱松纯接受媒体采访是说:“通用人工智能是新质生产力的典型代表。当下,通用人工智能已经成为全球科技竞争的制高点,要赢得这一场科技竞争,关键还在人才。”朱松纯委员表示,“人类社会正在跨入智能时代,相信在我们的共同努力下,一定能够走出一条符合中国国情的技术路径,让通用人工智能安全发展、造福人类。” [46]
时间 | 担任职务 |
---|---|
2004年 | 《国际计算机视觉杂志》编辑委员会委员 |
2004年 | 《计算机图形学和视觉的基础和趋势》编辑委员会委员 |
2005年 | 莲花山计算机视觉和信息科学研究院院长 |
2005年—2009年 | IEEE Transactions on Pattern Analysis and Machine Intelligence编辑委员会委员 |
2008年—2013年 | 国际模式识别协会Aggarwal奖评选委员会委员 |
2010年—2015年 | 美国视觉、认知科学、AI领域 跨学科合作项目MURI首席科学家 |
2010年—2015年 | MURI场景理解项目首席研究员 |
2011年—2013年 | 国际模式识别协会阿加沃尔奖评选委员会主席 |
2012年 | IEEE计算机学会会士(Fellow)评选委员会副主席 |
2012年 | 国际计算机视觉与模式识别大会(CVPR)主席 |
2013年 | IEEE计算机学会会士委员会副主席 |
2013年 | 中国科学院海外顾问 |
2015年—2021年 | 美国—英国视觉、认知科学、AI领域跨学科合作项目MURI首席科学家 |
2016年—2021年 | MURI视觉常识推理项目首席研究员 |
2019年 | 国际计算机视觉与模式识别大会(CVPR)2019年度主席 |
2022年 | 北京大学武汉人工智能研究院第一届理事会首席科学家 |
2023年 | |
2023年 | 中国人民政治协商会议第十四届全国委员会提案委员会委员 [17] |
2024年 | |
参考资料来源: [2] |
- 父母
朱松纯的父亲在60岁的时候单位倒闭,靠做小生意供他读完了大学 [48]。
- 兄姐
朱松纯是家里5个兄弟姐妹最小的一个,哥哥大他19岁,中间三个姐姐,最小的也大他6岁 [48]。
- 妻子
朱松纯的妻子崔洁毕业于中国科学技术大学 [53],后在美国深造拿到美国国籍,2013年崔洁辞去工作后,全职陪伴女儿朱易滑冰 [54-56]。
- 女儿
朱松纯有着深厚的人文素养,这不仅让他在科学研究中受益良多,也为他打下了爱国、敬业、奉献的精神底色。他通过三读《赤壁赋》,对此千古一赋做了人生思考,并非提供一个关于人生意义的统一答案。每个人可以追求不同的平衡态,自得其乐。他的人生态度是积极入世,也希望人们从追求“活着”、到“活得好”、到“活得有意义”、“活得明白”,甚至到达价值的极限——不朽 [41]。
朱松纯建议,将通用人工智能提升到当代“两弹一星”的高度。由中央统筹部署,凝聚人才、科研、产业与资本的优势力量,规范发展路径,尽快出台我国通用人工智能发展路线图,建立测试标准,规划底层的认知架构、 核心算法、操作系统、编程语音、体系结构与芯片,形成“学研产用”的创新链条,在通用人工智能这个新兴的战略领域,抢占全球科技与产业发展制高点 [30]。
朱松纯在认知科学领域,如视觉常识推理、场景理解及人工智能等领域做出重要贡献 [1]。(中国计算机学会评)
朱松纯为计算机视觉在中国的发展与人才启蒙做出了贡献 [2]。(清华大学自动化系评)
朱松纯是计算机视觉领域的学界泰斗,曾经在美国多个学校任教,后来他放弃在美国的一切,并以“国家战略科学家”的身份回到国家,是最知名的华人AI教授,是人工智能专家 [47]。(湖州统战评)