师资队伍

师资队伍

范文慧

教授、博士生导师
工业智能与系统研究所
教育背景

    1986年09月至1990年07月 西北工业大学,工学学士

    1992年09月至1995年07月 哈尔滨工业大学,工学硕士

    1995年09月至1998年12月 浙江大学,工学博士

工作履历

    1990年09月至1992年07月,中国航发沈阳黎明航空发动机(集团)有限责任公司,工艺员

    1998年12月至2000年12月,清华大学自动化系,博士后

    2000年12月至2002年12月,清华大学自动化系,讲师

    2002年12月至2012年11月,清华大学自动化系 ,副教授

    2012年12月至今,清华大学自动化系,教授

    2014年09月至2017年07月,新疆大学电气工程学院院长(援疆)

    2017年01月至2019年12月,清华大学自动化系副主任

学术兼职

    中国仿真学会,常务理事

    《系统仿真学报》,顾问

研究领域

    1. 物理信息机器学习(PIML)

    物理信息神经网络(Physics-Informed Neural Networks)、物理信息机器学习(Physics-Informed Machine Learning)方法、大语言模型增强(LLM Augmented)的物理信息机器学习方法等。

    2. 组合优化与机器学习

    组合优化(CO)问题的深度学习求解方法、组合优化(CO)问题的强化学习求解方法、大语言模型增强(LLM Augmented)的组合优化建模与求解方法等。

    3. 多智能体(Multi-Agents)学习、仿真与控制

    研究多智能体强化学习(MARL)方法、基于大语言模型智能体(LLM Agent)的建模与仿真方法、基于学习的模型预测控制(LB_MPC)方法等。

研究概况

    1.清华大学(自动化系)-医渡云(北京)技术有限公司智慧自主医疗系统联合研究中心 科研机构 2018.05-2021.05 负责人

    2.众智网络理论与仿真与实验平台研发 国家重点研发计划课题子任务 2017.12-2020.05 负责人

    3.复杂产品分布式快速协同仿真优化方法研究及其应用 国家自然科学基金项目,2016.01-2019.12 负责人

奖励与荣誉

    2016年 获得国家科技进步二等奖(排名第五)

    2010年 获得教育部科技进步二等奖(排名第二)

    2010年 获得清华大学第12届研究生“良师益友”

    2008年 获得北京市科技进步三等奖(排名第二)

    2007年 获得教育部科技进步应用二等奖(排名第四)

    2001年 获得北京市科技进步奖二等奖(排名第二)

学术成果

    [1] Guo X, Huang K, Liu J, Fan W, Vélez N, Wu Q, Wang H, Griffiths TL, Wang M. Embodied LLM Agents Learn to Cooperate in Organized Teams[J]. IEEE Transactions on Computational Social Systems, 2026, 13(2):2514-2530.

    [2] Tong J, Du S, Shi D, Fan W. OdML: An Optimization-driven Meta-learning Framework for Multi-task Approximate Model Predictive Control[J]. Applied Soft Computing, 2025,185, 113882.

    [3] Tong J, Du S, Fan W. Ensemble Neural Network‐Based Approximate Model Predictive Control With Strict Guarantees[J]. International Journal of Robust and Nonlinear Control, 2025,35(17):7295-7308.

    [4] Guo X, Shi D, Yu J, Fan W. Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration[J]. Neurocomputing,2025,648, 130716.

    [5] 范文慧, 蒋沅. 人工智能时代的仿真科学与工程思考[J]. 系统仿真学报, 2025, 37(7): 1607-1623.

    [6] Tong J, Du S, Fan W, et al. Automatic Tuning of Robust Model Predictive Control in Iterative Tasks Using Efficient Bayesian Optimization[J]. Transactions of the Institute of Measurement and Control, 2024, 46(7): 1362-1373.

    [7] Chen P, Fan W. Identifying critical nodes via link equations and deep reinforcement learning [J]. Neurocomputing, 2023, 562, 126871

    [8] Tong J, Shi D, Liu Y, Fan W. Gldap: Global Dynamic Action Persistence Adaptation for Deep Reinforcement Learning[J]. ACM Transactions on Autonomous and Adaptive Systems, 2023, 18(2): 1-18.

    [9] Shi D, Guo X, Liu Y, Fan W. Optimal Policy of Multiplayer Poker via Actor-Critic Reinforcement Learning[J]. Entropy, 2022, 24(6):774.

    [10] Shi D, Tong J, Liu Y, Fan W. Knowledge Reuse of Multi-Agent Reinforcement Learning in Cooperative Tasks[J]. Entropy, 2022, 24(4):470.

    [11] Fan W, Chen P, Shi D, Guo X, & Kou L. Multi-agent modeling and simulation in the AI age. Tsinghua Science & Technology, 2021,26(5): 608-624.

    [12] Shi D, Fan W, Xiao Y, Lin T, Xing C. Intelligent Scheduling of Discrete Automated Production Line via Deep Reinforcement Learning[J]. International Journal of Production Research, 2020, 58(11):3362-3380.