1986年09月至1990年07月 西北工业大学,工学学士
1992年09月至1995年07月 哈尔滨工业大学,工学硕士
1995年09月至1998年12月 浙江大学,工学博士
1990年09月至1992年07月,中国航发沈阳黎明航空发动机(集团)有限责任公司,工艺员
1998年12月至2000年12月,清华大学自动化系,博士后
2000年12月至2002年12月,清华大学自动化系,讲师
2002年12月至2012年11月,清华大学自动化系 ,副教授
2012年12月至今,清华大学自动化系,教授
2014年09月至2017年07月,新疆大学电气工程学院院长(援疆)
2017年01月至2019年12月,清华大学自动化系副主任
中国仿真学会,常务理事
《系统仿真学报》,顾问
1. 物理信息机器学习(PIML)
物理信息神经网络(Physics-Informed Neural Networks)、物理信息机器学习(Physics-Informed Machine Learning)方法、大语言模型增强(LLM Augmented)的物理信息机器学习方法等。
2. 组合优化与机器学习
组合优化(CO)问题的深度学习求解方法、组合优化(CO)问题的强化学习求解方法、大语言模型增强(LLM Augmented)的组合优化建模与求解方法等。
3. 多智能体(Multi-Agents)学习、仿真与控制
研究多智能体强化学习(MARL)方法、基于大语言模型智能体(LLM Agent)的建模与仿真方法、基于学习的模型预测控制(LB_MPC)方法等。
1.清华大学(自动化系)-医渡云(北京)技术有限公司智慧自主医疗系统联合研究中心 科研机构 2018.05-2021.05 负责人
2.众智网络理论与仿真与实验平台研发 国家重点研发计划课题子任务 2017.12-2020.05 负责人
3.复杂产品分布式快速协同仿真优化方法研究及其应用 国家自然科学基金项目,2016.01-2019.12 负责人
2016年 获得国家科技进步二等奖(排名第五)
2010年 获得教育部科技进步二等奖(排名第二)
2010年 获得清华大学第12届研究生“良师益友”
2008年 获得北京市科技进步三等奖(排名第二)
2007年 获得教育部科技进步应用二等奖(排名第四)
2001年 获得北京市科技进步奖二等奖(排名第二)
[1] Guo X, Huang K, Liu J, Fan W, Vélez N, Wu Q, Wang H, Griffiths TL, Wang M. Embodied LLM Agents Learn to Cooperate in Organized Teams[J]. IEEE Transactions on Computational Social Systems, 2026, 13(2):2514-2530.
[2] Tong J, Du S, Shi D, Fan W. OdML: An Optimization-driven Meta-learning Framework for Multi-task Approximate Model Predictive Control[J]. Applied Soft Computing, 2025,185, 113882.
[3] Tong J, Du S, Fan W. Ensemble Neural Network‐Based Approximate Model Predictive Control With Strict Guarantees[J]. International Journal of Robust and Nonlinear Control, 2025,35(17):7295-7308.
[4] Guo X, Shi D, Yu J, Fan W. Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration[J]. Neurocomputing,2025,648, 130716.
[5] 范文慧, 蒋沅. 人工智能时代的仿真科学与工程思考[J]. 系统仿真学报, 2025, 37(7): 1607-1623.
[6] Tong J, Du S, Fan W, et al. Automatic Tuning of Robust Model Predictive Control in Iterative Tasks Using Efficient Bayesian Optimization[J]. Transactions of the Institute of Measurement and Control, 2024, 46(7): 1362-1373.
[7] Chen P, Fan W. Identifying critical nodes via link equations and deep reinforcement learning [J]. Neurocomputing, 2023, 562, 126871
[8] Tong J, Shi D, Liu Y, Fan W. Gldap: Global Dynamic Action Persistence Adaptation for Deep Reinforcement Learning[J]. ACM Transactions on Autonomous and Adaptive Systems, 2023, 18(2): 1-18.
[9] Shi D, Guo X, Liu Y, Fan W. Optimal Policy of Multiplayer Poker via Actor-Critic Reinforcement Learning[J]. Entropy, 2022, 24(6):774.
[10] Shi D, Tong J, Liu Y, Fan W. Knowledge Reuse of Multi-Agent Reinforcement Learning in Cooperative Tasks[J]. Entropy, 2022, 24(4):470.
[11] Fan W, Chen P, Shi D, Guo X, & Kou L. Multi-agent modeling and simulation in the AI age. Tsinghua Science & Technology, 2021,26(5): 608-624.
[12] Shi D, Fan W, Xiao Y, Lin T, Xing C. Intelligent Scheduling of Discrete Automated Production Line via Deep Reinforcement Learning[J]. International Journal of Production Research, 2020, 58(11):3362-3380.