跳转至

李煜 (Yu Li)

乔治·华盛顿大学 (George Washington University), 华盛顿特区. 2025.9至今

电子与计算机工程系 (ECE) 博士

武汉大学(Wuhan University) 弘毅学堂2021级

微电子科学与技术 工学学士 (GPA: 3.87/4.0)

研究方向: 强化学习 • 后训练优化 • 生成式AI

Yu Li

我目前是乔治·华盛顿大学 ECE 系博士生,导师是 Tian Lan 教授,并与 Zhengling Qi 教授合作。我本科毕业于武汉大学弘毅学堂

我的研究兴趣主要集中在生成式AI (Generative AI)强化学习 (RL) 以及大语言模型的后训练 (Post-training) 方法。我非常欢迎合作和交流。


近期动态 (News)

  • [02/2026] ACDZero被 ICCN@INFOCOM 2026 接收,东京见。
  • [01/2026] 我在第一学期就通过了博士资格考试!现在已成为博士候选人(PhD Candidate)🎓.
  • [01/2026] 论文 KG-SAM: Injecting Anatomical Knowledge into Segment Anything Models via Conditional Random Fields 被 ICASSP 2026 接收 🎉.
  • [11/2025] 论文 Calibrating and Rotating: A Unified Framework for Weight Conditioning in PEFT 被 AAAI 2026 接收 🎉.

论文发表 (Publications)

预印本 / 在投 (Preprint / Under Review)

Unlocking Implicit Self-Reflection in Preference Optimization for LLM Alignment
2025.8 – 2025.11 · 论文 · 代码
从偏好对中挖掘隐式“自我反思”信号,提升偏好优化与 LLM 对齐效果。
直接偏好优化简单偏好优化强化学习
Aligning LLMs with Finite State Machine Logic for Multi-turn Verilog Code Generation
2025.8 – 2025.11
通过结构化对齐让 LLM 学习有限状态机转移逻辑,实现多轮 Verilog 生成。
RLVR代码生成Verilog 状态机
CRAFT-LORA: Content-Style Personalization via Rank-Constrained Adaptation
2025.4 – 2025.7
秩约束 LoRA 适配,实现内容-风格解耦与个性化图像生成。
生成式AI个性化生图LoRA

会议论文 (Conferences)

ACDZero: MCTS Agent for Mastering Automated Cyber Defense
Yu Li, Sizhe Tang, Rongqian Chen, Fei Xu Yu, Guangyu Jiang, Mahdi Imani, Nathaniel D. Bastian, Tian Lan
ICCN@INFOCOM 2026 · 论文 · 代码
结合图表示学习的 MCTS 规划方法,用于样本高效的自动化网络防御。
网络防御MCTSGNN
KG-SAM: Injecting Anatomical Knowledge into Segment Anything Models via Conditional Random Fields
Yu Li, Da Chang, Xi Xiao
ICASSP 2026 · 论文 · 代码
融合知识图谱解剖先验与 CRF 边界优化的知识引导 SAM 医学分割框架。
医学分割SAM知识图谱CRF
Calibrating and Rotating: A Unified Framework for Weight Conditioning in PEFT
Da Chang, Peng Xue, Yu Li, Yongxiang Liu, Pengxiang Xu, Shixun Zhang
AAAI 2026 · 论文 · 代码
统一“校准 + 旋转”的权重条件化策略,提升 PEFT 性能与训练/推理效率。
LLMs PEFT权重条件化
Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer
Yu Li*, Chang Da*
(*:Equal contribution)
ICONIP 2024 · 论文 · 代码
基于 TrOCR + PEFT 的混合文本识别方法与实用评估流程。
OCRLoRA

期刊论文 (Journals)

Dual branch SAM-Transformer Fusion Network for Accurate Breast Ultrasound Image Segmentation
Y. Li, J. Huang et al.
Medical Physics, JCR Q1, 2025 · 论文 · 代码
双分支 SAM–Transformer 融合网络,用于高精度乳腺超声分割。
超声分割SAMTransformer
SfMDiffusion: Self-supervised Monocular Depth Estimation in Endoscopy Based on Diffusion Models
Y. Li, D. Chang et al.
International Journal of Computer Assisted Radiology and Surgery, JCR Q2, 2025 · 论文 · 代码
面向内窥镜场景的自监督单目深度估计:扩散模型结合教师引导蒸馏。
深度估计扩散模型知识蒸馏

科研经历 (Experiences)

乔治·华盛顿大学, 移动智能实验室
研究课题: 训练后优化, 强化学习, 推理
导师: Prof. Tian Lan · 2025年8月 – 至今
西湖大学, 人工通用智能实验室
研究课题: 生成式AI
导师: Prof. Chi Zhang · 2025年3月 – 2025年7月
加州大学尔湾分校, 信息物理系统实验室
研究课题: 多模态不确定性融合
导师: Prof. Mohammad Al Faruque · 2024年6月 – 2024年10月

荣誉奖项 (Honors and Awards)

  • 英诺国际交流奖学金,武汉大学,2024
  • 英诺卓越奖学金(Top 3%),武汉大学,2023,2024
  • 学术优秀奖学金(Top 5%),弘毅学堂,2022,2023,2024
  • 甲等奖学金(Top 5%),武汉大学,2022,2023,2024
  • 专利: 一种节能计算方法, CN116085952.

学术服务 (Academic Services)

  • 会议审稿人: ICML’26, CVPR’26, ICLR’26, AAAI’26, ICASSP’26
  • 期刊审稿人: Neurocomputing, Frontiers in Oncology, IEEE Transactions on Networking

这个网站模版是从我最好的朋友那里偷来的。