李煜 (Yu Li)
乔治·华盛顿大学 (George Washington University), 华盛顿特区. 2025.9至今
武汉大学(Wuhan University) 弘毅学堂2021级
研究方向: 强化学习 • 后训练优化 • 生成式AI
![]()
我目前是乔治·华盛顿大学ECE系的一年级博士生,导师是 Tian Lan 教授。我本科毕业于武汉大学弘毅学堂。
我的研究兴趣主要集中在生成式AI (Generative AI)、强化学习 (RL) 以及大语言模型的后训练 (Post-training) 方法。我非常欢迎合作和交流。
- 📄 简历 (CV)
- 🧪 GitHub
- 🎓 谷歌学术 (Google Scholar)
- 💼 领英 (LinkedIn)
- ✉️ yul@gwu.edu
近期动态 (News)
- [10/2025] 我们的工作 Calibrating and Rotating: A Unified Framework for Weight Conditioning in PEFT 被 AAAI 2026 接收 🎉.
- [04/2025] 我在乔治·华盛顿大学开始了我的博士生涯,导师是 Tian Lan 教授 🎓。
- [03/2025] 我加入了 AGI 实验室进行毕业前实习,主要研究生成模型。
- [08/2024] 我获得了英诺卓越奖学金 (Innova Excellence Scholarship) (Top 3%)。
精选项目 (Selected Projects)
Unlocking Implicit Self-Reflection in Preference Optimization for LLM Alignment
利用偏好对中的隐式偏好信息建立自我改进机制,推广现有偏好优化方法的理论基础,以增强LLM对齐。
DPOSimPO偏好学习
Aligning LLMs with Finite State Machine Logic for Multi-turn Verilog Code Generation
使LLM通过结构化对齐学习有限状态机的状态转换逻辑,构建用于Verilog代码合成的多轮生成范式。
RLVRLLM代码生成Verilog 状态机
CRAFT-LORA: Content-Style Personalization via Rank-Constrained Adaptation
通过秩空间约束微调增强内容-风格LoRA分解,并通过提示映射和非对称CFG实现风格-内容LoRA融合,以实现个性化图像生成。
生成式AI个性化生图LoRA
Prada: Black-Box LLM Adaptation with Private Data on Devices
· Paper
· Paper
通过概率差分方法在边缘设备系统上实现高效的黑盒LLM自适应,同时强有力地保护数据隐私。
黑盒LLM边缘AI隐私保护
Calibrating and Rotating: A Unified Framework for Weight Conditioning in PEFT
分析DoRA与LoRA的性质,并统一“校准 + 旋转”的权重条件化策略,提升 PEFT 的性能与训练推理效率。
LLMs PEFT权重条件化
Mixed Text Recognition with Efficient Parameter Fine-Tuning and Transformer
· 论文 · 代码
基于TrOCR的OCR,采用高效PEFT处理混合文本;实用的流程和评估。
OCRLoRA
Dual branch SAM-Transformer Fusion Network for Accurate Breast Ultrasound Image Segmentation
我们利用SAM丰富的语义分割信息,并将其细粒度注意力能力应用于Transformer的特征提取模块,在超声图像分割中实现了SOTA的IoU分数。
超声分割SAMTransformer
SfMDiffusion: Self-supervised Monocular Depth Estimation in Endoscopy Based on Diffusion Models
针对内窥镜医疗场景,我们使用扩散模型进行深度估计。我们构建了一个教师模型,设置了知识蒸馏、光学外观和ddim损失,并引入了教师的判别先验,显著提高了结果的准确性和置信度。
深度估计扩散模型知识蒸馏
科研经历 (Experiences)
乔治·华盛顿大学, 移动智能实验室
西湖大学, 人工通用智能实验室
加州大学尔湾分校, 信息物理系统实验室
荣誉奖项 (Honors and Awards)
- 英诺国际交流奖学金, 武汉大学, 2024
- 英诺卓越奖学金 (Top 3%), 武汉大学, 2023, 2024
- 学术优秀奖学金 (Top 5%), 弘毅学堂, 2022, 2023, 2024
- 甲等奖学金 (Top 5%), 武汉大学, 2022, 2023, 2024
- 专利: 一种节能计算方法, CN116085952.
技能 (Skills)
- 语言: 英语 (托福 110), 中文 (母语), 日语 (N5)
- 编程: Python, C/C++, Matlab, Verilog
- 工具 & 平台: Ubuntu, Docker, Pytorch, Tensorflow, Git, Cadence
这个网站模版是从我最好的朋友那里偷来的。