李煜 (Yu Li)
乔治·华盛顿大学 (George Washington University), 华盛顿特区. 2025.9至今
武汉大学(Wuhan University) 弘毅学堂2021级
研究方向: 强化学习 • 后训练优化 • 生成式AI
![]()
我目前是乔治·华盛顿大学ECE系的一年级博士生,导师是 Tian Lan 教授。我本科毕业于武汉大学弘毅学堂。
我的研究兴趣主要集中在生成式AI (Generative AI)、强化学习 (RL) 以及大语言模型的后训练 (Post-training) 方法。我非常欢迎合作和交流。
- 📄 简历 (CV)
- 🧪 GitHub
- 🎓 谷歌学术 (Google Scholar)
- 💼 领英 (LinkedIn)
- ✉️ yul@gwu.edu
近期动态 (News)
- [04/2025] 我在乔治·华盛顿大学开始了我的博士生涯,导师是 Tian Lan 教授。
- [03/2025] 我加入了 AGI 实验室进行毕业前实习,主要研究生成模型。
- [08/2024] 我获得了英诺卓越奖学金 (Innova Excellence Scholarship) (Top 3%)。
精选项目 (Selected Projects)
在LLM对齐中解锁偏好优化的隐式自反思
利用偏好对中的隐式偏好信息建立自我改进机制,推广现有偏好优化方法的理论基础,以增强LLM对齐。
DPOSimPO偏好学习
对齐LLM与有限状态机逻辑以生成多轮Verilog代码
使LLM通过结构化对齐学习有限状态机的状态转换逻辑,构建用于Verilog代码合成的多轮生成范式。
RLVRLLM代码生成Verilog 状态机
CRAFT-LORA: 通过秩约束自适应实现内容-风格个性化
通过秩空间约束微调增强内容-风格LoRA分解,并通过提示映射和非对称CFG实现风格-内容LoRA融合,以实现个性化图像生成。
生成式AI个性化生图LoRA
视觉-语言模型引导的不确定性感知跨模态传感器融合
我们的主要工作是构建VLM以改善异常天气条件下的自动驾驶模式,重点改进摄像头-激光雷达分支的多模态融合算法。
自动驾驶传感器融合视觉-语言模型
基于SAM和Transformer多层特征融合的双分支乳腺超声图像分割
我们利用SAM丰富的语义分割信息,并将其细粒度注意力能力应用于Transformer的特征提取模块,在超声图像分割中实现了SOTA的IoU分数。
超声分割SAMTransformer
SfMDiffusion: 基于扩散模型的内窥镜自监督单目深度估计
针对内窥镜医疗场景,我们使用扩散模型进行深度估计。我们构建了一个教师模型,设置了知识蒸馏、光学外观和ddim损失,并引入了教师的判别先验,显著提高了结果的准确性和置信度。
深度估计扩散模型知识蒸馏
科研经历 (Experiences)
乔治·华盛顿大学, 移动智能实验室
西湖大学, 人工通用智能实验室
加州大学尔湾分校, 信息物理系统实验室
荣誉奖项 (Honors and Awards)
- 英诺国际交流奖学金, 武汉大学, 2024
- 英诺卓越奖学金 (Top 3%), 武汉大学, 2023, 2024
- 学术优秀奖学金 (Top 5%), 弘毅学堂, 2022, 2023, 2024
- 甲等奖学金 (Top 5%), 武汉大学, 2022, 2023, 2024
- 专利: 一种节能计算方法, CN116085952.
技能 (Skills)
- 语言: 英语 (托福 110), 中文 (母语), 日语 (N5)
- 编程: Python, C/C++, Matlab, Verilog
- 工具 & 平台: Ubuntu, Docker, Pytorch, Tensorflow, Git, Cadence
这个网站模版是从我最好的朋友那里偷来的。