跳转至

李煜 (Yu Li)

乔治·华盛顿大学 (George Washington University), 华盛顿特区. 2025.9至今

电子与计算机工程系 (ECE) 博士

武汉大学(Wuhan University) 弘毅学堂2021级

微电子科学与技术 工学学士 (GPA: 3.87/4.0)

研究方向: 强化学习 • 后训练优化 • 生成式AI

Yu Li

我目前是乔治·华盛顿大学ECE系的一年级博士生,导师是 Tian Lan 教授。我本科毕业于武汉大学弘毅学堂

我的研究兴趣主要集中在生成式AI (Generative AI)强化学习 (RL) 以及大语言模型的后训练 (Post-training) 方法。我非常欢迎合作和交流。


近期动态 (News)

  • [04/2025] 我在乔治·华盛顿大学开始了我的博士生涯,导师是 Tian Lan 教授。
  • [03/2025] 我加入了 AGI 实验室进行毕业前实习,主要研究生成模型。
  • [08/2024] 我获得了英诺卓越奖学金 (Innova Excellence Scholarship) (Top 3%)。

精选项目 (Selected Projects)

在LLM对齐中解锁偏好优化的隐式自反思
2025年8月 – 至今
利用偏好对中的隐式偏好信息建立自我改进机制,推广现有偏好优化方法的理论基础,以增强LLM对齐。
DPOSimPO偏好学习
对齐LLM与有限状态机逻辑以生成多轮Verilog代码
2025年9月 – 至今
使LLM通过结构化对齐学习有限状态机的状态转换逻辑,构建用于Verilog代码合成的多轮生成范式。
RLVRLLM代码生成Verilog 状态机
CRAFT-LORA: 通过秩约束自适应实现内容-风格个性化
2025年4月 – 2025年7月
通过秩空间约束微调增强内容-风格LoRA分解,并通过提示映射和非对称CFG实现风格-内容LoRA融合,以实现个性化图像生成。
生成式AI个性化生图LoRA
Prada: 在设备上利用私有数据进行黑盒LLM自适应
2025年1月 – 2025年4月 · Paper
通过概率差分方法在边缘设备系统上实现高效的黑盒LLM自适应,同时强有力地保护数据隐私。
黑盒LLM边缘AI隐私保护
视觉-语言模型引导的不确定性感知跨模态传感器融合
Y. Li, J. Wang, P. Khargonekar, and M. A. A. Faruque
WACV 2026 · 代码
我们的主要工作是构建VLM以改善异常天气条件下的自动驾驶模式,重点改进摄像头-激光雷达分支的多模态融合算法。
自动驾驶传感器融合视觉-语言模型
DLoRA-TrOCR: 基于Transformer的混合文本模式光学字符识别
Yu Li*, Chang Da*
(*:Equal contribution)
ICONIP 2024 · Paper · Code
基于TrOCR的OCR,采用高效PEFT处理混合文本;实用的流程和评估。
OCRLoRA
基于SAM和Transformer多层特征融合的双分支乳腺超声图像分割
Y. Li, J. Huang et al.
Medical Physics, Q1, 2025 · 论文 · 代码
我们利用SAM丰富的语义分割信息,并将其细粒度注意力能力应用于Transformer的特征提取模块,在超声图像分割中实现了SOTA的IoU分数。
超声分割SAMTransformer
SfMDiffusion: 基于扩散模型的内窥镜自监督单目深度估计
Y. Li, D. Chang et al.
International Journal of Computer Assisted Radiology and Surgery, Q2, 2025 · 论文 · 代码
针对内窥镜医疗场景,我们使用扩散模型进行深度估计。我们构建了一个教师模型,设置了知识蒸馏、光学外观和ddim损失,并引入了教师的判别先验,显著提高了结果的准确性和置信度。
深度估计扩散模型知识蒸馏

科研经历 (Experiences)

乔治·华盛顿大学, 移动智能实验室
研究课题: 训练后优化, 强化学习, 推理
导师: Prof. Tian Lan · 2025年8月 – 至今
西湖大学, 人工通用智能实验室
研究课题: 生成式AI
导师: Prof. Chi Zhang · 2025年6月 – 2025年7月
加州大学尔湾分校, 信息物理系统实验室
研究课题: 多模态不确定性融合
导师: Prof. Mohammad Al Faruque · 2024年6月 – 2024年10月

荣誉奖项 (Honors and Awards)

  • 英诺国际交流奖学金, 武汉大学, 2024
  • 英诺卓越奖学金 (Top 3%), 武汉大学, 2023, 2024
  • 学术优秀奖学金 (Top 5%), 弘毅学堂, 2022, 2023, 2024
  • 甲等奖学金 (Top 5%), 武汉大学, 2022, 2023, 2024
  • 专利: 一种节能计算方法, CN116085952.

技能 (Skills)

  • 语言: 英语 (托福 110), 中文 (母语), 日语 (N5)
  • 编程: Python, C/C++, Matlab, Verilog
  • 工具 & 平台: Ubuntu, Docker, Pytorch, Tensorflow, Git, Cadence

这个网站模版是从我最好的朋友那里偷来的。