我将本科即将毕业于上海交通大学 机械与动力工程学院,我目前的导师是陈谐教授。
🎓 学历
📝 论文专利
- Hao-Hui Xie, Ho-Lam Chung, Yi-Cheng Lin, Ke-Han Lu, Wenze Ren, Xie Chen, and Hung-yi Lee. “TW-Sound580K: A Regional Audio-Text Dataset with Verification-Guided Curation for Localized Audio-Language Modeling.” 已投稿 Interspeech 2026, arXiv:2603.05094. [论文]
- Tengjie Zhu, Guanyu Cai, Yang Zhaohui, Guanzhu Ren, Hao-Hui Xie, ZiRui Wang, Junsong Wu, Jingbo Wang, Xiaokang Yang, Yao Mu, and Yichao Yan. “CLOT: Closed-Loop Global Motion Tracking for Whole-Body Humanoid Teleoperation.” 已投稿 RSS 2026, arXiv:2602.15060. [论文]
🏅 荣誉奖项
- 2023.2 美国大学生数学建模比赛
M奖 - 2023.12 上海交通大学学业优秀奖学金
C类奖学金 - 2024.12 上海交通大学学业优秀奖学金
B类奖学金 - 2024.5 上海交通大学优秀学生干部
📌 学术会议
参加了在台湾台北举办的第17届亚洲机器学习会议(ACML 2025)。
💻 科研实习
- *2025.04 - *, 上海交通大学ScaleLab实验室,指导老师穆尧(Yao Mark Mu)
- 2025.07 - 2025.8, 浙江灵巧智能科技有限公司, 嵌入式与AI实习生
- 2025.9 - 2026.01, 台湾大学电气工程学系语音处理实验室,指导老师李宏毅(Hongyi Lee)
- 基于 DeSTA2.5 框架对大规模台湾语音语言模型进行微调,集成 Llama3-8B 作为文本骨干网络,Whisper-v3 作为声学编码器。实现了基于 LoRA 的对齐和时间戳感知微调,以增强口音适应性并提高跨区域方言的 ASR 鲁棒性。
- 设计并优化了完整的多 GPU 训练和评估流程,包括数据预处理、特征提取、LoRA 参数高效训练,以及在 TAU-TW Benchmark 等语音基准上的分布式评估。与基线模型相比,识别准确率相对提升 8-10% 以上。
- 开发并实验了结合对比损失和多层级特征融合的语音-语言对齐策略,使模型能够在复杂声学变化(如台湾国语、闽南语和混合口音语音)下进行跨语言推理和上下文驱动的转录。
- *2026.01 - *, 上海交通大学 X-LANCE 实验室,指导老师 陈谐(Chen Xie)
🚀 开源项目
- openclaw-sjtu —— 面向交大同学的全能 AI 校园助手,基于 OpenClaw 技能框架构建,涵盖作业追踪、选课参谋、水源社区智能摘要、交大 PPT 一键生成等 21+ 项功能。

