Paper-Conference

Juntao Dai , Tianle Chen , Xuyao Wang , Ziran Yang , Taiye Chen , Jiaming Ji , Yaodong Yang

NeurIPS 2024.

AI Safety, Safety Alignment

ACL 2025 Best Paper

Large Language Models, Safety Alignment, AI Safety

Tianyi Qiu , Yang Zhang , Xuchuan Huang , Jasmine Xinze Li , Jiaming Ji , Yaodong Yang

NeurIPS 2024.

Large Language Models, AI Alignment

Jiaming Ji , Donghai Hong , Borong Zhang , Boyuan Chen , Josef Dai , Boren Zheng , Tianyi Qiu , Boxun Li , Yaodong Yang

ACL 2025 Main.

Large Language Models, Safety Alignment, Reinforcement Learning from Human Feedback

Josef Dai , Xuehai Pan , Ruiyang Sun , Jiaming Ji , Xinbo Xu , Mickel Liu , Yizhou Wang , Yaodong Yang

ICLR 2024. Spotlight

Safety Alignment, Reinforcement Learning from Human Feedback

Jiaming Ji , Borong Zhang , Jiayi Zhou , Xuehai Pan , Weidong Huang , Ruiyang Sun , Yiran Geng , Yifan Zhong , Juntao Dai , Yaodong Yang

NeurIPS 2023.

Safe Reinforcement Learning, Robotics

Jiaming Ji , Mickel Liu , Juntao Dai , Xuehai Pan , Ce Bian , Chi Zhang , Ruiyang Sun , Yizhou Wang , Yaodong Yang

NeurIPS 2023.

Large Language Models, Safety Alignment, Reinforcement Learning from Human Feedback