Jiaming Ji (吉嘉铭)

引用先

	すべて	2019 年以来
引用	1294	1293
h 指標	12	12
i10 指標	15	15

1100

550

275

825

20222023202410 182 1099

オープンアクセス

すべて表示

7 件の論文

0 件の論文

利用可能

利用不可

助成機関の要件に基づく

共著者

Yaodong YangBOYA (博雅) Assistant Professor at Peking University確認したメールアドレス: pku.edu.cn
Xuehai PanPeking University確認したメールアドレス: pku.edu.cn
Boyuan ChenPeking University確認したメールアドレス: stu.pku.edu.cn
Tianyi (Alex) QiuPeking University, UC Berkeley確認したメールアドレス: berkeley.edu
Hantao LouPeking University確認したメールアドレス: stu.pku.edu.cn
Stephen McAleerOpenAI確認したメールアドレス: openai.com
Yiran GengTuring Class, Peking University確認したメールアドレス: stu.pku.edu.cn
Yuanpei ChenSouth China University of Technology確認したメールアドレス: stanford.edu

フォロー

Jiaming Ji (吉嘉铭)

Peking University

確認したメールアドレス: stu.pku.edu.cn - ホームページ

AI Alignment Reinforcement Learning Large Language Model


タイトル引用回数順公開年順タイトル順	引用先引用先	年
Baichuan 2: Open large-scale language models A Yang, B Xiao, B Wang, B Zhang, C Bian, C Yin, C Lv, D Pan, D Wang, ... arXiv preprint arXiv:2309.10305, 2023	389*	2023
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, R Sun, Y Wang, Y Yang NeurIPS 2023, 2023	216	2023
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	157	2023
Safe rlhf: Safe reinforcement learning from human feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang The Twelfth International Conference on Learning Representations (Spotlight), 2024	155	2024
Bi-dexhands: Towards human-level bimanual dexterous manipulation Y Chen, Y Geng, F Zhong, J Ji, J Jiang, Z Lu, H Dong, Y Yang IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023	94*	2023
Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark J Ji, B Zhang, J Zhou, X Pan, W Huang, R Sun, Y Geng, Y Zhong, J Dai, ... NeurIPS 2023, 2023	55*	2023
Constrained update projection approach to safe policy optimization L Yang, J Ji, J Dai, L Zhang, B Zhou, P Li, Y Yang, G Pan NeurIPS 2022, 2023	42	2023
Aligner: Achieving efficient alignment through weak-to-strong correction J Ji, B Chen, H Lou, D Hong, B Zhang, X Pan, J Dai, Y Yang NeurIPS 2024, Oral Presentation, 2024	36	2024
Omnisafe: An infrastructure for accelerating safe reinforcement learning research J Ji, J Zhou, B Zhang, J Dai, X Pan, R Sun, W Huang, Y Geng, M Liu, ... JMLR 2024, 2023	31	2023
Heterogeneous-Agent Reinforcement Learning Y Zhong, JG Kuba, S Hu, J Ji, Y Yang JMLR, 2023	26	2023
Cup: A conservative update policy algorithm for safe reinforcement learning L Yang, J Ji, J Dai, Y Zhang, P Li, G Pan arXiv preprint arXiv:2202.07565, 2022	17	2022
The application of large language models in medicine: A scoping review X Meng, X Yan, K Zhang, D Liu, X Cui, Y Yang, M Zhang, C Cao, J Wang, ... Iscience 27 (5), 2024	15	2024
Augmented proximal policy optimization for safe reinforcement learning J Dai, J Ji, L Yang, Q Zheng, G Pan Proceedings of the AAAI Conference on Artificial Intelligence 37 (6), 7288-7295, 2023	12	2023
Pku-beaver: Constrained value-aligned llm via safe rlhf J Dai, X Pan, J Ji, R Sun, Y Wang, Y Yang	12	2023
SafeDreamer: Safe Reinforcement Learning with World Models W Huang, J Ji, B Zhang, C Xia, Y Yang ICLR 2024, 2023	11	2023
Pku-saferlhf: A safety alignment preference dataset for llama family models J Ji, D Hong, B Zhang, B Chen, J Dai, B Zheng, T Qiu, B Li, Y Yang arXiv preprint arXiv:2406.15513, 2024	7	2024
VOCE: Variational Optimization with Conservative Estimation for Offline Safe Reinforcement Learning J Guan, G Chen, J Ji, L Yang, A Zhou, Z Li NeurIPS 2023, 2023	7	2023
MyoChallenge 2022: Learning contact-rich manipulation using a musculoskeletal hand V Caggiano, G Durandau, H Wang, A Chiappa, A Mathis, P Tano, N Patel, ... NeurIPS 2022 Competition Track, 233-250, 2023	6	2023
Rethinking information structures in rlhf: Reward generalization from a graph theory perspective T Qiu, F Zeng, J Ji, D Yan, K Wang, J Zhou, H Yang, J Dai, X Pan, Y Yang arXiv preprint arXiv:2402.10184, 2024	4	2024
SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset J Dai, T Chen, X Wang, Z Yang, T Chen, J Ji, Y Yang NeurIPS 2024, 2024	1	2024

現在システムで処理を実行できません。しばらくしてからもう一度お試しください。

論文 1–20

年間引用数

重複した引用

結合された引用

共著者を追加共著者

フォロー

引用先

共著者