‪Wei Fu‬ - ‪Google Scholar‬

Eigenes Profil erstellen

Zitiert von

	Alle	Seit 2019
Zitate	73	73
h-index	3	3
i10-index	2	2

0

36

18

2019202020212022202320241 16 36 20

Koautoren

Yi WuInstitute for Interdisciplinary Information Sciences, Tsinghua UniversityBestätigte E-Mail-Adresse bei mail.tsinghua.edu.cn

Wei Fu

Wei Fu

IIIS, Tsinghua University

Bestätigte E-Mail-Adresse bei mails.tsinghua.edu.cn - Startseite

reinforcement learning RLHF distributed systems


Titel Nach Zitationen sortieren Nach Jahr sortieren Nach Titel sortieren	Zitiert von Zitiert von	Jahr
Revisiting some common practices in cooperative multi-agent reinforcement learning W Fu, C Yu, Z Xu, J Yang, Y Wu arXiv preprint arXiv:2206.07505, 2022	37	2022
Continuously discovering novel strategies via reward-switching policy optimization Z Zhou, W Fu, B Zhang, Y Wu arXiv preprint arXiv:2204.02246, 2022	27	2022
Learning Agile Bipedal Motions on a Quadrupedal Robot Y Li, J Li, W Fu, Y Wu arXiv preprint arXiv:2311.05818, 2023	5	2023
Iteratively learn diverse strategies with state distance information W Fu, W Du, J Li, S Chen, J Zhang, Y Wu Advances in Neural Information Processing Systems 36, 2024	2	2024
Is DPO Superior to PPO for LLM Alignment? A Comprehensive Study S Xu, W Fu, J Gao, W Ye, W Liu, Z Mei, G Wang, C Yu, Y Wu arXiv preprint arXiv:2404.10719, 2024	1	2024
Iteratively learning novel strategies with diversity measured in state distances W Fu, W Du, J Li, S Chen, J Zhang, Y Wu	1	2022
SRL: Scaling Distributed Reinforcement Learning to Over Ten Thousand Cores Z Mei, W Fu, G Wang, H Zhang, Y Wu arXiv preprint arXiv:2306.16688, 2023		2023

Das System kann den Vorgang jetzt nicht ausführen. Versuchen Sie es später erneut.

Artikel 1–7