资讯分类

k8凯发国际|朝俞R车WRITEAS震动器|Meta万引强化学习大佬跑路!用小扎

  • 分类:行业动态
  • 来源:凯发k8一触即发
  • 发布时间:2025-09-26 04:41

【概要描述】——凯发k8一触即发电气

k8凯发国际|朝俞R车WRITEAS震动器|Meta万引强化学习大佬跑路!用小扎

【概要描述】——凯发k8一触即发电气

  • 分类:行业动态
  • 来源:凯发k8一触即发
  • 发布时间:2025-09-26 04:41
详情

 

 

k8凯发国际|朝俞R车WRITEAS震动器|Meta万引强化学习大佬跑路!用小扎

 

                                                                                        

 

  决定不加入新的超级智能实验室并不容易◈◈,毕竟那里人才济济◈◈、算力爆棚◈◈。但在Google Brain◈◈、DeepMind和Meta度过了7年半之后k8凯发国际◈◈,我更想冒险去尝试一条完全不同的路◈◈。

  Meta组建超级智能团队的想法非常引人注目◈◈,但我最终选择听从扎克伯格的建议◈◈:“在这个瞬息万变的世界里◈◈,最大的风险就是不去冒险k8凯发国际◈◈。”

  不过猜测也好◈◈,吐槽也罢◈◈。对于Rishabh Agarwal的离职朝俞R车WRITEAS震动器◈◈,谷歌◈◈、Meta的同事们都清一色地送上了祝福◈◈,而且还顺带回顾了他在工作期间作出的贡献◈◈。

  据了解◈◈,他参与了谷歌Gemini 1.5凯发k8国际app下载◈◈、Gemma 2以及Meta推理模型后训练方面的重要工作◈◈,2021年还以一篇RL算法评估论文拿下了NeurIPS杰出论文奖◈◈。

  Rishabh Agarwals朝俞R车WRITEAS震动器◈◈,一直以来从事强化学习和推理研究◈◈,谷歌学术论文被上万次引用◈◈,h-index也有34朝俞R车WRITEAS震动器◈◈。

  颇具戏剧性的是朝俞R车WRITEAS震动器◈◈,Hinton还曾建议他“不要做强化学习(RL)”◈◈,不过话锋一转k8凯发国际◈◈,老爷子也留有余地——应该做自己认为最好的事情(毕竟他本人当年做的事也不被所有人看好)◈◈。

  第二年朝俞R车WRITEAS震动器◈◈,他就前往蒙特利尔的Mila研究所申请PhD◈◈,由于和面试官之一Aaron Courville(和Bengio等人合著了《深度学习》这本经典教材)在强化学习领域的研究方向“完全相同”◈◈,当场就被邀请并加入其团队◈◈。

  接下来的四年时间朝俞R车WRITEAS震动器k8凯发国际◈◈,他在Aaron Courvilleh和Marc Bellemare两位顶尖导师的指导下继续深耕强化学习◈◈,同时还保留着在Google Brain的全职工作◈◈。

  直到2023年◈◈,Marc Bellemare发了一条提前庆祝他通过博士毕业答辩的推文◈◈,连谷歌首席科学家Jeff Dean这样的大佬也赶来祝贺凯发k8国际◈◈。

  在这之后◈◈,他顺理成章地加入蒙特利尔谷歌DeepMind团队◈◈,担任研究科学家k8凯发国际◈◈,同时在麦吉尔大学做兼职教授k8凯发国际◈◈。

  而在谷歌工作期间◈◈,他参与了Gemini 1.5(当时号称最强多模态◈◈、上下文突破100万)◈◈、Gemma 2(新一代轻量级开源模型)◈◈、Gemma 3等重要模型的发布工作◈◈。

  简单来说◈◈,这篇论文分析了深度强化学习中的统计不稳定性问题◈◈,指出在有限实验下评估算法可能产生误导性结果◈◈。由于系统性揭示了RL中的方差问题与过拟合风险◈◈,被认为是评价RL算法的里程碑工作◈◈。

  如今随着Rishabh Agarwals的离开◈◈,网友们也纷纷替Meta惋惜又损失了一员大将◈◈。

  目前Rishabh Agarwals的下一站并未明确◈◈,不过按照他“想要尝试完全不同的一条路”的说法◈◈,人们推测大概率会是创业朝俞R车WRITEAS震动器凯发k8国际官网◈◈,◈◈。

  其实不止Rishabh Agarwals◈◈,几乎同一时间◈◈,一位在Meta工作了12年的老员工也宣布离职了◈◈。

  此前就有消息称◈◈,Meta新老员工之间因薪酬待遇悬殊而产生摩擦◈◈,其中一些研究人员甚至威胁要辞职朝俞R车WRITEAS震动器◈◈。

 

扫二维码用手机看

 Copyright  © 2019 凯发k8一触即发电气集团公司  版权所有      豫ICP备20002114号        郑州    凯发k8一触即发.网址   凯发k8一触即发电气.网址