毎週水曜日更新中!
…
continue reading
Contenido proporcionado por Hajime Morrita , Jun Mukai. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Hajime Morrita , Jun Mukai o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Player FM : aplicación de podcast
¡Desconecta con la aplicación Player FM !
¡Desconecta con la aplicación Player FM !
#115: Constitutional AI: Harmlessness from AI Feedback
MP3•Episodio en casa
Manage episode 364052842 series 2151064
Contenido proporcionado por Hajime Morrita , Jun Mukai. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Hajime Morrita , Jun Mukai o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
LLM をチャットボットに仕立てる finetuning について森田が読みました。ご意見ご感想などはおたより投書箱や Reddit にお寄せください。iTunes のレビューや星も歓迎です。
- [2203.02155] Training language models to follow instructions with human feedback
- [2212.08073] Constitutional AI: Harmlessness from AI Feedback
- It looks like GPT-4-32k is rolling out | Hacker News
- Anthropic | Introducing Claude
- Goodhart’s law – Wikipedia
147 episodios
MP3•Episodio en casa
Manage episode 364052842 series 2151064
Contenido proporcionado por Hajime Morrita , Jun Mukai. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Hajime Morrita , Jun Mukai o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
LLM をチャットボットに仕立てる finetuning について森田が読みました。ご意見ご感想などはおたより投書箱や Reddit にお寄せください。iTunes のレビューや星も歓迎です。
- [2203.02155] Training language models to follow instructions with human feedback
- [2212.08073] Constitutional AI: Harmlessness from AI Feedback
- It looks like GPT-4-32k is rolling out | Hacker News
- Anthropic | Introducing Claude
- Goodhart’s law – Wikipedia
147 episodios
すべてのエピソード
×Bienvenido a Player FM!
Player FM está escaneando la web en busca de podcasts de alta calidad para que los disfrutes en este momento. Es la mejor aplicación de podcast y funciona en Android, iPhone y la web. Regístrate para sincronizar suscripciones a través de dispositivos.