Artwork

Contenido proporcionado por Javier Archeni and República Web. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Javier Archeni and República Web o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Player FM : aplicación de podcast
¡Desconecta con la aplicación Player FM !

Site Reliability Engineering en Google con Ramón Medrano

1:17:25
 
Compartir
 

Manage episode 308858743 series 3022194
Contenido proporcionado por Javier Archeni and República Web. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Javier Archeni and República Web o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.

Para este episodio del podcast invitamos a Ramón Medrano Llamas, que actualmente desempeña su trabajo desde Zürich para Google como Site Reliability Engineer (SRE). Conocimos a Ramón Medrano a raíz del pasado incidente de Facebook, cuando la compañía sufrió una caída mundial de su servicio. Un miembro de nuestro grupo de Telegram Malditos Webmasters compartió un tuit de Ramón Medrano donde explicaba con excelente detalle la situación.

Este incidente de Facebook dejó desde primera hora de la tarde del 4 de octubre, sin acceso a sus servicios a gran parte de su base de usuarios a nivel mundial. Fueron seguramente cuatro horas larguísimas para el equipo de ingenieros de Facebook encargados de la situación, que a pesar de las bromas en redes sociales que se sucedían, logró recuperar, como mencionó Ramón Medrano, el sistema en tiempo record.

En pocas horas los servicios del proveedor OVH también sufría una interrupción del servicio que afectaba a muchos clientes. Estos incidentes sirvieron para poner el foco en los perfiles profesionales encargados de la fiabilidad y disponibilidad de los servicios.

Con Ramón Medrano queremos hablar de este perfil profesional, de sus atribuciones y de cómo desempeñan su trabajo en el día a día. También queremos hablar de los incidentes de Facebook y OVH para entender cómo se afrontan desde dentro estas situaciones.

Entre las cuestiones que hablamos con el invitado:

  • Origen del término SRE y las funciones que desempeña.
  • ¿Qué perfil profesional y personal es el adecuado para desempeñar estas funciones?
  • ¿Qué principios guían el trabajo de un SRE?
  • ¿Qué herramientas se usan para desempeñar el trabajo de SRE?
  • ¿Cómo se calculan en las empresas tecnológicas los SLA?
  • Caso Facebook. En tu estupendo hilo sobre la caída de Facebook reconociste como buenísimo el trabajo del equipo de ingeniería de FB. ¿Cómo se debe vivir una situación tan grave para una compañía?
  • Caso Facebook. ¿Qué lecciones se han aprendido de este caso?
  • Caso OVH. ¿Qué diferencias encontraste con respecto a la forma de abordar la situación con respecto a Facebook?
  • Caso Twitch y seguridad en SRE.
  • Recursos de interés para saber más sobre SRE.

Un episodio de enorme interés para comprender mejor el trabajo de un SRE en Google y conocer el perfil profesional de este puesto tan crucial.

  continue reading

80 episodios

Artwork
iconCompartir
 
Manage episode 308858743 series 3022194
Contenido proporcionado por Javier Archeni and República Web. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Javier Archeni and República Web o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.

Para este episodio del podcast invitamos a Ramón Medrano Llamas, que actualmente desempeña su trabajo desde Zürich para Google como Site Reliability Engineer (SRE). Conocimos a Ramón Medrano a raíz del pasado incidente de Facebook, cuando la compañía sufrió una caída mundial de su servicio. Un miembro de nuestro grupo de Telegram Malditos Webmasters compartió un tuit de Ramón Medrano donde explicaba con excelente detalle la situación.

Este incidente de Facebook dejó desde primera hora de la tarde del 4 de octubre, sin acceso a sus servicios a gran parte de su base de usuarios a nivel mundial. Fueron seguramente cuatro horas larguísimas para el equipo de ingenieros de Facebook encargados de la situación, que a pesar de las bromas en redes sociales que se sucedían, logró recuperar, como mencionó Ramón Medrano, el sistema en tiempo record.

En pocas horas los servicios del proveedor OVH también sufría una interrupción del servicio que afectaba a muchos clientes. Estos incidentes sirvieron para poner el foco en los perfiles profesionales encargados de la fiabilidad y disponibilidad de los servicios.

Con Ramón Medrano queremos hablar de este perfil profesional, de sus atribuciones y de cómo desempeñan su trabajo en el día a día. También queremos hablar de los incidentes de Facebook y OVH para entender cómo se afrontan desde dentro estas situaciones.

Entre las cuestiones que hablamos con el invitado:

  • Origen del término SRE y las funciones que desempeña.
  • ¿Qué perfil profesional y personal es el adecuado para desempeñar estas funciones?
  • ¿Qué principios guían el trabajo de un SRE?
  • ¿Qué herramientas se usan para desempeñar el trabajo de SRE?
  • ¿Cómo se calculan en las empresas tecnológicas los SLA?
  • Caso Facebook. En tu estupendo hilo sobre la caída de Facebook reconociste como buenísimo el trabajo del equipo de ingeniería de FB. ¿Cómo se debe vivir una situación tan grave para una compañía?
  • Caso Facebook. ¿Qué lecciones se han aprendido de este caso?
  • Caso OVH. ¿Qué diferencias encontraste con respecto a la forma de abordar la situación con respecto a Facebook?
  • Caso Twitch y seguridad en SRE.
  • Recursos de interés para saber más sobre SRE.

Un episodio de enorme interés para comprender mejor el trabajo de un SRE en Google y conocer el perfil profesional de este puesto tan crucial.

  continue reading

80 episodios

Todos los episodios

×
 
Loading …

Bienvenido a Player FM!

Player FM está escaneando la web en busca de podcasts de alta calidad para que los disfrutes en este momento. Es la mejor aplicación de podcast y funciona en Android, iPhone y la web. Regístrate para sincronizar suscripciones a través de dispositivos.

 

Guia de referencia rapida