Artwork

Contenido proporcionado por Mathieu Sanchez. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Mathieu Sanchez o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Player FM : aplicación de podcast
¡Desconecta con la aplicación Player FM !

#18 - Natalie Godec - Mettre AWS en PLS

59:57
 
Compartir
 

Manage episode 431765283 series 3590017
Contenido proporcionado por Mathieu Sanchez. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Mathieu Sanchez o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.

Rares sont ceux qui peuvent se vanter d’avoir “cassé” AWS 🏚️

Cette tech fait partie de ce club très fermé.

Cela fait plusieurs mois que Natalie et son équipe en ont ras-le-bol de gérer les incidents Kafka…

Kafka, c’est ce qu’on appelle un “message broker” ou “bus d’évènements”.

Pour faire simple, c’est un intermédiaire entre vos applis (vos “services”).

En gros, quand un service A veut parler à un service B, il a 2 choix :

- soit il lui parle en direct… Mais il faut que service B soit prêt et dispo.

- soit il envoie un message à Kafka, qui le garde au chaud, jusqu’à ce que le service B se décide à écouter

Bref.

C’est plein de vertus mais j’en parlerai une autre fois.

C’est surtout souvent TRÈS central dans l’infra.

Et quand ça tombe, plus personne ne peut se parler et donc… Ca pique.

Bon, maintenant revenons à nos moutons. 🐑

Natalie n’en peut plus de gérer elle-même son Kafka, qui lui fait des misères.

Alors elle décide de déléguer ça à Amazon, via leur offre Amazon “MSK” (”Manage Streaming for Kafka”).

”Je s’occupe de tout, tu s’occupes de rien.” te dit Jeff Bezos.

Et…

C’est plutôt vrai.

Pendant plusieurs mois, la vie est belle.

Jusqu’au jour où…

Il faut changer une simple configuration.

Un tout petit paramètre de rien du tout.

5 minutes plus tard, plus rien ne marche.

Kafka ne répond plus.

Impossible de se connecter, même avec ce bon vieux telnet 🤔

C’est le moment d’employer les grand moyens.

La fameuse “méthode devops”. 🪄

On redémarre.

Sauf que ben… ça redémarre pas.

Et comme c’est Amazon qui gère…

On peut pas faire grand chose d’autre. 🤷

Le cluster MSK est cassé.

Et bien sûr, toute la prod avec. 😱

Alors comment Natalie Godec s’est-elle sortie de cette situation ?

Vous le saurez en écoutant ce nouvel épisode de Tronche de Tech 🎙️

Un petit voyage dans le monde de l’infra à ne pas manquer !

Bonne écoute 🎙️

PS : dites-nous ce que vous pensez de l'épisode en commentaire (et surtout, abonnez-vous !)

-----------------------------------

Natalie Godec est Senior Cloud Architect chez Zencore.

Vous pouvez la retrouver sur :

- Twitter https://twitter.com/ouvessvit

- Youtube : https://www.youtube.com/channel/UCvrKGfYlJpAjdzT1qazyaiw

- Linkedin : https://www.linkedin.com/in/natalie-godec

L'article de blog sur l'incident MSK https://aws.plainenglish.io/how-we-broke-our-aws-msk-cluster-7b0a62ccbe53

---------------------------------

Je suis Mathieu Sanchez, CTO d'Acasi, et pour me suivre, c'est principalement sur Linkedin : https://www.linkedin.com/in/matsanchez/

Vous pouvez aussi suivre Tronche de Tech, sur vos réseaux favoris :

- Linkedin : https://www.linkedin.com/company/tronche-de-tech/

- Instagram : https://www.instagram.com/tronchedetech/

- TikTok : https://www.tiktok.com/@tronchedetech

- Twitter : https://twitter.com/TroncheDeTech



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

  continue reading

41 episodios

Artwork
iconCompartir
 
Manage episode 431765283 series 3590017
Contenido proporcionado por Mathieu Sanchez. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Mathieu Sanchez o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.

Rares sont ceux qui peuvent se vanter d’avoir “cassé” AWS 🏚️

Cette tech fait partie de ce club très fermé.

Cela fait plusieurs mois que Natalie et son équipe en ont ras-le-bol de gérer les incidents Kafka…

Kafka, c’est ce qu’on appelle un “message broker” ou “bus d’évènements”.

Pour faire simple, c’est un intermédiaire entre vos applis (vos “services”).

En gros, quand un service A veut parler à un service B, il a 2 choix :

- soit il lui parle en direct… Mais il faut que service B soit prêt et dispo.

- soit il envoie un message à Kafka, qui le garde au chaud, jusqu’à ce que le service B se décide à écouter

Bref.

C’est plein de vertus mais j’en parlerai une autre fois.

C’est surtout souvent TRÈS central dans l’infra.

Et quand ça tombe, plus personne ne peut se parler et donc… Ca pique.

Bon, maintenant revenons à nos moutons. 🐑

Natalie n’en peut plus de gérer elle-même son Kafka, qui lui fait des misères.

Alors elle décide de déléguer ça à Amazon, via leur offre Amazon “MSK” (”Manage Streaming for Kafka”).

”Je s’occupe de tout, tu s’occupes de rien.” te dit Jeff Bezos.

Et…

C’est plutôt vrai.

Pendant plusieurs mois, la vie est belle.

Jusqu’au jour où…

Il faut changer une simple configuration.

Un tout petit paramètre de rien du tout.

5 minutes plus tard, plus rien ne marche.

Kafka ne répond plus.

Impossible de se connecter, même avec ce bon vieux telnet 🤔

C’est le moment d’employer les grand moyens.

La fameuse “méthode devops”. 🪄

On redémarre.

Sauf que ben… ça redémarre pas.

Et comme c’est Amazon qui gère…

On peut pas faire grand chose d’autre. 🤷

Le cluster MSK est cassé.

Et bien sûr, toute la prod avec. 😱

Alors comment Natalie Godec s’est-elle sortie de cette situation ?

Vous le saurez en écoutant ce nouvel épisode de Tronche de Tech 🎙️

Un petit voyage dans le monde de l’infra à ne pas manquer !

Bonne écoute 🎙️

PS : dites-nous ce que vous pensez de l'épisode en commentaire (et surtout, abonnez-vous !)

-----------------------------------

Natalie Godec est Senior Cloud Architect chez Zencore.

Vous pouvez la retrouver sur :

- Twitter https://twitter.com/ouvessvit

- Youtube : https://www.youtube.com/channel/UCvrKGfYlJpAjdzT1qazyaiw

- Linkedin : https://www.linkedin.com/in/natalie-godec

L'article de blog sur l'incident MSK https://aws.plainenglish.io/how-we-broke-our-aws-msk-cluster-7b0a62ccbe53

---------------------------------

Je suis Mathieu Sanchez, CTO d'Acasi, et pour me suivre, c'est principalement sur Linkedin : https://www.linkedin.com/in/matsanchez/

Vous pouvez aussi suivre Tronche de Tech, sur vos réseaux favoris :

- Linkedin : https://www.linkedin.com/company/tronche-de-tech/

- Instagram : https://www.instagram.com/tronchedetech/

- TikTok : https://www.tiktok.com/@tronchedetech

- Twitter : https://twitter.com/TroncheDeTech



Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

  continue reading

41 episodios

Alle Folgen

×
 
Loading …

Bienvenido a Player FM!

Player FM está escaneando la web en busca de podcasts de alta calidad para que los disfrutes en este momento. Es la mejor aplicación de podcast y funciona en Android, iPhone y la web. Regístrate para sincronizar suscripciones a través de dispositivos.

 

Guia de referencia rapida

Escucha este programa mientras exploras
Reproducir