Artwork

Contenido proporcionado por Amazon Web Services España. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Amazon Web Services España o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Player FM : aplicación de podcast
¡Desconecta con la aplicación Player FM !

#0027 - IA generativa con datos propios sin re-entrenar

50:36
 
Compartir
 

Manage episode 377468889 series 2920276
Contenido proporcionado por Amazon Web Services España. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Amazon Web Services España o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para generar las respuestas sin que dicha información haya formado parte del entrenamiento de un modelo, sin olvidarnos también de evitar las alucinaciones que pueden producirse.
En este capítulo Pablo Nuñez Pölcher nos cuenta como el uso de estrategias como la generación amplificada por recuperación de información (Retrieval Augmented Generation o RAG) son claves para conseguir estos objetivos. Veremós en qué se basa esta estrategia, qué componentes tecnológicos son necesarios, las distintas alternativas para su implementación en AWS y como escojer la más adecuada: desde el servicio gestionado Amazon Kendra hasta los distintos modelos fundacionales para el cálculo de embeedings, pasando por las bases de datos vectoriales disponibles.Si quieres probar tu mismo los conceptos aparecidos en el capítulo, con distintos proveedores de modelos y distintos orígenes para RAG puedes hacerlo siguiendo este link: https://github.com/aws-samples/aws-genai-llm-chatbot/tree/main
Albert Capdevila es un arquitecto de soluciones de AWS basado en Barcelona, ayudando a los clientes a construir sus cargas en AWS de acuerdo a las mejores prácticas. Después de más de 15 años trabajando en proyectos en el ámbito de las arquitecturas de integración, lleva ya 4 años focalizado en el cloud y en el AI/ML.
Albert está actualmente trabajando en un modelo de predicción del tiempo libre que sus hijos le van a dejar para poder ir a escalar montañas.
Contacta con Albert Capdevila en LinkedIn en https://www.linkedin.com/in/albertcapdevila/
Pablo Núñez es arquitecto de soluciones de AWS con base en Madrid. Desde allí, trabaja con clientes de salud y educación ayudándoles diseñar y desplegar sus cargas de manera escalable, sostenible y según mejores prácticas.
Lleva inmerso en el mundo del cloud y el machine learning más de 5 años, y otros 15 de desarrollador backend. Su pasión por la bioingeniería lo ha llevado a ser además biólogo con especialización en fisiología.
Cuando no está frente al ordenador, reparte su tiempo entre la electrónica, sus bicicletas, su alérgico gato negro (Hawking), y discutiendo investigaciones médicas con su esposa.
Contacta con Pablo Nuñec en LinkedIn en https://www.linkedin.com/in/ppolcher
  continue reading

30 episodios

Artwork
iconCompartir
 
Manage episode 377468889 series 2920276
Contenido proporcionado por Amazon Web Services España. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Amazon Web Services España o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para generar las respuestas sin que dicha información haya formado parte del entrenamiento de un modelo, sin olvidarnos también de evitar las alucinaciones que pueden producirse.
En este capítulo Pablo Nuñez Pölcher nos cuenta como el uso de estrategias como la generación amplificada por recuperación de información (Retrieval Augmented Generation o RAG) son claves para conseguir estos objetivos. Veremós en qué se basa esta estrategia, qué componentes tecnológicos son necesarios, las distintas alternativas para su implementación en AWS y como escojer la más adecuada: desde el servicio gestionado Amazon Kendra hasta los distintos modelos fundacionales para el cálculo de embeedings, pasando por las bases de datos vectoriales disponibles.Si quieres probar tu mismo los conceptos aparecidos en el capítulo, con distintos proveedores de modelos y distintos orígenes para RAG puedes hacerlo siguiendo este link: https://github.com/aws-samples/aws-genai-llm-chatbot/tree/main
Albert Capdevila es un arquitecto de soluciones de AWS basado en Barcelona, ayudando a los clientes a construir sus cargas en AWS de acuerdo a las mejores prácticas. Después de más de 15 años trabajando en proyectos en el ámbito de las arquitecturas de integración, lleva ya 4 años focalizado en el cloud y en el AI/ML.
Albert está actualmente trabajando en un modelo de predicción del tiempo libre que sus hijos le van a dejar para poder ir a escalar montañas.
Contacta con Albert Capdevila en LinkedIn en https://www.linkedin.com/in/albertcapdevila/
Pablo Núñez es arquitecto de soluciones de AWS con base en Madrid. Desde allí, trabaja con clientes de salud y educación ayudándoles diseñar y desplegar sus cargas de manera escalable, sostenible y según mejores prácticas.
Lleva inmerso en el mundo del cloud y el machine learning más de 5 años, y otros 15 de desarrollador backend. Su pasión por la bioingeniería lo ha llevado a ser además biólogo con especialización en fisiología.
Cuando no está frente al ordenador, reparte su tiempo entre la electrónica, sus bicicletas, su alérgico gato negro (Hawking), y discutiendo investigaciones médicas con su esposa.
Contacta con Pablo Nuñec en LinkedIn en https://www.linkedin.com/in/ppolcher
  continue reading

30 episodios

Todos los episodios

×
 
Loading …

Bienvenido a Player FM!

Player FM está escaneando la web en busca de podcasts de alta calidad para que los disfrutes en este momento. Es la mejor aplicación de podcast y funciona en Android, iPhone y la web. Regístrate para sincronizar suscripciones a través de dispositivos.

 

Guia de referencia rapida