Sigue este blog vía RSS, en el Fediverso en @acambronero@www.blogpocket.com, o vía email.

You don’t speak Spanish? Explore a selection of Blogpocket posts in English

El porqué de hacer un podcast con inteligencia artificial (y el cómo) [WP al día nº 350]

3b87ca97-6433-43ce-adf2-cf66d9a81b11 El porqué de hacer un podcast con inteligencia artificial (y el cómo) [WP al día nº 350]

En este post te explico las razones que tengo para hacer un podcast con inteligencia artificial generativa. Además, expongo el proceso y las herramientas que he utilizado.

Los puntos claves

Estos puntos clave fueron generadas por Assembly AI (con corrección humana).

  • Este post analiza las herramientas y el proceso utilizados para crear mi podcast WPADay hecho con IA, incluidos ChatGPT, Amazon Polly, etc.
  • El objetivo es explorar las posibilidades y límites del uso de herramientas de inteligencia artificial para automatizar partes de la creación de podcasts.
  • Se sostiene que usar herramientas de inteligencia artificial como estas es similar a usar otras herramientas de productividad y no hace que el podcast sea menos «creado por humanos».
  • Se reconoce preocupaciones sobre la IA, como el impacto y el sesgo ambiental, pero se argumenta que es posible un uso responsable.

El motivo de hacer un podcat con IA

Como le comenté a @Ruisan en Mastodon, el porqué de hacer un podcast con IA es simplemente mi manera de aprender. Si no creas algo relacionado con lo que estás aprendiendo o se lo enseñas a alguien, es mucho más difícil asimilarlo. Se trata de explorar y aprender las posibilidades, lo de menos es el resultado final.

No cabe duda de que un podcast es mucho más personal y natural si lo hace un humano. Pero ¿podemos afirmar que un contenido elaborado informáticamente es exclusivamente hecho por un humano? En el caso de los podcasts, ¿hecho por humano significa hablado por un humano?

Aunque la inteligencia artificial ayude en algunas partes de la elaboración del podcast (transcripciones, eliminación de ruido, etc.), un podcast hecho completamente con IA solo lo veo como una exploración de los límites. ¿Dónde o en qué momento un podcast deja de ser admisible si interviene una herramienta de IA? ¿Es admisible un podcast hecho totalmente con IA? ¿No admitimos IA pero admitimos editores de audio (corrección de sonido, etc.) o herramientas de SEO para posicionarnos en buscadores?

Al hilo de estas ideas, me gustó el episodio titulado Neoluditas, perteneciente al podcast Disperso del anteriormente citado @Ruisan. Lee también Humanitas et Machina: esperanza para la época moderna [WP al día nº 347]

Qué es WP A DAY y por qué quiero hacerlo con IA

WP A DAY es mi podcast hecho con IA, del que ya he hablado en WP A DAY: un podcast hecho con IA. En ese artículo explicaba el mecanismo, basado -en primer lugar- en programación en PHP y uso de la API de OpenAI, para obtener automáticamente el guion del podcast a partir de una selección de archivos RSS. Como informático titulado y estudiante de varias asignaturas de Inteligencia Artificial en mi carrera universitaria, en la década de los 80, me resulta apasionante investigar las posibilidades de la IA generativa.

Teniendo en cuenta el contexto -expuesto al principio de este post- para hacer un podcast con inteligencia artificial; supongamos que quisiéramos realizar WP A DAY al modo tradicional y hecho por un humano (sin IA):

  1. Primero seleccionaríamos los artículos a incluir en el podcast. Usaríamos un agregador del estilo de Feedly.
  2. Realizaríamos un resumen de los mismos. Quizás usaríamos alguna herramienta de SEO para ayudarnos en el copy, la redacción orientada al posicionamiento y la búsqueda de las palabras clave asociadas.
  3. Luego emplearíamos Audacity -por ejemplo- para grabar el audio. Para la edición emplearíamos las funciones de eliminación de ruido, cortes, inclusión de música, etc.
  4. Una vez con el mp3 en la mano, lo subiríamos a Spotify -por ejemplo- para que se desencadene toda la magia de creación del archivo RSS, distribución automática a otras plataformas, etc.

¿Eso se consideraría un podcast hecho por un humano?

Aunque ese proceso sigue los cánones ortodoxos, si nos fijamos bien en cada punto, existen herramientas que si no son específicamente de IA, poseen funciones que ayudan en tareas relacionadas con la consecución de objetivos. Por ejemplo, en el punto 1, Feedly nos ayuda a ser más productivos en la obtención de información. Si queremos posicionarnos bien en buscadores, ¡qué es el SEO sino una herramienta de automatización!

La edición de un audio sería muy laboriosa si Audacity no tuviera funciones de automatización (para la eliminación de ruido, ajustes de parámetros de sonido, cortes, eliminación e incorporación de pistas, etc.)

La diferencia entre un WP A DAY hecho con inteligencia artificial y un WP A DAY hecho por un humano es:

  1. En un WP A DAY hecho con IA, los textos de los resúmenes de los artículos se hacen automáticamente. Y se obtienen traducidos al español. Da igual si el texto está en otro idioma distinto al español, el resúmen se genera en el idioma de Cervantes.
  2. En un WP A DAY hecho con IA, la lectura del guion la realiza una herramienta de IA generando el mp3 directamente. Podríamos generar el mp3 en cualquier otro idioma, lo que redundaría en beneficios evidentes al abrirnos a otros públicos, sin esfuerzo añadido.

Por supuesto, para llegar a conseguir el proceso totalmente automático, es preciso realizar un trabajo de codificación (o entrenamiento) laborioso y que implica mucho esmero. No es trivial. Las herramientas de IA en la actualidad no son más que una ayuda y muchas veces cometen fallos e imprecisones.

Pero hay ventajas incuestionables.

El proceso

1c81cb80-d49e-4d38-a5a2-fb677418cd64 El porqué de hacer un podcast con inteligencia artificial (y el cómo) [WP al día nº 350]

Bajo esa perspectiva, desarrollé las dos primeras versiones de mi generador de guiones para el podcast WP A DAY, basadas en la interacción con ChatGPT desde PHP. Lee también: WP A DAY y MADE WITH BLOCKS: Explorando herramientas de IA generativa.

La segunda versión emplea un GPT de ChatGPT Plus en lugar de programación en PHP. Esto ahorra mucho tiempo y costes de mantenimiento del software. Y he comprobado que el resultado es más efectivo, a la vez que no requiere el uso de archivos RSS. En la versión codificada en PHP era necesario extraer el contenido del archivo RSS, antes de dárselo a ChatGPT para que obtuviese el resúmen, ya que no se utilizaba GPT-4.

Para que se entienda qué es un GPT, léase GPT-4: Qué es, cómo funciona y cómo puedes crear tu propio chat.

Construir y entrenar un chatbot de ChatGPT Plus como «ScriptPod»(el nombre de mi GPT privado para generar guiones) es cuestión de entender el funcionamiento de ChatGPT (véase Cómo optimizar el uso de ChatGPT, desde el chat, conociendo qué son los hiperparámetros). No es inmediato pero no es difícil. Es cuestión de ir ensayando, tras entender cómo funcionan las técnicas de indicaciones (prompts). Pero no requiere programación. Cualquiera puede hacerlo.

Con el texto del guion generado, solamente tenemos que emplear una herramienta que lo convierta a audio, con una voz lo más natural posible.

Las herramientas

Y ahí es dónde entra Amazon Polly, la herramienta de IA generativa con la que se puede convertir texto a audio con resultados muy convincentes.

Téngase en cuenta que el texto se puede corregir, convirtiéndose así ChatGPT Plus en una herramienta de productividad.

¿Qué sucedería si el texto generado por ChatGPT Plus fuese leído por mí, grabándose con Audacity? ¿Qué pasaría si Feedly, además de agregador de fuentes, tuviese una función para ofrecer los resúmenes de los artículos? Resumir un artículo, siempre y cuando seas un especialista en el tema (para poder corregirlo, validarlo, etc.), puede ser una ayuda muy útil.

¿Alguien puede ser tan estúpido como para negarse a emplear la función de traducción automática de páginas web de Google Chrome (o cualquier otra herramienta similar)?

¿Qué eran los «planets» de hace más de 20 años? ¿Qué era el navegador de tu automóvil hace 10 años? ¿O el procesador de textos en la década de los 90s? ¿O la imprenta?

No soy tan tonto como para no darme cuenta de los problemas que acarrea la IA. Medio ambiente, privacidad, sesgos, etc. etc. Por eso me gustó el trabajo realizado en Wholegrain Digital, elaborando pautas centradas en 7 principios simples para el uso responsable de la IA. En Blogpocket, nos hemos basado en esas claves para publicar nuestro manifiesto para un uso ético y responsable de la IA. No soy un búho de la IA, más bien un buhonejo 😉 (NotbyAI, una especie de reedición de los búhos del «Ad-Free Blogs» [WP al día nº 348]) En el rechazo a la IA, se mueven bien los neoluditas.

WP A DAY es solo un experimento, en busca del alcance y los límites de la IA. El contenido, basado en noticias de última hora sobre el mundo de WordPress, es útil. ¿Qué más da que lo lea yo o lo lea Lucía, la voz de IA de Amazon Pooly? Yo solo veo productividad, aunque hay que mejorar calidad en la redacción de los guiones y más naturalidad aún en la voz de Amazon Polly (aunque Lucía lo hace ya bastante bien 😉 ).

¿Qué opinas? ¿Te suscribes a WP A DAY? ¿Escucharás, por lo menos un capítulo?

Relacionado

Cómo hacemos WP A DAY

  • Se realiza una cuidada y meticulosa recopilación (manual), a partir de fuentes relevantes y de referencia en la comunidad de WordPress, de las últimas noticias sobre la plataforma. Empleamos newsletters y fuentes RSS (Feedly).
  • Se realiza una selección de unos cuantos artículos destacados, a nuestro criterio (lo más actual y relevante), pasándoselos al GPT denominado «ScriptPod»(chatbot personalizado de ChatGPT Plus que hemos construido desde cero y que vamos actualizando para ir mejorándolo) de generación automática de guiones. El chatbot personalizado obtiene un resumen breve de cada artículo y confeccion el guion con saludo, entradilla, frases de conexión entre resúmenes y despedida.
  • El texto del guion generado (corregido manualmente si es necesario) se lo pasamos a Amazon Polly para generar el archivo de audio. La voz elegida en casi todos los episodios es Lucía.
  • El audio se sube a Spotify (distribuyéndose automáticamente al resto de plataformas de podcasting)
  • El audio de Spotify se inserta en el post del blog correspondiente (este que estás leyendo), mediante el plugin Seriously Simple Podcasting.

Acciones propuestas

9b391369-64ad-41fc-8397-f7f24676d895 El porqué de hacer un podcast con inteligencia artificial (y el cómo) [WP al día nº 350]

Estas accciones fueron generadas por Assembly AI (con corrección humana)

  • Experimenta más con el uso de herramientas de inteligencia artificial como ChatGPT y Amazon Polly para generar contenidos relacionados con un podcast. Ver hasta dónde puede llevar la automatización manteniendo la calidad.
  • Trabajar para mejorar la naturalidad de la voz/habla generada por IA, para que suene más humano. Busca diferentes opciones de voz.
  • Refina las indicaciones/instrucciones (prompt) de IA para generar guiones de podcast de mayor calidad que requieran menos edición humana. Iterar y entrenar el modelo de IA.
  • Investigar el uso responsable y ético de la IA para evitar posibles inconvenientes. Considera la posibilidad de desarrollar directrices o un código de conducta para tu propio uso de la IA.
  • Si creas un podcast con IA, al estilo de WP A DAY, promociónalo y compártelo con otros para recibir comentarios. Ver si los oyentes pueden darse cuenta de que está generado por IA. Reacciones de calibre.
  • Considera usar selectivamente tu propia voz humana para partes del podcast, combinada con la voz de IA. Encuentra la combinación adecuada.
  • Explora la posibilidad de generar el podcast en varios idiomas para llegar a audiencias más amplias sin ningún esfuerzo adicional.
  • Evaluar el uso de IA para otras partes del proceso de creación de podcasts, como la edición de audio. Ver dónde puede ayudar.
  • Escribe publicaciones de blog y documenta el proceso de creación de tu podcast de IA. Comparte ideas y aprendizajes con otros.

Las imágenes de esta publicación han sido generadas en Bing Copilot con el prompt: «Una imagen fotorrealista para un artículo que expresa la idea de explorar las posibilidades y límites del uso de herramientas de inteligencia artificial para automatizar partes de la creación de podcasts.»

Lee todos los boletines de WP AL DÍA

WP AL DÍA es un boletín semanal al que puedes suscribirte siguiendo este blog

Responder en Mastodon (requiere usuario en esa plataforma)

Puedes usar tu cuenta de Mastodon para responder a este post de acambronero

Copia y pega esta URL (https://www.blogpocket.com/?p=77821) en el campo de búsqueda de la interfaz web de tu servidor Mastodon.

Icono de Mastodon

2 respuestas a «El porqué de hacer un podcast con inteligencia artificial (y el cómo) [WP al día nº 350]»

  1. Antonio, realmente has tocado un tema fascinante con este experimento de podcasting con IA. Me parece innovador e interesante descubrir hasta dónde podemos llevar la creación de contenido utilizando herramientas como ChatGPT y Amazon Polly. ¡Gracias por Compartir!

    1. Gracias por el comentario, Jonathan. La tecnología de la IA es un reto en muchos sentidos: productividad, privacidad, derechos de autor, sesgos, medio ambiente, etc. etc. Realmente es una revolución y el primer paso es entenderlo. Gracias otra vez a ti por el feedback, que verdaderamente aprecio muchísimo. 🙂

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Antonio Cambronero.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento: No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a GreenGeeks que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Ir al contenido