IA al Día - 28 oct. 2023
Bienvenidos a mi resumen semanal de los últimos acontecimientos en inteligencia artificial. En esta edición, resumo algunos de los avances en IA y lanzamientos de productos más emocionantes de las dos últimas semanas. Sigue leyendo para enterarte de cómo grandes compañías tecnológicas están aprovechando el poder de la IA para mejorar sus servicios y desarrollar nuevas capacidades. Mi objetivo es manteneros informados sobre el rápido progreso en este campo y que tengáis una idea de cómo la IA está evolucionando y moldeando nuestro mundo.
Esta newsletter también está disponible en inglés y catalán.
El nuevo chip de IA de IBM podría llevar a una computación más rápida y eficiente
IBM presentó su nuevo procesador NorthPole diseñado para acelerar la inteligencia artificial. NorthPole une memoria y procesamiento en un solo chip, eliminando la necesidad de acceder a memoria externa. Esto permite que tareas de IA como el reconocimiento de imágenes funcionen más rápido mientras utilizan mucha menos potencia. Según los investigadores, la eficiencia energética de NorthPole es “increíble” en comparación con las arquitecturas existentes. Aunque no es lo suficientemente grande para IA compleja como ChatGPT, NorthPole puede ser interesante para aplicaciones críticas de velocidad como los coches autónomos. Sus innovadores principios de diseño podrían abrir el camino para la próxima generación de IA de alto rendimiento y eficiencia energética.
Adobe previsualiza el editor de fotos IA de la próxima generación
Adobe previsualizó Project Stardust, una nueva herramienta de edición de fotos con IA. Impulsado por el más reciente Firefly Model 2 de Adobe, Project Stardust hace que sea fácil para cualquiera editar fotos eliminando objetos, cambiando fondos y más mediante IA. Aunque solo una previsualización por ahora, Project Stardust combina los modelos IA avanzados de Adobe para realizar ediciones complejas con solo clics y arrastres sencillos. No te pierdas el siguiente vídeo para ver cómo funciona.
La nueva búsqueda de Google añade herramientas de generación de imágenes y escritura con IA
Google anunció nuevas capacidades de IA para su característica Experiencia Generativa de Búsqueda (SGE), que permite conversaciones más naturales con su motor de búsqueda. Los usuarios en EEUU ahora pueden generar imágenes a partir de textos con el modelo Imagen de Google directamente en SGE. También pueden personalizar resultados de texto para que sean más largos, cortos o cambiar el tono. Estas nuevas características se suman a las habilidades existentes de SGE para resumir contenido y definir términos. Aunque destinado a mejorar la búsqueda, Google espera introducir la tecnología de manera responsable, restringiendo la generación de imágenes a adultos e implementando filtros para bloquear contenido inapropiado/perjudicial.
Google lanza nuevas herramientas para proporcionar contexto a las imágenes
Google anunció nuevas funciones para dar a los usuarios más información sobre las imágenes que encuentran en la web. Estas herramientas muestran el historial de la imagen, metadatos y cómo otros la han descrito. Google dice que este contexto puede ayudar a desacreditar afirmaciones falsas y desinformación difundida a través de imágenes. La empresa también está experimentando con el uso de IA para generar descripciones de sitios desconocidos de donde provienen las imágenes. Estos movimientos tienen como objetivo frenar la propagación de desinformación a través de imágenes, que se ha convertido en un gran problema con la aparición de deepfakes y IA generativa.
El código abierto desafía los modelos multimodales de IA
A principios de este mes, se ha publicado LLaVA-1.5, un sistema de IA de código abierto que puede entender imágenes y texto. LLaVA-1.5 sigue otros modelos multimodales de código abierto como Qwen-VL de Alibaba y modelos de Google. Aunque no tan avanzados como GPT-4V de OpenAI, estos modelos gratuitos tienen como objetivo hacer la IA multimodal más accesible. Los partidarios argumentan que la apertura impulsa el progreso, pero los críticos advierten del posible mal uso.
Baidu afirma que su nuevo chatbot de IA iguala a GPT-4
La empresa tecnológica china Baidu presentó la última iteración de su chatbot de IA, ERNIE 4.0. Durante el evento anual insignia de la empresa, el CEO de Baidu Robin Li afirmó que ERNIE 4.0 “no es inferior en ningún aspecto a GPT-4”. Li también demostró en directo las habilidades de ERNIE 4.0, mostrando cómo podía generar contenido creativo como anuncios y tramas de novelas de artes marciales en chino mandarín. Afirmó que el nuevo bot ha mejorado significativamente la comprensión, la generación de respuestas complejas y las capacidades de memoria. Mientras Baidu planea limitar inicialmente el acceso, este anuncio sugiere un rápido avance en chatbots de IA para el consumidor.
El asistente de IA de Anthropic Claude ahora disponible en 95 países
El chatbot de procesamiento del lenguaje natural de Anthropic, Claude, se lanzó en el mundo recientemente. La IA conversacional ya es accesible en 95 países de todo el mundo, ampliando enormemente desde su lanzamiento inicial en EEUU a principios de este año. Seguramente debido a las leyes de protección de datos, Claude aún no está disponible en Europa.
Meta lanza Habitat 3.0 para entrenar robots inteligentes en entornos simulados
Meta lanzó Habitat 3.0, un sistema de simulación avanzado para entrenar robots inteligentes. La nueva versión permite que los robots colaboren con humanos simulados en tareas cotidianas como limpiar y cocinar. Según investigadores de Meta, Habitat 3.0 reduce el tiempo de entrenamiento de robots de meses a días, proporcionando entornos virtuales realistas. El sistema tiene como objetivo acelerar la investigación de los robots que pueden percibir, moverse y asistir personas en el mundo real.
D-ID lanza una aplicación de IA para crear videos a partir de fotografías
La startup de Tel Aviv D-ID ha lanzado una nueva aplicación móvil que utiliza IA para convertir fotos fijas en video. Los usuarios simplemente suben una foto, añaden texto para el guion del video y eligen una voz. La tecnología de D-ID anima la foto sincronizada con el audio para generar un video falso realista. Esto hace que la producción de video sea accesible y asequible para cualquiera con un teléfono inteligente. La aplicación podría permitir nuevas formas de comunicación, pero también puede generar preocupaciones sobre el uso indebido de la tecnología deepfake.
Nvidia presenta el agente Eureka para revolucionar el entrenamiento de robots
Nvidia anunció el desarrollo de Eureka, un nuevo agente de IA impulsado por GPT-4 que puede entrenar robots para realizar habilidades complejas mejor que los métodos diseñados por humanos. Nvidia afirmó que Eureka ha enseñado a los robots como hacer girar un bolígrafo con los dedos de la mano y otras tareas diestras, generando automáticamente funciones de recompensa a través de la optimización evolutiva del código escrito por el gran modelo de lenguaje. La empresa afirma que Eureka supera a los expertos humanos en el 83% de los escenarios probados en 29 entornos, con una mejora promedio del 52%. Esta combinación de IA generativa y simulación GPU podría permitir avances importantes en el control robótico y la animación.
Google Cloud ofrece una política de indemnización para la IA generativa
Google Cloud anunció una política de indemnización de dos vertientes para proteger a los clientes que utilizan sus servicios de IA generativa. La política cubre reclamaciones relacionadas tanto con los datos de entrenamiento como con el resultado generado, con Google asumiendo la responsabilidad de los posibles riesgos legales. Según Neal Suggs, VP Legal de Google Cloud, esta cobertura integral tiene como objetivo dar a los clientes confianza y tranquilidad en el uso de las últimas ofertas de IA generativa de Google.
Amazon lanza una nueva herramienta de IA para mejorar imágenes de productos para anunciantes
Amazon ha presentado una nueva herramienta de IA generativa que permite a los anunciantes generar automáticamente fondos personalizados para sus imágenes de productos. Simplemente escribiendo una descripción de texto de la escena deseada, los anunciantes ahora pueden crear anuncios visualmente más atractivos que sitúan los productos en contextos de estilo de vida relevantes. Según Amazon, las primeras pruebas muestran que estas imágenes generadas por IA pueden mejorar el rendimiento de los anuncios, con tasas de clic que aumentan hasta un 40%. Aunque no es perfecta, la tecnología tiene como objetivo racionalizar la producción creativa y la narración de historias de las marcas que se comercializan en Amazon.
¡Esto concluye las noticias de IA de esta semana! Si lo has encontrado informativo, no te olvides de compartirlo con amigos y compañeros. Y asegúrate de suscribirte para recibir las noticias de la próxima semana directamente en tu bandeja de entrada. ¡Gracias por leer!