IA al Día - 10 dic. 2023
Bienvenidos a esta edición semanal de IA al Día, donde comentaré los últimos acontecimientos del mundo de la inteligencia artificial. En este número aprenderemos sobre las principales novedades en capacidades de IA presentadas por Google, Stability AI, Amazon, Meta y Microsoft. Veremos cómo los nuevos modelos están empujando los límites de lo posible con la generación de imágenes, la edición de vídeo, la comprensión del lenguaje natural, la creación de materiales, e incluso el juego estratégico. ¡Vamos allá!
Esta newsletter también está disponible en inglés y catalán.
Google ha presentado Gemini, su modelo de IA más grande y capaz hasta ahora
Google ha anunciado el lanzamiento de Gemini, su modelo de IA más grande y avanzado hasta la fecha. Construido por Google DeepMind, Gemini establece nuevos puntos de referencia en la comprensión de texto, imágenes, vídeo, audio y código. Supera por mucho a modelos anteriores en más de 30 benchmarks diferentes. Gemini se implementará en los productos de Google como Búsqueda, Bard y teléfonos Pixel en los próximos meses.
Stability AI ha presentado SDXL Turbo: un generador de imágenes en tiempo real
Stability AI ha presentado SDXL Turbo, un nuevo modelo de texto a imagen que puede generar imágenes de alta calidad a partir de descripciones de texto en tiempo real. Aprovechando una nueva técnica llamada Adversarial Diffusion Distillation (ADD), SDXL Turbo reduce masivamente el número de pasos necesarios para producir una imagen, de 50 hasta solo uno. Esto permite un rendimiento sin precedentes, con el modelo generando imágenes de 512x512 en unos 200 milisegundos. Puedes probarlo aquí.
Amazon ha presentado Amazon Q, un asistente de IA para el entorno laboral
Amazon ha presentado recientemente el lanzamiento de Amazon Q, un nuevo asistente basado en IA diseñado para entornos de trabajo. Disponible en vista previa, Amazon Q permite a los empleados mantener conversaciones naturales para obtener respuestas, generar contenido y tomar acciones relevantes para su negocio utilizando los datos y sistemas de su empresa. Amazon dice que Amazon Q tiene más de 40 conectores para integrarse con la información de la empresa y también que personaliza las interacciones en función del rol y los permisos del usuario para proporcionar soporte seguro y personalizado.
Amazon ha presentado nuevas capacidades de imagen y texto de IA
Amazon también ha anunciado el lanzamiento de nuevos servicios de inteligencia artificial impulsados por Amazon Titan, la suite de modelos de IA de la empresa. Esto incluye un generador de imágenes personalizadas a partir de indicaciones de texto, Amazon Titan Multimodal Embeddings para combinar imágenes y texto en modelos de aprendizaje automático, y disponibilidad general de los modelos de texto Amazon Titan Lite y Express para tareas de lenguaje natural.
La plataforma de edición de vídeo con inteligencia artificial de Pika recauda 55M$ y lanza nuevas herramientas creativas
La startup Pika ha cerrado recientemente una ronda de financiación de 55 millones de dólares para respaldar el lanzamiento de Pika 1.0, una actualización importante de su plataforma de edición y generación de vídeo con inteligencia artificial. Lanzado el 28 de noviembre, Pika 1.0 introduce nuevas capacidades como ampliar vídeos, transformar estilos de acción real a animación y utilizar IA para editar contenido, cambiando ropa o añadiendo personajes.
Meta ha lanzado un generador de imágenes con IA independiente
Meta ha lanzado una nueva experiencia de generación de imágenes con IA llamada Imagine con Meta. Similar a DALL-E y Stable Diffusion, crea imágenes a partir de texto en lenguaje natural. El modelo introduce marcas de agua de IA para la atribución y tiene como objetivo respaldar la generación responsable de imágenes. Puedes probarlo aquí.
El proyecto CICERO de Meta domina el complejo juego de estrategia Diplomacia
Meta AI ha creado CICERO, el primer sistema de IA que logra un rendimiento de experto en el complejo juego de estrategia Diplomacia, que requiere negociación y cooperación. Combinando el procesamiento del lenguaje natural y la planificación estratégica, CICERO puede colaborar, coordinarse y negociar con los humanos a un alto nivel.
Nuevo método para la síntesis de imagen a vídeo de alta calidad permite una animación de personajes consistente
Investigadores de Alibaba publicaron un artículo presentando Animate Anyone, una nueva estructura de IA para convertir imágenes estáticas en vídeos de alta calidad de personajes animados controlables. Logra resultados que preservan mejor los detalles visuales y garantizan un movimiento fluido a lo largo del tiempo. El método también permite animar una amplia variedad de tipos de personajes.
La IA y los robots se unen para descubrir nuevos materiales
Un sistema de IA llamado A-Lab, que combina la robótica y la inteligencia artificial, ha anunciado su primer lote de materiales de nueva creación. El A-Lab diseña y lleva a cabo la síntesis de materiales completamente de forma autónoma, sin ninguna intervención humana. Por ahora, ha producido con éxito 41 nuevos compuestos inorgánicos que podrían tener aplicaciones en baterías, celdas solares y otras tecnologías limpias.
Los principales países firman un acuerdo de seguridad de la IA
EUA, Reino Unido y más de 15 países más firmaron un acuerdo internacional centrado en mantener la inteligencia artificial segura y protegida. El documento de 20 páginas establece recomendaciones para las empresas que diseñan y despliegan IA, como supervisar los sistemas para el uso indebido, proteger los datos contra la manipulación y examinar los proveedores de software. Si bien el acuerdo en sí no es vinculante, su apoyo simbólico de las principales potencias mundiales indica un impulso y consenso crecientes para establecer protocolos y buenas prácticas para mitigar los riesgos a medida que la IA se integra más en la industria y la sociedad.
Tesla implementa una importante actualización de FSD, y afirma que la conducción autónoma real llegará a finales de 2023
Tesla ha empezado a liberar su actualización de software FSD v12 a los empleados. El director general, Elon Musk, dijo previamente que Tesla logrará una capacidad de conducción autónoma real a finales de 2023, vinculando este objetivo a la actualización v12. Musk dice que el control del vehículo ahora será gestionado completamente por redes neuronales en lugar de codificado por ingenieros. Sin embargo, no está claro si los conductores todavía tendrán que supervisar y estar preparados para tomar el control. La actualización es un paso crítico, pero muchos expertos siguen siendo escépticos sobre los plazos y las afirmaciones de Tesla acerca de la autonomía completa.
Bing lanza la búsqueda profunda, impulsada por GPT-4 para obtener respuestas más relevantes
Microsoft ha anunciado el lanzamiento de una nueva característica de Búsqueda profunda para Bing impulsada por el último sistema de IA de OpenAI, GPT-4. Esta nueva búsqueda está diseñada para proporcionar a los usuarios respuestas más completas y relevantes para consultas de búsqueda complejas, ampliando la consulta inicial para capturar mejor la intención del usuario. Sin embargo, esta nueva funcionalidad es opcional y puede tardar hasta 30 segundos en generar resultados.
¡Esto concluye las noticias de IA de esta semana! Si lo has encontrado informativo, no te olvides de compartirlo con amigos y compañeros. Y asegúrate de suscribirte para recibir las noticias de la próxima semana directamente en tu bandeja de entrada. ¡Gracias por leer!