Apple anunció su nuevo modelo de inteligencia artificial generativa. Se trata de MGIE, un proyecto que permite a los usuarios utilizar un lenguaje sencillo para crear imágenes y editar contenidos como si usaran un software de edición de fotografías, al estilo de Photoshop.
El desarrollo de este modelo de código abierto es el resultado de una investigación realizada en colaboración con la Universidad de California en Santa Bárbara.
¿Cómo funciona la inteligencia artificial MGIE de Apple?
La inteligencia artificial MGIE aprovecha los modelos de lenguaje grande multimodal (MLLM, por sus siglas en inglés) para interpretar los prompts del usuario y manipular los contenidos a nivel de pixel, según los investigadores.
“Las instrucciones humanas a veces son demasiado breves para los métodos actuales para capturar y seguir. Los MLLM muestran capacidades prometedoras en la comprensión intermodal y la generación de respuestas visuales”.
Fragmento del estudio.
[TE RECOMENDAMOS: Canva AI Art Generator: así puedes crear imágenes y videos con pocas palabras]
Al introducir la fotografía de un paisaje e ingresar el prompt “hacer que el pasto sea más verde”, el sistema reinterpreta la orden para generar la solicitud “incrementar la saturación de color en la región del pasto en 20%”.
Los grandes modelos multimodales producen una representación explícita de la edición deseada, que captura la esencia del cambio solicitado y orienta la manipulación de la imagen píxel por píxel.
- “El modelo puede conducir a una mejora notable en las métricas automáticas y la evaluación humana manteniendo al mismo tiempo una eficiencia de inferencia competitiva“, dicen los desarrolladores.
¿De qué es capaz la IA de Apple?
MGIE es capaz de realizar ajustes de color simples y manipular objetos complejos. La inteligencia artificial implementada por Apple también permite realizar ediciones globales y locales.
El modelo proporciona instrucciones claras y para guiar al usuario en el proceso de edición de manera efectiva. De esta forma, mejora la calidad de las imágenes sin comandos complejos.
Además de recortar, cambiar el tamaño, rotar, voltear y agregar filtros, MGIE también realiza ediciones más elaboradas, como cambiar un fondo, agregar o eliminar objetos y combinar elementos.
Finalmente, puede ajustar el brillo, contraste, nitidez y equilibrio de color, con efectos adicionales como dibujar, pintar y crear dibujos.
[TAMBIÉN LEE: Imagine, la herramienta gratuita de Meta para generar imágenes con IA]
¿Puedes probar la inteligencia artificial MGIE de Apple?
Hasta el momento, Apple no ha dado una fecha de lanzamiento para MGIE y, según las palabras de su CEO, Tim Cook, se espera que salga al mercado “más adelante en este año”.
Por ahora, el nuevo modelo de IA de Apple está disponible en GitHub como un proyecto de código abierto. Sin embargo, esta plataforma de prueba puede tardar mucho en responder a las instrucciones y puede fallar.
También se desconoce si Apple tiene planes para incorporar esta tecnología a sus servicios o dispositivos disponibles actualmente en el mercado.