Amazon Nova: el nuevo ecosistema de modelos de IA capaces de generar texto, imágenes y video
Amazon, empresa multinacional tecnológica estadounidense, presentó este martes 3 de diciembre su nueva generación de modelos base de inteligencia artificial: Amazon Nova, capaz de comprender y generar texto, imagen y video.
“Con la capacidad de procesar texto, imagen y video como indicaciones, los clientes pueden usar aplicaciones de IA generativa impulsadas por Amazon Nova para comprender videos, gráficos y documentos, o generar videos y otro contenido multimedia”.
Amazon
El gigante tecnológico precisó en un comunicado que ha tenido que adaptarse y resolver los desafíos que aún enfrenta la inteligencia artificial para crear su ecosistema Nova.
“Nuestros nuevos modelos están pensados para ayudar a los desarrolladores internos y externos con estos desafíos y brindar inteligencia y generación de contenido convincentes, al mismo tiempo que ofrecen un progreso significativo en latencia, rentabilidad, personalización, base de información y capacidades de agente”.
Rohit Prasad, vicepresidente sénior de Inteligencia Artificial General de Amazon.
[TE PODRÍA INTERESAR: ¿Qué es Rufus, el nuevo asistente con inteligencia artificial de Amazon?]
¿Cuáles son los modelos que componen Amazon Nova?
Los nuevos modelos del ecosistema de inteligencia artificial, Amazon Nova, disponibles en Amazon Bedrock incluyen los siguientes seis:
- Amazon Nova Micro: un modelo de solo texto que ofrece las respuestas de latencia más baja.
- Amazon Nova Lite: un modelo multimodal rápido para procesar imágenes, videos y entradas de texto.
- Amazon Nova Pro: un modelo multimodal de gran capacidad que combina precisión, velocidad y costo para una amplia gama de tareas.
- Amazon Nova Premier: el modelo multimodal capaz para tareas de razonamiento complejas y para destilar modelos personalizados
- Estará disponible en el primer trimestre de 2025.
- Amazon Nova Canvas: un modelo de generación de imágenes de última generación.
- Amazon Nova Reel: un modelo de generación de videos de última generación.
Fuente: Amazon
Cada uno de los seis modelos de Amazon Nova fueron diseñados para ser fáciles de usar con los sistemas de la empresa y los datos de sus clientes, según dijo la compañía en su comunicado.
Asimismo, estos admiten una amplia gama de tareas en 200 idiomas y múltiples modalidades y son los modelos más rápidos en sus respectivas clases de inteligencia en Amazon Bedrock.
- Amazon Bedrock es un servicio administrado que hace que los modelos base de alto rendimiento de las principales empresas de inteligencia artificial y Amazon estén disponibles para su uso a través de una única API.
¿Qué se podrá hacer con los nuevos modelos de Amazon Nova?
La división de anuncios de la empresa de Jeff Bezos utilizó el modelo de Amazon Nova Reel para crear un anuncio de video para una marca ficticia de pasta en caja, según el comunicado.
La inteligencia artificial creó “Ciudad de la Pasta”, con edificios esculpidos con fideos canelones , vecindarios salpicados con especias italianas y las calles están llenas de salsa marinara, fideos y albóndigas.
El anuncio creado con inteligencia artificial ejemplifica cómo los anunciantes pueden dar vida a sus productos y crear contenido de alta calidad utilizando los modelos de Amazon Nova.
Por otro lado, se puso a prueba la capacidad de comprensión de video de Amazon Nova Pro, al pedirle que revisara y describiera un breve videoclip mudo de un partido de fútbol.
Los resultados incluyen detalles sobre el terreno de juego, los uniformes del equipo, descripciones de las acciones realizadas por los jugadores y cómo culmina la jugada.
- Prompt: “Describe el video”.
- Resultado: “El video muestra un partido de fútbol en progreso en un campo verde. Los jugadores de dos equipos, uno con uniforme amarillo y el otro con uniforme blanco, participan en una jugada. El mariscal de campo del equipo amarillo lanza un pase a un receptor, que atrapa la pelota y comienza a correr campo abajo. Los defensores del equipo blanco lo persiguen, intentando tacklearlo. La jugada culmina en un tackle, que derriba al receptor al campo”.
Amazon Nova Pro también puede sugerir subtítulos para redes sociales para el mismo video del partido de fútbol.
[TE RECOMENDAMOS: Amazon confirma el robo de más de 2.8 millones de datos de sus empleados tras hackeo]
Se avecinan dos nuevos modelos de inteligencia artificial
La compañía de Jeff Bezos presentará dos modelos adicionales de Amazon Nova en 2025, incluido un modelo de voz a voz y un modelo nativo multimodal a multimodal o “any to any“.
Dicho modelo de voz a voz comprenderá comandos de voz en lenguaje natural, interpretará señales verbales y no verbales como tono y cadencia de las indicaciones. Además, ofrecerá interacciones naturales similares a las humanas, de acuerdo con el comunicado.
El modelo “any to any” será capaz de procesar texto, imágenes, audio y video, tanto como entrada como salida. Simplificará el desarrollo de aplicaciones en las que se puede utilizar el mismo modelo para traducir contenido de una modalidad a otra, editar contenido y potenciar agentes de IA que puedan comprender y generar todas las modalidades.