¿Cómo usar Microsoft JARVIS (HuggingGPT)?

¿Cómo usar Microsoft JARVIS (HuggingGPT)?

6 min

23.6.23

Cada día se introducen nuevos modelos en el campo de la inteligencia artificial, y el ritmo del cambio se acelera rápidamente. Cuanto más tiempo pasa, más infinitas parecen las posibilidades. Entre estas innovaciones, el enfoque práctico de Microsoft captó nuestro interés.

La empresa está desarrollando un sofisticado sistema de IA llamado JARVIS (un guiño a Iron Man), que se conecta a varios modelos de IA para dar una respuesta final. Cualquiera puede ver la demostración de JARVIS en Huggingface y comprobar sus capacidades. En este artículo, te mostraremos cómo utilizar Microsoft JARVIS.

¿Qué es Microsoft JARVIS?

Microsoft ha creado una especie de nuevo enfoque colaborativo que permite utilizar diferentes modelos de IA para realizar una tarea concreta. En este enfoque, ChatGPT controla la tarea principal. En GitHub, el proyecto se conoce como JARVIS, y actualmente está disponible en Huggingface (de ahí el nombre HuggingGPT) para que los usuarios lo prueben.

Funciona de forma similar a GPT-4. Pero JARVIS va más allá, incorporando una serie de LLM de código abierto para procesar imágenes, vídeo, audio y mucho más. La característica más interesante de esta herramienta de IA es su capacidad para acceder a archivos en línea y conectarse a Internet.

hugginggpt
Fuente: mlwires.com

Una solicitud puede contener varias tareas. Por ejemplo, puede pedir a Jarvis que analice una imagen y luego elabore un resumen de lo que ha observado. En este caso, ChatGPT evalúa la solicitud y organiza el trabajo en función de ella. A continuación, ChatGPT elige el modelo adecuado (alojado en Huggingface) para completar la tarea. El modelo elegido completa la tarea y envía el resultado a ChatGPT.

Hasta 20 modelos están conectados a JARVIS (HuggingGPT). Por tanto, puede ser muy útil si necesitas capacidades multimodales de forma inmediata. Aquí tienes las instrucciones para instalarla y utilizarla. Tenga en cuenta que la herramienta recibe muchas solicitudes. Por lo tanto, puede tardar un poco en responder a sus peticiones.

¿Cómo se instala Microsoft JARVIS (HuggingGPT)?

Primero debes obtener las claves de acceso a Microsoft JARVIS.

Paso 1: Clave API

Vaya al sitio OpenAI, conéctese a su cuenta OpenAI y haga clic en " Create new secret key " para generar su clave API OpenAI. Para su uso futuro, guarde la clave en un archivo de notas.

chatgpt clave api

Paso 2: Huggingface

A continuación, visita huggingface.co y crea una cuenta gratuita.

hugging face crear cuenta

Paso 3: Crear un token

Para crear su token Huggingface, vaya al siguiente enlace. En el panel derecho, seleccione "New token".

hugging face crear token

Paso 4: Configurar el token

Ahora necesitas encontrar un nombre para tu token (hemos introducido "jarvis" como ejemplo). A continuación, cambia el rol a " Write " y pulsa " Generate a token ".

hugging face configurar token

Paso 5: Copie el token

El token se copiará en el portapapeles tras hacer clic en el botón "Copy". Recomendamos pegarlo en un archivo de texto.

¿Cómo utilizar Microsoft JARVIS (HuggingGPT)?

Paso 1: Activar la clave

Haz clic en este enlace y pega la clave API de OpenAI en el primer campo para utilizar Microsoft JARVIS. Haz clic en ""Submit"" cuando hayas terminado. Ponga el token de Huggingface en el segundo campo de la misma manera, luego haga clic en " Submit ".

hugging gpt claves

Paso 2: Chatear con Jarvis

Desplázate hacia abajo e introduce tu solicitud una vez validados los dos tokens. Para empezar, le pedimos a Jarvis que nos diera una foto y un chiste sobre gatos.

En este ejemplo, se pidió a Jarvis que analizara una foto y la describiera. Obviamente, tuvo éxito en esta tarea. Para ello, utilizó tres modelos diferentes. Una para generar una descripción textual, otra para analizar la imagen y otra para responder a la pregunta. Jarvis tiene una amplia gama de aplicaciones, todas disponibles en HuggingFace.

hugginggpt multimodal

La innovación de Microsoft Jarvis (HuggingGPT)

Mediante el uso de varios modelos de IA, puedes utilizar HuggingGPT para realizar una tarea multimodal. JARVIS funcionó admirablemente en nuestras pruebas, aunque a menudo hay que esperar para obtener una respuesta. JARVIS no puede ejecutarse localmente en un PC convencional, ya que requiere al menos 16 GB de VRAM y 300 GB de espacio de almacenamiento para las distintas versiones.

Ten en cuenta que no puedes copiar un perfil de Huggingface y utilizar la cuenta gratuita para evitar la cola. Ejecutar el modelo robusto en una Nvidia A10G, una GPU de gran tamaño que cuesta 3,15 $/hora, requiere una suscripción.

Para diapositivas originales, aquí tienes cómo crear una presentación con Beautiful AI.

Probar Hugging GPT

Al hacer clic en "Aceptar", acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Consulte nuestra Política de privacidad para obtener más información.