J.A.R.V.I.S.

Sistema de Ayuda

📘 ¿Qué es J.A.R.V.I.S.?

J.A.R.V.I.S. (Just A Rather Very Intelligent System) es un asistente de escritorio con inteligencia artificial para Windows 10/11, inspirado en el J.A.R.V.I.S. de Iron Man.

Es una aplicación de código abierto, 100% funcional, que permite al usuario controlar su ordenador mediante lenguaje natural — por texto o por voz — con un modelo de IA que se ejecuta localmente (Ollama con Mistral) o mediante APIs cloud gratuitas (GitHub Models con GPT-4o-mini o Google Gemini 2.0 Flash).

No es solo un asistente de comandos: JARVIS tiene un agente autónomo capaz de leer la pantalla, planificar una secuencia de pasos y ejecutarlos de forma independiente para resolver tareas complejas — desde enviar un WhatsApp hasta resolver ejercicios de un PDF y escribir las soluciones en Word.

💡 ¿Para quién es?

Usuarios de Windows que quieran automatizar tareas cotidianas: abrir apps, buscar en internet, gestionar archivos, resolver ejercicios de PDF, controlar Spotify, y mucho más — todo hablando o escribiendo.

✨ Características principales

MóduloDescripción
🧠 Cerebro IAConversación natural con modelos de lenguaje. Modo local: Ollama (Mistral, LLaMA 3, Phi-3). Modo cloud: GitHub Models (GPT-4o-mini, 20K req/día gratis) o Google Gemini (Gemini 2.0 Flash, gratuito)
🎙️ VozEntrada por voz con faster-whisper + salida TTS con Piper (voz natural en español)
👁️ Visión OCRLee la pantalla con Windows.Media.Ocr nativo. Hace clic inteligente por texto o descripción
⚙️ SistemaAbre/cierra apps, ajusta volumen/brillo, gestiona ventanas/pestañas, portapapeles
🌐 WebBúsquedas en Google (abre pestaña real en el navegador)
📁 ArchivosAbrir, crear, mover, copiar, buscar y organizar archivos
📄 DocumentosLeer y resumir PDF, Word, Excel, CSV, JSON. Resolver ejercicios automáticamente
🤖 Agente autónomoPlanifica y ejecuta tareas complejas de múltiples pasos de forma independiente. Lee la pantalla, interactúa con apps, verifica resultados y aprende procedimientos para el futuro
📧 EmailEnvío de correos electrónicos con SMTP
💻 CódigoEjecutar scripts Python en sandbox seguro
AutomatizaciónTimers, recordatorios, tareas programadas, calendario local
🧠 MemoriaRecuerda conversaciones y preferencias en SQLite. Aprende procedimientos
🎵 MultimediaMedia keys, control de Spotify, YouTube, volumen por aplicación
🔌 PluginsSistema extensible con carga automática y hot-reload

📋 Requisitos del sistema

Hardware

MínimoRecomendado
OSWindows 10Windows 11
RAM8 GB16 GB
Disco~5 GB~10 GB
CPUx64 modernoi5 / Ryzen 5 o superior
GPUNo necesariaNVIDIA (CUDA) para acelerar Whisper

Software

⚠️ ¿No tiene GPU o RAM suficiente?

Puede usar el modo cloud para ejecutar la IA en servidores remotos (GitHub Models o Gemini) sin consumo de recursos locales.

Tecnologías utilizadas

ComponenteTecnología
LLMOllama + Mistral (local) / GitHub Models (GPT-4o-mini) / Google Gemini (2.0 Flash) (cloud)
STT (voz → texto)faster-whisper (modelo small, español)
TTS (texto → voz)Piper TTS (es_ES-davefx-medium)
OCRWindows.Media.Ocr nativo (Win10/11)
InterfazPySide6 (Qt for Python)
Automatizaciónpyautogui + Win32 API via PowerShell
UI AutomationSystem.Windows.Automation via PowerShell
Base de datosSQLite3 (stdlib)
💡 Si es la primera vez, continúe a Primeros pasos → Instalación.