WebAssembly Agents: AI en el navegador sin complicaciones

905 palabras
5 min de lectura

Mozilla AI vuelve a sorprender: agentes de IA que funcionan con solo abrir un HTML

Hace unos días me topé con un proyecto de Mozilla AI que me ha llamado muchísimo la atención: WebAssembly Agents. Y es que después de 30 años viendo cómo la industria se complica la vida con dependencias, instalaciones y configuraciones, ver algo que funciona con solo “abrir un HTML” me ha hecho sonreír.

El problema que resuelve (y que todos conocemos)

¿Cuántas veces habéis intentado probar un proyecto de IA y os habéis encontrado con esto?

pip install esto
npm install aquello
configurar esta API
descargar este modelo
instalar este framework

Y después de una hora instalando cosas, resulta que no funciona en vuestra versión de Python, o que el modelo no cabe en vuestra GPU, o que hay un conflicto de dependencias. Frustrante, ¿verdad?

Mozilla AI ha atacado este problema de forma elegante: agentes de IA que funcionan directamente en el navegador, empaquetados como archivos HTML standalone. Sin instalaciones, sin configuraciones complejas, sin quebraderos de cabeza.

La magia detrás: WebAssembly + Pyodide

La solución técnica es realmente elegante. Usan WebAssembly junto con Pyodide para ejecutar Python directamente en el navegador. Para los que no estéis familiarizados:

  • WebAssembly: Un formato binario que permite ejecutar código C, C++, Rust y Python a velocidad casi nativa en navegadores
  • Pyodide: Una distribución de Python que corre enteramente en WebAssembly

El resultado es que puedes ejecutar código Python complejo, incluidas muchas librerías, directamente en tu navegador. Sin instalar nada en tu máquina.

Lo que me ha gustado del enfoque

Como desarrollador que ha trabajado con todo tipo de tecnologías, hay varias cosas que me han llamado la atención:

1. Simplicidad de distribución Un solo archivo HTML que contiene tanto la UI como el código del agente. Me recuerda a los viejos tiempos cuando las aplicaciones web eran simples y autocontenidas.

2. Sandboxing por diseño Al ejecutarse en el navegador, los agentes están automáticamente en un entorno sandbox. Esto es especialmente importante cuando trabajas con IA, donde la seguridad es crítica.

3. Compatibilidad con múltiples modelos Aunque funciona con OpenAI out-of-the-box, también puedes usar modelos locales a través de Ollama, vLLM, o HuggingFace TGI. Esta flexibilidad me parece fundamental.

Los ejemplos prácticos

Mozilla AI ha incluido varios demos que muestran las posibilidades:

  • hello_agent.html: Un agente conversacional básico
  • handoff_demo.html: Un sistema multi-agente que enruta requests a agentes especializados
  • tool_calling.html: Agente con herramientas integradas (incluyendo la famosa pregunta “¿cuántas Rs hay en strawberry?”)
  • ollama_local.html: Para usar modelos locales completamente offline

Las limitaciones (porque siempre las hay)

Mozilla AI es honesta sobre las limitaciones actuales, y me gusta esa transparencia:

1. Dependencia de frameworks específicos Por ahora solo funciona con openai-agents. Otros frameworks como smolagents tienen sus propias limitaciones con Pyodide.

2. CORS por todas partes En cuanto quieras que tu agente acceda a APIs externas o modelos locales, te vas a topar con problemas de CORS. Es el precio de la seguridad web.

3. Modelos pesados No todos los ordenadores pueden ejecutar modelos grandes. En un MacBook M3 puedes correr qwen3:8b sin problemas, pero en una Raspberry Pi 5 ya empiezas a sufrir.

Mi experiencia probándolo

He estado jugando con los ejemplos y la experiencia es sorprendentemente buena. El setup es tan simple como:

  1. Descargar los archivos HTML
  2. Configurar tu API key (OpenAI o local)
  3. Abrir el HTML en el navegador
  4. ¡Ya está funcionando!

La velocidad es respetable, aunque obviamente no es tan rápida como ejecutar Python nativo. Pero para prototipado y experimentación, es más que suficiente.

Reflexiones de un desarrollador veterano

Este proyecto me ha hecho reflexionar sobre varias cosas:

Volvemos a los orígenes Me recuerda a cuando el desarrollo web era más simple. Un archivo HTML que contenía todo lo que necesitabas. A veces la simplicidad es la mejor característica.

La potencia del navegador moderno Es impresionante lo que pueden hacer los navegadores actuales. Ejecutar modelos de IA complejos directamente en el cliente habría sido ciencia ficción hace 10 años.

Experimentación sin barreras Esto elimina completamente las barreras de entrada para experimentar con agentes de IA. Es exactamente lo que necesitamos para que más gente pueda hacer pruebas y aprender.

¿Es el futuro?

Como dice el autor del post de Mozilla AI: “No sé si los agentes WebAssembly son una gran idea o solo un hack divertido”. Pero a mí me parece que están tocando algo importante.

En mi filosofía de trabajo siempre he dicho que “por cada minuto de planteamiento, 2 minutos menos de desarrollo”. Pues bien, este proyecto elimina completamente el tiempo de setup y configuración. Puedes ir directamente al grano: experimentar con tu agente.

Conclusión

WebAssembly Agents es uno de esos proyectos que te hace pensar “¿por qué no se me ocurrió antes?”. La idea de empaquetar agentes de IA como archivos HTML standalone es brillante en su simplicidad.

¿Es perfecto? No. ¿Es útil? Absolutamente. ¿Vale la pena experimentar con él? Sin duda.

Como siempre digo: los errores y problemas siempre ocurren, hay que tenerlo en consideración. Pero este proyecto minimiza muchos de los problemas típicos del desarrollo con IA, y eso ya es un gran avance.

Os recomiendo que le echéis un vistazo al repositorio de GitHub y probéis los ejemplos. Es de esos proyectos que te hacen sentir que la tecnología puede ser simple y poderosa a la vez.


¿Habéis probado WebAssembly Agents? ¿Qué os parece la idea de ejecutar IA directamente en el navegador? Me encantaría conocer vuestras experiencias.

Comentarios

Artículos relacionados

5 min

955 palabras

A lo largo de mi carrera he visto cambiar muchas cosas. He pasado de Borland a Visual Studio, de vi a Sublime Text, de Sublime a VS Code… Y créeme, cada cambio fue una decisión meditada que me costó semanas de adaptación. Pero lo que está pasando ahora con las herramientas de IA es algo completamente diferente.

Me he encontrado usando Copilot por la mañana, probando Cursor por la tarde, y echando un vistazo a Claude Code antes de irme a dormir. Y no soy el único. Los desarrolladores hemos pasado de ser fieles como perros a nuestras herramientas a ser… bueno, promiscuos.

8 min

1681 palabras

Hace unos años, muchos investigadores de IA (incluso los más reputados) predecían que el prompt engineering sería una habilidad temporal que desaparecería rápidamente. Se equivocaron completamente. No solo no ha desaparecido, sino que ha evolucionado hacia algo mucho más sofisticado: Context Engineering.

Y no, no es solo otro término de moda. Es una evolución natural que refleja la complejidad real de trabajar con LLMs en aplicaciones productivas.

De prompt engineering a context engineering

El problema con el término “prompt engineering” es que mucha gente lo confunde con blind prompting - simplemente escribir una pregunta en ChatGPT y esperar un resultado. Eso no es ingeniería, es usar una herramienta.

4 min

650 palabras

El hype vs la realidad: reflexiones de un desarrollador con 30 años de guerra

Esta mañana me he topado con una charla que me ha hecho reflexionar bastante sobre todo este revuelo que hay montado con la IA y el desarrollo de software. El ponente, con una dosis saludable de escepticismo, hace un “reality check” sobre las afirmaciones grandilocuentes que estamos escuchando por todas partes.

La charla completa que ha inspirado estas reflexiones. Vale la pena verla entera.