WebLLM Study Assistant — Espacio Lambda

Contexto

Las herramientas de estudio con IA suelen mandar tu texto a un servidor. ¿Y si el modelo se descargara y corriera dentro del navegador, sin que los datos salgan de tu equipo?

Objetivo

Validar un asistente de estudio “Edge AI” con WebLLM: descargar un modelo pequeño en el navegador y, a partir de un artículo pegado o una URL de Wikipedia, generar resúmenes, cuestionarios (quizzes), flashcards y responder preguntas sobre el contenido.

Alcance

Incluye la carga del modelo en el cliente y las tareas de estudio sobre un texto dado. Quedan fuera el entrenamiento, modelos grandes y cualquier procesamiento en servidor.

Diseño

El modelo se descarga y ejecuta en el navegador con WebLLM (aceleración por WebGPU). La entrada es texto pegado o el contenido extraído de una URL de Wikipedia; la salida son resúmenes, quizzes, flashcards o respuestas a preguntas.

Decisiones técnicas

Pendiente de documentar (elección de modelo pequeño, WebLLM, WebGPU, extracción de texto de Wikipedia).

Implementación

Pendiente de documentar.

Resultado

Pendiente de documentar.

Limitaciones

Requiere un navegador con WebGPU y una primera descarga del modelo (puede ser pesada). La calidad depende del modelo pequeño elegido; no sustituye a un LLM grande en la nube.

Conclusiones

La principal ventaja es la privacidad: el texto y la inferencia no salen del navegador. Pendiente de cuantificar el coste/beneficio frente a una solución en servidor.