InicioTecnologíaAdiós a la "máquina de escribir": Google lanza DiffusionGemma, la IA gratuita...

Adiós a la “máquina de escribir”: Google lanza DiffusionGemma, la IA gratuita que redacta por bloques y supera la velocidad de ChatGPT

Date:

Relacionado

La letra chica de iOS 27: qué iPhones se actualizan y quiénes se quedan afuera de la nueva Siri AI

Apple confirmó que su nuevo sistema operativo será compatible con modelos de hasta siete años de antigüedad.

Salto generacional en Apple: iOS 27 y una Siri totalmente redefinida por IA prometen transformar la interacción con el iPhone

En lo que representa el cambio de paradigma más profundo para su ecosistema móvil desde el nacimiento de sus asistentes de voz, Apple oficializó el lanzamiento de iOS 27.

Apple presenta macOS 27 “Golden Gate”: una revolución centrada en la IA y la arquitectura Apple Silicon

En el marco de la WWDC26, la compañía de Cupertino oficializó la nueva era de su sistema operativo para computadoras, que abandona definitivamente el soporte para procesadores Intel para abrazar una integración total con la inteligencia artificial generativa.

Apple lanza iOS 26.5.1 de urgencia para solucionar un crítico fallo de carga en la línea del iPhone 17

En paralelo, la firma tecnológica de Cupertino también puso a disposición de los usuarios la versión macOS 26.5.1 para ordenadores Mac.
spot_imgspot_img

El gigante tecnológico Google acaba de patear el tablero de la inteligencia artificial con el lanzamiento de DiffusionGemma, un modelo experimental que promete transformar por completo la generación de contenido automatizado. A diferencia de los sistemas actuales como ChatGPT, que construyen sus respuestas de manera secuencial —palabra por palabra—, este nuevo algoritmo es capaz de redactar bloques completos de texto en simultáneo, multiplicando drásticamente la velocidad de procesamiento.

De acuerdo con los datos técnicos publicados por la compañía, DiffusionGemma alcanza una velocidad de inferencia hasta cuatro veces mayor que el modelo Gemma 4 y otros sistemas autorregresivos convencionales. Las pruebas de rendimiento son contundentes: corriendo sobre una unidad de procesamiento gráfico (GPU) dedicada NVIDIA H100, la IA es capaz de superar la barrera de los 1.000 tokens por segundo, una marca que equivale a diez veces la velocidad registrada por GPT-5.4 mini.

De la máquina de escribir a la imprenta digital

Para dimensionar el salto tecnológico que representa DiffusionGemma, es necesario comprender la limitación de los modelos de lenguaje tradicionales. Hasta hoy, la mayoría de las IA funcionan como una máquina de escribir: generan un elemento (token) tras otro de izquierda a derecha, obligando al hardware a esperar que cada pieza esté lista antes de avanzar.

Si bien este proceso es eficiente en la nube debido al procesamiento masivo de peticiones simultáneas, resulta ineficaz cuando un usuario ejecuta el modelo de forma local en su propia computadora. En ese escenario, incluso las placas de video más potentes pasan gran parte del tiempo inactivas, esperando el siguiente paso de la secuencia.

DiffusionGemma rompe este cuello de botella con una lógica completamente distinta:

  • Generación en paralelo: En lugar de avanzar paso a paso, el sistema estampa un bloque cerrado de 256 tokens a la vez. Es el equivalente tecnológico a pasar de la máquina de escribir a una imprenta industrial que plasma la página completa de un solo golpe.
  • Refinamiento iterativo: El modelo utiliza una técnica idéntica a la de los generadores de imágenes como Midjourney o DALL-E 3. Comienza proyectando un bloque de “ruido” o texto aleatorio y, a través de sucesivas pasadas de limpieza, va puliendo el resultado hasta obtener una redacción nítida y coherente.
  • Atención bidireccional: Al procesar los 256 tokens en paralelo, cada palabra se relaciona simultáneamente con todas las demás del bloque. Esta característica representa una ventaja crítica para tareas complejas donde los modelos tradicionales suelen fallar, tales como rellenar líneas de código faltantes o editar fragmentos de texto no lineales.

Potencia industrial en hardware doméstico

A nivel arquitectónico, DiffusionGemma fue diseñado bajo una estructura de Mixture of Experts (MoE) con un volumen total de 26.000 millones de parámetros. Sin embargo, su optimización es tal que durante la ejecución de tareas solo activa 3.800 millones de parámetros en simultáneo.

En la práctica, esto significa que el modelo no requiere de la infraestructura de un servidor corporativo para funcionar: cabe perfectamente en la memoria de las tarjetas gráficas de consumo general que cuenten con 18 GB de VRAM (como las potentes NVIDIA RTX 4090 o la línea RTX 5090), democratizando el acceso a la IA de alta velocidad directamente en el hogar o la oficina.

El veredicto periodístico: ¿Cuándo conviene usarlo?

Fiel a la transparencia que exige el sector, Google ha puesto el modelo a disposición de la comunidad de código abierto a través de la plataforma Hugging Face bajo la flexible licencia Apache 2.0. El sistema ya es compatible con herramientas de integración como vLLM, MLX y Hugging Face Transformers, y se espera su llegada inminente a llama.cpp.

No obstante, en el periodismo de tecnología los detalles importan: DiffusionGemma es un modelo que prioriza de forma absoluta la velocidad por sobre la precisión fina. La propia compañía reconoció que, en términos de calidad de redacción pura y flujos de producción comercial, los modelos Gemma 4 estándar siguen siendo superiores.

El verdadero brillo de esta herramienta experimental se encuentra en los entornos locales. Es la opción ideal para desarrolladores y entusiastas que buscan experimentar con flujos de trabajo en tiempo real, prototipado veloz de aplicaciones o edición interactiva de código. Para el usuario que cuenta con el hardware adecuado y la curiosidad de explorar las fronteras de la informática, DiffusionGemma es, sin dudas, uno de los hitos tecnológicos más disruptivos en lo que va del año.

Anuncio

Actualidad

spot_img