Entradas

Google Gemini visto en profundidad

Imagen
El ecosistema de Google Gemini no debe entenderse como un único producto, sino como una familia de modelos de inteligencia artificial y un conjunto de herramientas interconectadas. Su diferenciador arquitectónico clave, y el concepto central que sustenta su poder, es haber sido "construido desde cero para ser multimodal". Esta decisión de diseño fundamental significa que Gemini puede procesar, comprender y razonar de forma nativa a través de múltiples tipos de información simultáneamente, incluyendo texto, imágenes, audio, video y código de programación. Este enfoque contrasta con modelos anteriores donde las capacidades multimodales se añadían a una base predominantemente textual, lo que a menudo resultaba en una integración menos fluida y capacidades de razonamiento intermodal limitadas.   La llegada de Gemini representa la culminación de años de investigación en Google, trazando un linaje evolutivo desde trabajos anteriores como LaMDA y PaLM. Esta trayectoria, articulada p...