No es sorpresa afirmar que la inteligencia artificial es un concepto y una tecnología que se lleva desarrollando desde hace años, pero que ha irrumpido de manera rompedora entre 2022 y nuestros días, siendo catalogado por expertos como un fenómeno tan importante como lo fue el nacimiento de Internet en su día.
Aunque ChatGPT fue lo primero que conoció el gran público, otras grandes tecnológicas están apostando fuerte por esta tendencia, siendo las dos principales Google, con Gemini; y Microsoft, con Microsoft Copilot.
Ante esta variedad de alternativas, es normal que los usuarios no sepan muy bien cómo comparar o complementar estos modelos de IA, pero tras revisar esta comparativa seguro que lo tendrás muy claro. Es por ello que vamos a comparar las diferentes características de cada una de ellas para que conozcas sus puntos fuertes y sus puntos débiles.
ChatGPT
ChatGPT, de OpenAI, cuenta con un plan gratuito y 3 planes de pago, los cuales describimos en detalle a continuación:
Plan gratuito
El plan gratuito de ChatGPT se presenta como una opción accesible para los usuarios interesados en explorar las capacidades de la IA conversacional.
Podrás realizar un número ilimitado de consultas, desde preguntas generales hasta solicitudes específicas, sin preocuparte por alcanzar un límite de uso establecido. A su vez, el historial de conversaciones tampoco tiene límites, por lo que podrás revisar conversaciones anteriores en cualquier momento.
Por otro lado, ya sea que uses PC o tengas un smartphone iOS o Android, podrás hacer uso de este plan gratuito sin ningún tipo de problemas gracias a su plataforma web y a sus apps dedicadas para ambos sistemas móviles.
Web: Página oficial de ChatGPT
- Descarga ChatGPT para Android
- Descarga ChatGPT para iOS
No obstante, y como es obvio, este plan gratuito debe tener puntos negativos respecto a los planes de pago, y efectivamente así es. Para empezar, la diferencia más notable es que el plan gratuito ejecuta GPT-3.5 en vez de GPT-4.
Hay muchas diferencias entre ambos modelos, pero las más destacadas que hacen de GPT-4 una opción más ventajosa son:
- GPT-4 puede interpretar imágenes y generarlas a partir de texto. En cambio, GPT-3.5 no es capaz.
- GPT-4 tiene menos "alucinaciones" que GPT-3.5, por lo que será menos probable que recibas respuestas inventadas, extrañas o inexactas.
- GPT-4 tiene una mejor capacidad de procesamiento y un mayor soporte de idiomas.
Otra desventaja del plan gratuito es su tiempo de respuesta, el cual variará dependiendo del ancho de banda y la disponibilidad de los servidores. Esto quiere decir que, durante períodos de alta demanda, la respuesta de la IA será visiblemente más lenta o directamente nula.
Por otro lado, la ventana de contexto de 8.000 tokens del plan gratuito puede llegar a ser muy limitada. Para que lo tengas más claro, la ventana de contexto de una IA se refiere a la cantidad de información previa que el modelo de IA puede considerar al generar una respuesta, lo cual es importante para que las conversaciones más largas sean coherentes.
Otro concepto con el que puedes tener dudas es "token". Un token suele ser aproximadamente una palabra, por lo que la IA podrá revisar las últimas 8.000 palabras para basar su siguiente respuesta.
En caso de que seas un usuario casual, estudiante o un profesional que busca una introducción a la IA conversacional sin gastar un céntimo, este plan es ideal para ti.
Plan Plus
El plan Plus de ChatGPT ofrece acceso estándar a GPT-4 y un tiempo de respuesta más rápido, garantizando así una experiencia más fluida y consistente. Por otro lado, su ventana de contexto se ve ampliada a 32.000 tokens. Sin embargo, esto es solo un poco de lo que ofrece el primer plan de pago de ChatGPT.
Para empezar, con él podrás crear y compartir tus propios GPTs. Por si no sabes lo que son, los GPTs son versiones personalizadas del modelo GPT de ChatGPT. Con ellos, podrás crear o usar (si ya está creado) "un ChatGPT más orientado a lo que desees", ya sea que busques un ChatGPT experto en marketing, un ChatGPT experto en Blackjack o un ChatGPT experto en el cuidado de bebés, por poner algunos ejemplos.
Para crearlos no necesitarás saber de programación. Simplemente, tendrás que proporcionarle instrucciones y conocimientos y elegir si puede buscar en la web, generar imágenes o analizar datos, además de otras opciones más avanzadas.
La ventaja esencial de los GPTs es que almacenan su propia biblioteca de prompts personalizados, por lo que no tienes que volver a escribir cada uno de ellos.
Además de los GPTs, con el plan Plus y GPT-4, tal y como mencionamos anteriormente, podrás generar imágenes, pedir a ChatGPT que las interprete, que busque información en tiempo real en Internet o que trabaje con archivos que podrás adjuntar.
Por otro lado, podrás interactuar con el modelo de IA mediante voz, tanto pudiendo tú enviarle mensajes de voz como escuchando las respuestas con una de las voces a elegir.
Para terminar, otra de las características estrella de ChatGPT es el análisis de datos avanzado, el cual puede resultar tremendamente útil para investigaciones de mercado, análisis financieros, gestión de recursos humanos y muchas más áreas.
Todas estas características adicionales hacen del plan Plus una opción perfecta para usuarios que buscan maximizar el potencial de la IA en sus actividades diarias, proyectos creativos, o iniciativas empresariales, y por un precio de 20 dólares al mes, podemos decir que es un plan con una buena relación calidad-precio.
Plan Team
El plan Team está concebido para satisfacer las necesidades específicas de los equipos de trabajo. Al igual que el plan Plus, el plan Team ofrece acceso a GPT-4, pero con herramientas diseñadas para mejorar la colaboración en equipo.
También mantiene las características de tiempo de respuesta rápido y una ventana de contexto de 32.000 tokens, pero se diferencia en características como:
- Acceso a un entorno compartido donde los miembros de un equipo pueden interactuar con ChatGPT y acceder a proyectos y recursos comunes.
- La facturación es unificada, por lo que se simplifica todo el proceso de gestión y presupuesto.
- Tiene una consola de administración que ofrece a los líderes del equipo herramientas para gestionar miembros, asignar roles y supervisar el uso de ChatGPT dentro del equipo.
Por otro lado, el análisis de datos avanzado estándar del Plan Plus está ampliado en el plan Team, adaptándose así a las necesidades de los equipos, que probablemente necesiten extraer información de grandes volúmenes de datos.
Este plan es ideal para empresas, grupos de investigación, y equipos de desarrollo que buscan integrar la potencia de GPT-4 en sus flujos de trabajo colaborativos. Su precio es de 25 dólares al mes por usuario cuando se paga anualmente y de 30 dólares al mes por usuario si se paga de manera mensual.
Plan Enterprise
El plan Enterprise está diseñado para satisfacer las demandas y requisitos de grandes organizaciones que buscan integrar la inteligencia artificial en sus procesos a gran escala.
Este plan ofrece el tiempo de respuesta más rápido de todos los planes de ChatGPT, junto con una ventana de contexto significativamente ampliada de 128.000 tokens.
Además, incluye análisis de datos avanzado ilimitado, y otra serie de características que vamos a enumerar a continuación:
- Créditos para explorar la API de OpenAI e integrarla en sus sistemas según sus necesidades específicas.
- Acceso seguro a ChatGPT para todos los empleados de la organización, simplificando así la gestión de identidades y accesos.
- Seguridad y autenticación de las comunicaciones de la empresa reforzadas al utilizar ChatGPT para proteger la información corporativa confidencial.
- Un panel de estadísticas para que los administradores tengan una visión detallada del uso de ChatGPT dentro de la organización.
- Los clientes que tengan contratado este plan tendrán soporte prioritario de atención al cliente.
- Onboarding dedicado mediante formación y recursos para implementar ChatGPT en la empresa de forma fluida, personalizada y sencilla.
- Ya sea por sospechas de que algo va mal o por mera rutina, podrás pedir a OpenAI evaluaciones de seguridad personalizadas.
El plan Enterprise es ideal para organizaciones que requieren aplicaciones de IA a gran escala sin perder de vista la seguridad y una integración sistemática. No hay un precio fijado para este plan, ya que deberás consultarlo a su servicio de atención al cliente.
Gemini
Continuamos con el primer gran rival de ChatGPT: Gemini, de Google. Desarrollado por DeepMind y Google Research, Gemini ha sido diseñado desde su concepción para superar las limitaciones de los modelos previos, y es que es lo bueno que tiene presentarse al gran público después que tus competidores: te puedes fijar en ellos para superarlos a posteriori.
Antes de empezar a describirlo en detalle, es posible que estés dudando si Gemini es Bard, el primer gran nombre de IA de Google que sonó hace unos meses con fuerza. La respuesta es no, no son lo mismo, pero están relacionados.
Originalmente, Bard se lanzó solo como un chatbot de IA conversacional, mientras que Gemini se lanzó después para referirse a una familia de modelos de IA generativa más avanzados desarrollados por Google.
Este movimiento nos parece inteligente por parte de Google, ya que es mucho más escalable una familia de modelos de IA que un chatbot, y más aún si estamos hablando del gigante de Internet, como es Google. Sin embargo, bien es cierto que podrían haberlo hecho desde el principio para evitar confusiones, ya que OpenAI es bien claro con los planes y funciones que su modelo de IA ofrece.
Ahora sí, para empezar, una de las características más distintivas de Gemini es su capacidad nativa multimodal. A diferencia de modelos anteriores, como LaMDA, que fueron entrenados exclusivamente en datos textuales, Gemini ha sido entrenado y mejorado en audio, imágenes, vídeos, bases de códigos extensas y texto en múltiples idiomas.
Esto hace que pueda realizar tareas que van desde la transcripción de discursos hasta la generación de arte, pasando por la creación de subtítulos para imágenes y vídeos. Por compararlo con ChatGPT, la IA de OpenAI también puede hacer todo esto sin problema, ya sea gracias a sus opciones nativas o a los GPTs de los usuarios.
Gemini tiene tres modelos: Nano, Pro y Ultra, y cada uno de ellos tiene características únicas que los distinguen entre sí.
Gemini Nano
Gemini Nano es la versión más compacta y eficiente de la familia de modelos de IA, diseñada específicamente para funcionar en dispositivos móviles, como el Google Pixel 8 Pro.
Algunas de las características más interesantes de Gemini Nano son "Resumir" en la app de la grabadora o "Respuesta Inteligente" en Gboard, ambas disponibles sin conexión a Internet. Otras igualmente atractivas son las relacionadas con la edición fotográfica, pudiendo mover a personas dentro de las instantáneas, borrar objetos o incluso elegir las mejores expresiones de cada uno de los presentes en una foto de manera individual.
El hecho de que opere directamente en el dispositivo asegura que los datos sensibles permanezcan en el dispositivo del usuario, evitando así que los datos sean almacenados en servidores ante un hipotético peligro de filtración.
El nombre de la app bajo la que trabaja Gemini Nano en el Google Pixel 8 Pro es AICore y para iniciarla de manera permanente, primero debes activar las opciones de desarrollador en Ajustes > Información del teléfono y pulsar varias veces en "Número de compilación".
Acto seguido, debes ir a Ajustes > Sistema > Opciones para desarrolladores > AiCore Settings > Enable AICore persistent. Tras haber seguido estos pasos, reinicia el teléfono.
Gemini Pro
Gemini Pro es una versión gratuita de Gemini que ofrece un equilibrio entre capacidad y eficiencia en el uso de recursos. No obstante, este modelo sigue siendo mejor en áreas donde LaMDA y modelos anteriores de Google tenían limitaciones, particularmente en tareas de razonamiento, planificación y comprensión.
Por ejemplo, Google afirma que un estudio independiente realizado por investigadores de Carnegie Mellon y BerriAI demostró que Gemini Pro supera a GPT-3.5 de OpenAI en tareas que requieren cadenas de razonamiento más largas y complejas, lo cual suena interesante.
Web: Acceso al estudio de Carnegie Mellon y BerriAI
Esto se hace aún más notable con la actualización a Gemini 1.5 Pro, con el que se pueden procesar hasta 700.000 palabras o 30.000 líneas de código, lo que representa un aumento de 35 veces respecto a su versión anterior.
Si juntamos esto con su naturaleza multimodal, veremos que puede analizar hasta 11 horas de audio o una hora de video en diferentes idiomas, aunque con cierta lentitud en el procesamiento.
La aplicación de Google con Gemini Pro que seguramente más usarás será su chatbot o su app móvil (de momento solo para Android, pero ya se sabe que llegará en un futuro a corto plazo a iOS).
Este ya permite la posibilidad de subir imágenes y hablar con él a través del micrófono. Al igual que ChatGPT, puede realizar todo tipo de tareas, desde generar textos de manera creativa a contestar preguntas de forma informativa.
Web: Chat de Gemini
- Descarga Google Gemini para Android
Para ponerlo a prueba, le pedimos la divertida tarea de que cree un poema que sea una oda a El Grupo Informático. Ante esta instrucción, Gemini crea un poema de 8 estrofas. Si pulsamos en el tercer botón de la botonera inferior, podremos pedirle a la IA de Google que lo haga más corto, más largo, más simple, más informal o más profesional.
Por otro lado, gracias al siguiente botón podremos crear un enlace para compartir toda una conversación o solo una instrucción y respuesta específicas. El logo de Google en dicha botonera sirve para verificar la respuesta, contrastándola con los resultados del buscador.
Gemini Ultra
Gemini Ultra es el modelo más avanzado y potente de la familia Gemini, presente en la experiencia Gemini Advanced. Está diseñado para tareas de alta complejidad y destaca por su profundidad en el análisis y generación de contenido multimodal.
Tiene capacidad para comprender y procesar simultáneamente texto, audio, imágenes y video. Además, es capaz de extraer y utilizar información de diferentes fuentes para resolver cuestiones complejas, desde trabajos académicos de alto nivel a desarrollo de aplicaciones.
Por otro lado, y aunque Google ha afirmado que la generación de imágenes es técnicamente posible con Gemini Ultra, esta aún no se ha integrado completamente en su versión final.
La promesa es que, a diferencia de otros modelos que dependen de pasos intermedios para la generación de imágenes, Gemini Ultra pueda generar imágenes directamente, basándose en una comprensión contextual multimodal, así que tocará esperar para evaluarlo debidamente.
Gemini Ultra está disponible mediante suscripción al plan AI Premium de Google One, que tiene un costo de 20 dólares al mes o 21,99 euros al mes, con una oferta de dos meses gratis para probarlo.
Web: Plan AI Premium de Google One
Este plan no solo ofrece acceso a Gemini Ultra, sino que también incluye 2 TB de almacenamiento, funciones extra para Google Meet y Google Calendar e integración con el ecosistema Google Workspace.
Microsoft Copilot
Continuamos con la tercera alternativa en materia de modelos de IA: Microsoft Copilot, la cual ha experimentado una rápida evolución desde su inicio y es gratuita.
Copilot utiliza herramientas de OpenAI, como GPT-4 y DALL-E 3, junto con la base de datos de Bing y tecnologías de Microsoft. Por otro lado, Copilot está disponible de forma gratuita en varias plataformas, incluyendo su sitio web, el sistema operativo Windows, su navegador Edge y apps móviles.
Web: Chatbot de Microsoft Copilot
- Descarga Microsoft Copilot para Android
- Descarga Microsoft Copilot para iOS
Comenzando por su página web, podemos elegir fácilmente desde el principio cómo queremos que se exprese la IA, si de forma más creativa, más precisa o un equilibrio entre ambas posturas.
Con el pequeño icono que encontrarás en la esquina inferior izquierda de la barra para escribir tu pregunta, podrás subir imágenes para trabajar con ellas con ayuda de la IA, a la vez que también podrás usar el micrófono para comunicarte con ella.
A tu derecha, podrás observar que hay cinco GPTs creados por Microsoft para elegir en caso de que los necesites:
- El propio Copilot.
- Designer, hecho específicamente para generar imágenes.
- Vacation planner, muy indicado para encontrar hoteles, itinerarios y todo lo relacionado con las vacaciones.
- Cooking assistant, diseñado para crear recetas, planes de comidas y encontrar consejos y trucos culinarios.
- Fitness trainer, si quieres crear un programa personalizado de ejercicios y nutrición.
En el navegador Microsoft Edge encontraremos el logo de Copilot en la esquina superior izquierda de la pantalla. Al pinchar sobre él, veremos las opciones ya vistas, además de algunas adicionales, como una función para resumir todo el contenido de una web u otra para obtener datos relevantes como dirección y teléfono, muy útil mientras visitamos webs de tiendas, por ejemplo.
Si pinchamos en el pequeño cuadrado ubicado en la esquina superior izquierda, tendremos acceso a los complementos, una especie de cruces entre extensiones de navegador y GPTs. Sea como sea, se ven muy interesantes, habiendo complementos para encontrar productos, para encontrar los mejores precios o para crear canciones, entre otros usos.
Otra función adicional muy útil de Copilot para Edge es la capacidad de hacer capturas en tiempo real para adjuntarlas a la conversación con la IA, y esto lo consigues con solo pulsar en el icono de las tijeras en la barra de texto.
Su versión de pago se llama Copilot Pro, y cuesta 20 dólares al mes. Con ella puedes integrar Copilot en las apps de Microsoft 365, además de que tendrás un mejor rendimiento, acceso prioritario a GPT-4 y GPT-4 Turbo y una generación de imágenes más rápida.
Tabla comparativa
A continuación, y para que puedas ver de manera gráfica a los tres servicios de inteligencia artificial frente a frente, vamos a elaborar una tabla con los elementos más fundamentales para que puedas tomar una decisión fundada.
ChatGPT gratuito | ChatGPT Plus | ChatGPT Team | ChatGPT Enterprise | Gemini Nano 1.0 | Gemini Pro 1.5 | Gemini Ultra 1.0 | Copilot gratuito | Copilot Pro | |
---|---|---|---|---|---|---|---|---|---|
Procesamiento de texto | Sí | Sí | Sí | Sí | Sí | Sí | Sí | Sí | Sí |
Generación e interpretación de imágenes | No | Sí | Sí | Sí | No | Sí (en fase de despliegue) | Sí (en fase de despliegue) | Sí | Sí |
Ventana de contexto | 8.000 tokens | 32.000 tokens | 32.000 tokens | 128.000 tokens | 32.000 tokens aproximadamente | 128.000 tokens (hasta 1.000.000 para grupos de prueba) | 32.000 tokens aproximadamente | 1.000 tokens aproximadamente | 2.000 tokens aproximadamente |
Versión web | Sí | Sí | Sí | Sí | No | Sí | Sí | Sí | Sí |
App dedicada para iOS y Android | Sí | Sí | Sí | Sí | Sí (solo Android) | Sí (solo Android) | No | Sí | Sí |
Búsqueda en tiempo real | No | Sí | Sí | Sí | Sí | Sí | Sí | Sí | Sí |
Permite adjuntar o gestionar archivos | No | Sí | Sí | Sí | No | No | Sí | No | Sí |
Precio | Gratis | 20 dólares al mes | 25/30 dólares al mes | A consultar | Gratis | Gratis | 20 dólares al mes | Gratis | 20 dólares al mes |
De esta tabla, podemos sacar algunas conclusiones relevantes, como la diferencia de ventanas de contexto de los diferentes servicios. Por ejemplo, la capacidad de Gemini Pro en este sentido es igual o superior a la del plan Enterprise de OpenAI, aunque está claro que Google está evolucionando gradualmente, ya que estamos hablando de la versión 1.5 de Gemini Pro, mientras que Gemini Ultra 1.0 aún cuenta con unos 32.000 tokens de ventana de contexto.
Sin embargo, y vista la velocidad a la que avanza este sector, seguro que pronto veremos una nueva versión de Gemini Ultra con un gran salto en cifras y novedades interesantes.
Por su parte, la ventana de contexto de Copilot sigue siendo bastante reducida, pero también se esperan aumentos en esta área.
Esperamos haber podido ayudarte a diferenciar las distintas características de ChatGPT, Gemini y Copilot de manera completa y entendible, ya que es común confundirse con las diferentes versiones y conceptos que van apareciendo en este sector en cuestión de semanas.
IA: cómo ha cambiado la vida de los usuarios con la inteligencia artificial
- Ver Comentarios