Skip to content

6. Resolución de los tres problemas con Grok

6.1. Introducción

 
  • En [1], la URL de Grok AI, propiedad de xAI [https://x.ai/company];
  • En [2], tu historial de conversaciones. Para acceder a él, debes crear una cuenta;
  • En [3], formula tu pregunta;
  • En [4], puedes adjuntar archivos;
  • En [5], ejecuta la IA;

A diferencia de Gemini y ChatGPT, no he encontrado ningún límite en cuanto al número de preguntas, el tiempo o el número de archivos adjuntos. Eso no significa que estos límites no existan.

6.2. Problema 1

 

Grok responde correctamente a esta pregunta.

6.3. Problema 2

Le pedimos a Grok que calcule el impuesto utilizando el PDF generado por ChatGPT y le proporcionamos nuestras instrucciones en un archivo de texto.

 

El archivo de texto es el mismo que se utilizó con las dos IA probadas anteriormente, pero hemos incluido las 25 pruebas validadas por ChatGPT y Gemini. El PDF utilizado es el generado por ChatGPT:

Grok proporciona entonces un script muy limpio, pero al portarlo a PyCharm, prácticamente ninguna de las pruebas supera la comprobación. A continuación, le proporciono los registros de errores:

Esta vez, Grok supera las 25 pruebas. En [1-3], mostramos el script [grok1] generado junto con los dos archivos adjuntos a la pregunta.

6.4. Problema 3

Esta vez no se proporciona ningún PDF con las reglas de cálculo. Grok tendrá que buscarlas en Internet. Las instrucciones de texto [instructionsSansPDF5.txt] le proporcionan las mismas 25 pruebas que debe verificar, igual que antes.

 

Grok casi lo consigue en el primer intento. Genera un script que supera 24 de las 25 pruebas. Le proporcionamos sus registros.

En el segundo intento, funciona. En [1], el script generado por Grok; en [2], las instrucciones a seguir.

Ahora le pedimos que genere un PDF en el que se expliquen las reglas de cálculo que ha utilizado para superar las 25 pruebas:

 

Grok no genera un PDF, sino un archivo [Markdown]. He utilizado una herramienta gratuita para convertirlo a PDF. Además, PyCharm puede leer archivos [Markdown]:

 

6.5. Problema 4

Para validar el PDF generado anteriormente, lo introducimos en Grok.

 

Su primera versión es correcta. El script supera las 25 pruebas. De hecho, las IA no parecen ser deterministas. Puedes hacerles la misma pregunta dos veces y ver que sus respuestas difieren. Ese fue el caso aquí con Grok. La primera vez, se me había olvidado que no debía conectarse a Internet y que solo debía usar su PDF. Entonces generó un script incorrecto. Le proporcioné sus registros, y fue entonces cuando vi que se estaba conectando a Internet para comprobar cosas. En la pregunta anterior, le pedí que no lo hiciera. Como resultado, en general, Grok funcionó bien.