Skip to content

6. Risoluzione dei tre problemi con Grok

6.1. Introduzione

 
  • In [1], l'URL di Grok AI di proprietà di xAI [https://x.ai/company];
  • In [2], la cronologia delle tue conversazioni. Per accedervi, devi creare un account;
  • In [3], poni la tua domanda;
  • In [4], puoi allegare dei file;
  • In [5], esegui l'IA;

A differenza di Gemini e ChatGPT, non ho riscontrato alcun limite al numero di domande, al tempo o al numero di file allegati. Ciò non significa che questi limiti non esistano.

6.2. Problema 1

 

Grok risponde correttamente a questa domanda.

6.3. Problema 2

Chiediamo a Grok di calcolare l'imposta utilizzando il PDF generato da ChatGPT e forniamo le nostre istruzioni in un file di testo.

 

Il file di testo è lo stesso utilizzato con le due IA testate in precedenza, ma abbiamo incluso i 25 test convalidati da ChatGPT e Gemini. Il PDF utilizzato è quello generato da ChatGPT:

Grok fornisce quindi uno script molto pulito, ma una volta portato su PyCharm, praticamente nessuno dei test viene superato. A quel punto gli fornisco i log degli errori:

Questa volta, Grok supera tutti i 25 test. In [1-3], mostriamo lo script [grok1] generato insieme ai due file allegati alla domanda.

6.4. Problema 3

Questa volta non viene fornito alcun PDF con le regole di calcolo. Grok dovrà trovarle online. Le istruzioni testuali [instructionsSansPDF5.txt] gli assegnano gli stessi 25 test da verificare di prima.

 

Grok quasi ci riesce al primo tentativo. Genera uno script che supera 24 test su 25. Gli forniamo i suoi log.

Al secondo tentativo, funziona. In [1], lo script generato da Grok; in [2], le istruzioni da seguire.

Ora gli chiediamo di generare un PDF che spieghi le regole di calcolo che ha utilizzato per superare tutti i 25 test:

 

Grok non genera un PDF, ma un file [Markdown]. Ho utilizzato uno strumento gratuito per convertirlo in PDF. Inoltre, PyCharm è in grado di leggere i file [Markdown]:

 

6.5. Problema 4

Per convalidare il PDF generato in precedenza, lo inviamo a Grok.

 

La sua prima versione è corretta. Lo script supera tutti i 25 test. In realtà, le IA non sembrano essere deterministiche. Puoi porre loro la stessa domanda due volte e vedere che le loro risposte divergono. È stato così in questo caso con Grok. La prima volta, avevo dimenticato che non avrebbe dovuto collegarsi a Internet e che avrebbe dovuto utilizzare solo il suo PDF. Ha quindi prodotto uno script errato. Gli ho fornito i suoi log, ed è stato allora che ho visto che si collegava a Internet per verificare alcune cose. Nella domanda sopra, gli avevo chiesto di non farlo. Di conseguenza, nel complesso, Grok ha funzionato bene.