6. Lösung der drei Probleme mit Grok

6.1. Einführung

In [1], der URL des IA Grok im Besitz der Firma xAI [https://x.ai/company] ;
In [2] sehen Sie den Verlauf Ihrer Konversationen. Um ihn zu erhalten, müssen Sie sich ein Konto einrichten ;
In [3] stellen Sie Ihre Frage;
In [4] können Sie Dateien anhängen ;
In [5] starten Sie die Ausführung des IA ;

Im Gegensatz zu Gemini und ChatGPT bin ich ai nicht auf Grenzen für Fragen, Zeit oder die Anzahl der angehängten Dateien gestoßen. Das bedeutet jedoch nicht, dass diese Begrenzungen nicht existieren.

6.2. Das Problem 1

Grok beantwortet diese Frage richtig.

6.3. Das Problem 2

Wir schlagen Grok vor, die Steuerberechnung mithilfe des von ChatGPT erzeugten PDF zu lösen, und geben ihm unsere Anweisungen in einer Textdatei.

Die Textdatei ist diejenige, die bereits bei den beiden getesteten IA verwendet wurde, aber es wurden die 25 Tests, die von ChatGPT und Gemini validiert wurden, hineingepackt. Das verwendete PDF ist das von ChatGPT erzeugte PDF :

Grok liefert ein sehr sauberes script, aber in PyCharm portiert, kommt kaum ein Test durch. Ich liefere ihm dann die Logs seiner Fehler:

Diesmal besteht Grok alle 25 Tests. In [1-3] zeigen wir den erzeugten script [grok1] sowie die beiden Dateien, die an die Frage angehängt wurden.

6.4. Das Problem 3

Diesmal wird kein PDF für die Rechenregeln angegeben. Grok muss sie im Internet finden. Die Textanweisungen [instructionsSansPDF5.txt] geben ihm die gleichen 25 Tests wie zuvor zur Überprüfung.

Grok gelingt dies fast beim ersten Mal. Er erzeugt einen script, der 24 von 25 Tests besteht. Wir geben ihm seine Logs.

Beim zweiten Versuch klappt es. In [1] der von Grok erzeugte script, in [2] die Anweisungen, die Sie befolgen müssen.

Er wird nun gebeten, einen PDF zu generieren, der die Rechenregeln erklärt, die er verwendet hat, um die 25 Tests zu bestehen :

Grok erzeugte dann nicht eine PDF, sondern eine Datei [MarkDown]. Ich ai ein kostenloses Tool verwendet, um sie in PDF umzuwandeln. Außerdem kann PyCharm Dateien [MarkDown] lesen:

6.5. Das Problem 4

Um den zuvor erzeugten PDF zu bestätigen, geben wir ihn Grok.

Sein erster Entwurf ist korrekt. Der script besteht alle 25 Tests. Tatsächlich scheinen die IA nicht deterministisch zu sein. Man kann ihnen zweimal die gleiche Frage stellen und sehen, dass ihre Antworten voneinander abweichen. Dies war ici mit Grok der Fall. Das erste Mal, hatte ich übersehen, dass er nicht ins Internet gehen und nur seinen PDF verwenden sollte. Er hat dann einen falschen script produziert. Ich ai ihm seine Logs und dann sah ich ai, dass er ins Internet ging, um Dinge zu überprüfen. In der obigen Frage hatte ich ai darum gebeten, dass er das nicht tun sollte. Im Großen und Ganzen hat Grok also gute Arbeit geleistet.