Skip to content

7. Lösen der drei Probleme mit ClaudeAI

7.1. Einführung

  • In [1] wird der URL des IA ClaudeAI [https://claude.ai/chat] Produkts der Firma Anthropic [https://www.anthropic.com/] ;
  • In [2] finden Sie den Verlauf Ihrer Chats. Die kostenlosen Sitzungen von ClaudeAI sind sehr begrenzt. Ich ai habe ein kostenpflichtiges Abonnement für einen Monat abgeschlossen, um die folgenden Tests durchzuführen;
  • In [3] ist Ihre Frage ;
  • In [4], um Dateien an Ihre Frage anzuhängen ;
  • In [5], um Ihre Frage auszuführen ;

7.2. Das Problem 1

Die Frage :

 

ClaudeAI antwortet korrekt.

7.3. Das Problem 2

Die Frage :

 

Ich ai hänge meiner Frage zwei Dateien an:

  • Der von PDF erzeugte ChatGPT [Das Problem nach ChatGPT.pdf] ;
  • Meine Anweisungen in der Textdatei [InstructionsAvecPDF4.txt]. Das ist der, der die 25 Unit-Tests erzwingt, die von ChatGPT vorgeschlagen werden;

Die erste Antwort ist nicht korrekt. Wir geben die Logs der Ausführung :

Die Antwort enthält immer noch einen Fehler, der aber minimal ist. ClaudeAI verfehlt einen Test um 2 Euro, obwohl die Genauigkeit, die von Tests verlangt wird, 1 Euro beträgt. Tatsächlich hatten sowohl Gemini als auch ChatGPT den Test aus demselben Grund nicht bestanden. Wahrscheinlich ist die Beschränkung auf 1 Euro aufgrund von Rundungsproblemen, deren offizielle Regeln nicht bekannt sind, zu stark.

Immerhin: Nach zwei weiteren Hin- und Rückfahrten liefert ClaudeAI die richtige Lösung.

7.4. Das Problem 3

Die Frage :

 

In [2] wurde eine Textdatei angehängt, die bereits bei den vorherigen IA verwendet wurde. Sie zwingt den IA, seine Informationen im Internet zu suchen und erzwingt auch hier die 25 Unit-Tests.

Die erste Antwort hat viele Fehler. Wir leiten die Logs an den IA :

 

Noch mehr Fehler :

 

Immer noch nicht. Wir ermutigen ihn :

 

Immer noch nicht :

 

Immer noch nicht :

 

Nichts zu tun:

 

Es gibt wieder viele Fehlversuche. Wir gehen davon aus, dass ClaudeAI es nicht geschafft hat, Problem 3 in angemessener Zeit zu lösen.