7. Lösung der drei Probleme mit ClaudeAI

7.1. Einleitung

In [1] die URL der KI ClaudeAI [https://claude.ai/chat] des Unternehmens Anthropic [https://www.anthropic.com/];
In [2] den Verlauf Ihrer Chats. Die kostenlosen Sitzungen von ClaudeAI sind sehr begrenzt. Ich habe ein kostenpflichtiges Monatsabonnement abgeschlossen, um die folgenden Tests durchzuführen;
In [3] Ihre Frage;
Unter [4] können Sie Dateien an Ihre Frage anhängen;
In [5], um Ihre Frage auszuführen;

7.2. Problem 1

Die Frage:

ClaudeAI antwortet korrekt.

7.3. Problem 2

Die Frage:

Ich habe meiner Frage zwei Dateien beigefügt:

Das von ChatGPT erstellte PDF [Das Problem laut ChatGPT.pdf];
Meine Anweisungen in der Textdatei [InstructionsAvecPDF4.txt]. Darin sind die 25 von ChatGPT vorgeschlagenen Unit-Tests festgelegt;

Die erste Antwort ist falsch. Hier sind die Ausführungsprotokolle:

Die Antwort enthält noch einen Fehler, wenn auch nur einen minimalen. ClaudeAI verfehlt einen Test um 2 Euro, während die geforderte Genauigkeit bei den Tests bei 1 Euro liegt. Tatsächlich hatten sowohl Gemini als auch ChatGPT diesen Test seinerzeit aus demselben Grund verfehlt. Es ist wahrscheinlich, dass die Vorgabe von 1 Euro zu streng ist, da Rundungsprobleme auftreten, deren offizielle Regeln nicht bekannt sind.

Trotzdem liefert ClaudeAI nach zwei weiteren Hin- und Her-Runden die richtige Lösung.

7.4. Aufgabe 3

Die Frage:

In [2] haben wir eine Textdatei beigefügt, die bereits bei den vorherigen KI-Systemen verwendet wurde. Sie zwingt die KI dazu, ihre Informationen im Internet zu suchen, und schreibt auch hier wieder die 25 Einzeltests vor.

Die erste Antwort enthält viele Fehler. Wir übermitteln die Protokolle an die KI:

Wieder Fehler:

Immer noch nicht. Wir ermutigen sie:

Immer noch nicht:

Nichts zu machen:

Wieder viele Fehlversuche. Wir gehen davon aus, dass ClaudeAI Problem 3 nicht innerhalb einer angemessenen Zeit lösen konnte.