1. Einführung
Das PDF dieses Dokuments ist |HIER| verfügbar.
Die Konverter Gemini 3 / ChatGPT 5.2 [Word oder ODT → HTML] sind |HIER| verfügbar.
Dieses Dokument stellt Ihnen zwei Konverter zur Verfügung:
- einen Konverter von LibreOffice ODT nach HTML;
- einen Konverter von Word DOCX nach HTML;
.
In diesem Artikel möchten wir dem Leser einen Python-Konverter zur Verfügung stellen, der Word- oder ODT-Dokumente in eine statische HTML-Website umwandelt. Dieser Konverter wurde ursprünglich von der KI Gemini 3 und anschließend von ChatGPT 5.2 erstellt. Diese beiden KIs benötigten 356 Iterationen, um den Konverter für dieses Dokument zu erstellen. Dies erforderte eine mehrwöchige Fehlerbehebung. Gemini 3 hat zu Beginn die gesamte Arbeit geleistet. Zunächst waren mehrere Dutzend Iterationen nötig, um eine erste, einigermaßen korrekte Version zu erhalten. Dann fügte ich regelmäßig ein neues Problem hinzu, das durch neue ODT-Dokumente auftrat. Und dabei machte Gemini oft Rückschritte. Das heißt, was in Schritt N funktionierte, funktionierte in den folgenden Schritten nicht mehr. Ich ging dann wie folgt vor: Sobald Gemini einen Konverter erzeugte, der eines meiner Probleme löste, machte ich daraus eine Referenzversion und teilte dies Gemini mit. Diese Referenz speicherte ich lokal. Wenn ich dann sah, dass Gemini zu lange Rückschritte machte, bat ich es, zur letzten bekannten Referenzversion zurückzukehren, indem ich sie ihm gab. So haben wir nach und nach gemeinsam diesen Konverter aufgebaut: Ich habe ihm mitgeteilt, was ich wollte, im Wesentlichen indem ich ihm die Anomalien meldete, die ich in der erzeugten HTML-Seite fand, und er hat den gewünschten Code erzeugt.
Ich habe Gemini 3 mit einer Pro-Lizenz für 22 Euro/Monat und ChatGPT 5.2 ebenfalls genutzt.
Gemini / ChatGPT generiert zwei Python-Skripte:
- [convert] zum Konvertieren des ODT-Dokuments aus LibreOffice oder des DOCX-Dokuments aus Word in eine MkDocs-Website;
- [build] zur Konvertierung der MkDocs-Website in eine statische HTML-Website;
Ich habe mir den generierten Code nie angesehen. Ich wollte sie als Black Boxes betrachten. Man muss kein Python-Entwickler sein, um diesem Tutorial zu folgen, und nicht einmal ein Entwickler überhaupt.
Als ich der KI Gemini 3 Verbesserungen für den Konverter vorschlug, ist diese manchmal abgestürzt. Sie konnte die gewünschten Verbesserungen nicht vornehmen. Zu diesem Zeitpunkt waren wir bei der stabilen Version V316. Um weiterzukommen, habe ich diese funktionsfähige Version an ChatGPT 5.2 übergeben und die gewünschten Verbesserungen angefordert. ChatGPT hat den Code von Gemini korrekt geändert, um meinen neuen Anforderungen gerecht zu werden. Deshalb bin ich der Ansicht, dass diese beiden KI-Systeme den Konverter erstellt haben.
Danach habe ich diese Technik weiterverwendet. Wenn eine KI bei einer Funktion nicht weiterkam, gab ich der anderen KI die letzte bekannte stabile Version.
Die beiden KI-Systeme haben unterschiedliche Methoden, um den angeforderten Python-Code zu liefern:
- Gemini gibt den Code des generierten Skripts auf der Abfrageseite aus. Dieser Code muss dann kopiert und eingefügt werden;
- ChatGPT bietet einen Download-Link für das generierte Skript an;
Bei mehr als 1000 Zeilen generiertem Code zeigte Gemini erhebliche Schwächen. Aufgrund technischer Einschränkungen dieser KI gelang es ihr nicht, den gesamten generierten Code auf der Abfrageseite anzuzeigen. Sehr oft fehlten Codezeilen. Aufgrund dieser Einschränkung war es ab einem bestimmten Zeitpunkt nicht mehr möglich, Gemini 3 zu verwenden. Daher hat ChatGPT 5.2 das Skript fertiggestellt.
Ebenfalls ChatGPT hat den Word-zu-HTML-Konverter generiert. Ich habe ihm den funktionierenden ODT-zu-HTML-Konverter gegeben und ihn gebeten, diesen für ein Word-Dokument anzupassen. Er hat dies in 18 Iterationen geschafft. Das ist eine Konstante bei diesen beiden KI-Systemen: Sie verstehen die Python-Skripte, die man ihnen gibt, sehr gut und können Verbesserungen daran vornehmen. Für mich ist das die beste Art, mit ihnen zu arbeiten.