Hinweis zur Rechnerausstattung hinzugefügt

This commit is contained in:
Dirk Küver-Christen 2025-03-22 22:24:41 +01:00
parent b4800655bd
commit 1a8cf48b64

View File

@ -26,10 +26,11 @@ Das Skript erstellt einen neuen Order im Repository-Ordner namens "./kennedy_fil
Sollte der Ordner noch nicht vorhanden sein, wird er erstellt. Sollte der Ordner noch nicht vorhanden sein, wird er erstellt.
Sobald alle Dateien heruntergeladen wurden, können mit dem Python-Skript die PDF-Dateien in reinen Text umgewandelt werden. Sobald alle Dateien heruntergeladen wurden, können mit dem Python-Skript die PDF-Dateien in reinen Text umgewandelt werden.
In der Datei `max_extract.py` müssen lediglich die Quell- und Zielordner angegeben werden. Der Quellordner entspricht dem In der Datei `max_extract.py` müssen lediglich die Quell- und Zielordner angegeben werden. Der Quellordner entspricht dem Ordner, in dem die PDF-Dateien liegen. Der Zielorder beschreibt, wo die umgewandelten Textdateien abgelegt werden sollen.
Ordner, in dem die PDF-Dateien liegen. Der Zielorder beschreibt, wo die umgewandelten Textdateien abgelegt werden sollen.
Der Aufruf geschieht über: Der Aufruf geschieht über:
```bash ```bash
python3 max_extract.py python3 max_extract.py
``` ```
Die Umwandlung hängt von der Ausstattung des Rechners ab. Wichtig hierbei ist, dass genügend RAM zur Verfügung steht (16GB RAM reicht hier nicht aus, besser wären 32 oder 64GB). Bei einer 8Core Xeon CPU dauert die Umwandlung rund einen Tag (24 Stunden), hängt aber hier auch vom CPU Typ und der Generation ab.