Hinweis zur Rechnerausstattung hinzugefügt
This commit is contained in:
parent
b4800655bd
commit
1a8cf48b64
@ -26,10 +26,11 @@ Das Skript erstellt einen neuen Order im Repository-Ordner namens "./kennedy_fil
|
||||
Sollte der Ordner noch nicht vorhanden sein, wird er erstellt.
|
||||
|
||||
Sobald alle Dateien heruntergeladen wurden, können mit dem Python-Skript die PDF-Dateien in reinen Text umgewandelt werden.
|
||||
In der Datei `max_extract.py` müssen lediglich die Quell- und Zielordner angegeben werden. Der Quellordner entspricht dem
|
||||
Ordner, in dem die PDF-Dateien liegen. Der Zielorder beschreibt, wo die umgewandelten Textdateien abgelegt werden sollen.
|
||||
In der Datei `max_extract.py` müssen lediglich die Quell- und Zielordner angegeben werden. Der Quellordner entspricht dem Ordner, in dem die PDF-Dateien liegen. Der Zielorder beschreibt, wo die umgewandelten Textdateien abgelegt werden sollen.
|
||||
Der Aufruf geschieht über:
|
||||
|
||||
```bash
|
||||
python3 max_extract.py
|
||||
```
|
||||
|
||||
Die Umwandlung hängt von der Ausstattung des Rechners ab. Wichtig hierbei ist, dass genügend RAM zur Verfügung steht (16GB RAM reicht hier nicht aus, besser wären 32 oder 64GB). Bei einer 8Core Xeon CPU dauert die Umwandlung rund einen Tag (24 Stunden), hängt aber hier auch vom CPU Typ und der Generation ab.
|
||||
|
Loading…
Reference in New Issue
Block a user