From 1a8cf48b64f3791fac92752dcb29134b3746a930 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Dirk=20K=C3=BCver-Christen?= Date: Sat, 22 Mar 2025 22:24:41 +0100 Subject: [PATCH] =?UTF-8?q?Hinweis=20zur=20Rechnerausstattung=20hinzugef?= =?UTF-8?q?=C3=BCgt?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- readme.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/readme.md b/readme.md index f0f4a88..724aa65 100644 --- a/readme.md +++ b/readme.md @@ -26,10 +26,11 @@ Das Skript erstellt einen neuen Order im Repository-Ordner namens "./kennedy_fil Sollte der Ordner noch nicht vorhanden sein, wird er erstellt. Sobald alle Dateien heruntergeladen wurden, können mit dem Python-Skript die PDF-Dateien in reinen Text umgewandelt werden. -In der Datei `max_extract.py` müssen lediglich die Quell- und Zielordner angegeben werden. Der Quellordner entspricht dem -Ordner, in dem die PDF-Dateien liegen. Der Zielorder beschreibt, wo die umgewandelten Textdateien abgelegt werden sollen. +In der Datei `max_extract.py` müssen lediglich die Quell- und Zielordner angegeben werden. Der Quellordner entspricht dem Ordner, in dem die PDF-Dateien liegen. Der Zielorder beschreibt, wo die umgewandelten Textdateien abgelegt werden sollen. Der Aufruf geschieht über: ```bash python3 max_extract.py ``` + +Die Umwandlung hängt von der Ausstattung des Rechners ab. Wichtig hierbei ist, dass genügend RAM zur Verfügung steht (16GB RAM reicht hier nicht aus, besser wären 32 oder 64GB). Bei einer 8Core Xeon CPU dauert die Umwandlung rund einen Tag (24 Stunden), hängt aber hier auch vom CPU Typ und der Generation ab.