From ced4e739688d0cac7e64662e411ceada2e5139b3 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Dirk=20K=C3=BCver-Christen?= <dirk.kuever@googlemail.com> Date: Fri, 21 Mar 2025 22:04:55 +0100 Subject: [PATCH] readme.md mit Einzelheiten erstellt --- readme.md | 16 ++++++++++++++++ 1 file changed, 16 insertions(+) create mode 100644 readme.md diff --git a/readme.md b/readme.md new file mode 100644 index 0000000..aae1487 --- /dev/null +++ b/readme.md @@ -0,0 +1,16 @@ +# Kennedy-Files - Verarbeitung ins Textformat + +## Einleitung +Im März 2025 wurden die bis dahin geheimgehaltenen Dateien zum JFK-Attentat veröffentlicht. +Es handelt sich um mehr als 4000 PDF-Dokumente, die von Originaldokumenten erstellt wurden. +Viele PDF-Dokumente haben mehr als eine Seite. + +Die vorliegenen Skripte und Listen dienen dazu, die PDF-Dokumente herunterzuladen und mit Open Source Mitteln in Textdateien umzuwandeln. +Die Konvertierung erleichtert die Suche nach Schlüsselwörtern. + +## Verarbeitung +Um die Umwandlung in Textdateien zu ermöglichen, müssen vorab einige Abhängigkeiten installiert werden: + +bash```` +pip install pytesseract pdf2image pillow +````