diff --git a/readme.md b/readme.md new file mode 100644 index 0000000..aae1487 --- /dev/null +++ b/readme.md @@ -0,0 +1,16 @@ +# Kennedy-Files - Verarbeitung ins Textformat + +## Einleitung +Im März 2025 wurden die bis dahin geheimgehaltenen Dateien zum JFK-Attentat veröffentlicht. +Es handelt sich um mehr als 4000 PDF-Dokumente, die von Originaldokumenten erstellt wurden. +Viele PDF-Dokumente haben mehr als eine Seite. + +Die vorliegenen Skripte und Listen dienen dazu, die PDF-Dokumente herunterzuladen und mit Open Source Mitteln in Textdateien umzuwandeln. +Die Konvertierung erleichtert die Suche nach Schlüsselwörtern. + +## Verarbeitung +Um die Umwandlung in Textdateien zu ermöglichen, müssen vorab einige Abhängigkeiten installiert werden: + +bash```` +pip install pytesseract pdf2image pillow +````