readme.md mit Einzelheiten erstellt
This commit is contained in:
parent
0f2a837e4b
commit
ced4e73968
16
readme.md
Normal file
16
readme.md
Normal file
@ -0,0 +1,16 @@
|
|||||||
|
# Kennedy-Files - Verarbeitung ins Textformat
|
||||||
|
|
||||||
|
## Einleitung
|
||||||
|
Im März 2025 wurden die bis dahin geheimgehaltenen Dateien zum JFK-Attentat veröffentlicht.
|
||||||
|
Es handelt sich um mehr als 4000 PDF-Dokumente, die von Originaldokumenten erstellt wurden.
|
||||||
|
Viele PDF-Dokumente haben mehr als eine Seite.
|
||||||
|
|
||||||
|
Die vorliegenen Skripte und Listen dienen dazu, die PDF-Dokumente herunterzuladen und mit Open Source Mitteln in Textdateien umzuwandeln.
|
||||||
|
Die Konvertierung erleichtert die Suche nach Schlüsselwörtern.
|
||||||
|
|
||||||
|
## Verarbeitung
|
||||||
|
Um die Umwandlung in Textdateien zu ermöglichen, müssen vorab einige Abhängigkeiten installiert werden:
|
||||||
|
|
||||||
|
bash````
|
||||||
|
pip install pytesseract pdf2image pillow
|
||||||
|
````
|
Loading…
Reference in New Issue
Block a user