readme.md mit Einzelheiten erstellt
This commit is contained in:
parent
0f2a837e4b
commit
ced4e73968
16
readme.md
Normal file
16
readme.md
Normal file
@ -0,0 +1,16 @@
|
||||
# Kennedy-Files - Verarbeitung ins Textformat
|
||||
|
||||
## Einleitung
|
||||
Im März 2025 wurden die bis dahin geheimgehaltenen Dateien zum JFK-Attentat veröffentlicht.
|
||||
Es handelt sich um mehr als 4000 PDF-Dokumente, die von Originaldokumenten erstellt wurden.
|
||||
Viele PDF-Dokumente haben mehr als eine Seite.
|
||||
|
||||
Die vorliegenen Skripte und Listen dienen dazu, die PDF-Dokumente herunterzuladen und mit Open Source Mitteln in Textdateien umzuwandeln.
|
||||
Die Konvertierung erleichtert die Suche nach Schlüsselwörtern.
|
||||
|
||||
## Verarbeitung
|
||||
Um die Umwandlung in Textdateien zu ermöglichen, müssen vorab einige Abhängigkeiten installiert werden:
|
||||
|
||||
bash````
|
||||
pip install pytesseract pdf2image pillow
|
||||
````
|
Loading…
Reference in New Issue
Block a user