From 93949467c2e6c458ad0bffd8580597a7fbe9e1d4 Mon Sep 17 00:00:00 2001 From: Dirk Date: Sun, 8 Jun 2025 08:17:10 +0000 Subject: [PATCH] entfernt Suffixes von Dateien aus einer Liste --- pdf4txt_reduce.sh | 22 ++++++++++++++++++++++ 1 file changed, 22 insertions(+) create mode 100755 pdf4txt_reduce.sh diff --git a/pdf4txt_reduce.sh b/pdf4txt_reduce.sh new file mode 100755 index 0000000..34da8ff --- /dev/null +++ b/pdf4txt_reduce.sh @@ -0,0 +1,22 @@ +#!/bin/bash + +# Beispiel-Datei mit Einträgen +# input_file="pdfs.csv" +# output_file="pdfs_reduced.csv" + +input_file="texts.csv" +output_file="texts_reduced.csv" + +# Falls die Datei nicht existiert, Skript beenden +if [[ ! -f "$input_file" ]]; then + echo "Datei '$input_file' nicht gefunden." + exit 1 +fi + +# Verarbeite jede Zeile und entferne nur .pdf/.PDF am Ende +while IFS= read -r line; do + # Entferne .pdf (case-insensitive) am Ende der Zeile + echo "$line" | sed -E 's/\.txt$//I' +done < "$input_file" > "$output_file" + +echo "Verarbeitung abgeschlossen. Ergebnis: $output_file"