Fuji X Voice Memos sind eine gute Idee - um zu Fotos ein Audio aufzuzeichnen. Ich hab mir ein Script gebastelt, mit dem ich die Audiofiles automatisch als EXIF Tag abspeichern und in LR importieren kann.

Wenn ich auf meinen Ausflügen fotografiere, dann schreibe ich später einen Post darüber in meinem Blog. Aufgezeichnet und dokumentiert wird also mit der Kamera. Mit der Fuji Audio Memo Funktion lassen sich zusätzlich zu Fotos Audios aufzeichnen - einfach im Play-Modus das Front-Command-Dial gedrückt halten, sprechen, und wieder loslassen.

Ablage der Audiofiles auf der SD Karte

Diese Audios werden ebenfalls auf der SD Karte gespeichert: unter dem selben Dateinamen wie das Foto, aber mit einer anderen Extension (.WAV). Auf meiner SD Karte sind 24 Fotos; 10 davon hat einen Audiokommentar:

% ls -l /Volumes/Untitled/DCIM/135_FUJI
  total 696832
  -rwxrwxrwx  1 huettemann  staff  15058414 19 Sep 09:07 DSCF6259.JPG
  -rwxrwxrwx  1 huettemann  staff  15022716 19 Sep 09:07 DSCF6261.JPG
  -rwxrwxrwx  1 huettemann  staff  11708330 19 Sep 09:07 DSCF6262.JPG
  -rwxrwxrwx  1 huettemann  staff  12560268 19 Sep 09:07 DSCF6263.JPG
  -rwxrwxrwx  1 huettemann  staff  14587111 19 Sep 09:07 DSCF6264.JPG
  -rwxrwxrwx  1 huettemann  staff   1441224 19 Sep 09:07 DSCF6264.WAV
  -rwxrwxrwx  1 huettemann  staff  12117044 19 Sep 09:07 DSCF6265.JPG
  -rwxrwxrwx  1 huettemann  staff    865224 19 Sep 09:07 DSCF6265.WAV
  -rwxrwxrwx  1 huettemann  staff  16164179 19 Sep 09:07 DSCF6266.JPG
  -rwxrwxrwx  1 huettemann  staff  15441868 19 Sep 09:07 DSCF6267.JPG
  -rwxrwxrwx  1 huettemann  staff    865224 19 Sep 09:07 DSCF6267.WAV
  -rwxrwxrwx  1 huettemann  staff  15317848 19 Sep 09:07 DSCF6268.JPG
  -rwxrwxrwx  1 huettemann  staff   2017224 19 Sep 09:07 DSCF6268.WAV
  -rwxrwxrwx  1 huettemann  staff  15054051 19 Sep 09:07 DSCF6269.JPG
  -rwxrwxrwx  1 huettemann  staff   1441224 19 Sep 09:07 DSCF6269.WAV
  -rwxrwxrwx  1 huettemann  staff  13911710 19 Sep 09:07 DSCF6270.JPG
  -rwxrwxrwx  1 huettemann  staff   2017224 19 Sep 09:07 DSCF6270.WAV
  -rwxrwxrwx  1 huettemann  staff  12213651 19 Sep 09:07 DSCF6271.JPG
  -rwxrwxrwx  1 huettemann  staff   1441224 19 Sep 09:07 DSCF6271.WAV
  -rwxrwxrwx  1 huettemann  staff  11573175 19 Sep 09:07 DSCF6272.JPG
  -rwxrwxrwx  1 huettemann  staff  12881324 19 Sep 09:07 DSCF6273.JPG
  -rwxrwxrwx  1 huettemann  staff  12636573 19 Sep 09:07 DSCF6274.JPG
  -rwxrwxrwx  1 huettemann  staff  12675079 19 Sep 09:07 DSCF6275.JPG
  -rwxrwxrwx  1 huettemann  staff  15431284 19 Sep 09:07 DSCF6276.JPG
  -rwxrwxrwx  1 huettemann  staff  14876233 19 Sep 09:07 DSCF6277.JPG
  -rwxrwxrwx  1 huettemann  staff  15247999 19 Sep 09:07 DSCF6278.JPG
  -rwxrwxrwx  1 huettemann  staff  14847904 19 Sep 09:07 DSCF6279.JPG
  -rwxrwxrwx  1 huettemann  staff  11237564 19 Sep 09:07 DSCF6280.JPG
  -rwxrwxrwx  1 huettemann  staff   1729224 19 Sep 09:07 DSCF6280.WAV
  -rwxrwxrwx  1 huettemann  staff  15541576 19 Sep 09:07 DSCF6281.JPG
  -rwxrwxrwx  1 huettemann  staff  14164649 19 Sep 09:07 DSCF6282.JPG
  -rwxrwxrwx  1 huettemann  staff   2593224 19 Sep 09:07 DSCF6282.WAV
  -rwxrwxrwx  1 huettemann  staff  17265756 19 Sep 09:07 DSCF6283.JPG
  -rwxrwxrwx  1 huettemann  staff   2881224 19 Sep 09:07 DSCF6283.WAV

Automatische Voice2Text Extraktion aus WAV Files

Eigentlich sind die Audio Aufzeichnungen eine gute Idee, aber sie passen nicht in meinen Workflow: Ich importiere die Fotos in Lightroom und tagge sie mit den Geodaten. Die Audios muss ich mir anhören und den Text manuell eintippen - zweckmäßigerweise als Image Description.

Genau das hab ich mit einem kleinen Python-Script automatisiert: Es durchsucht die SD Karte nach WAV Dateien, konvertiert die Sprachaufzeichnung zu Text und speichert diesen Text als EXIF Description im zugehörigen JPG oder RAF File ab.

Verwendet wird der Google Recognizer, der liefert erstaunlich gute Ergebnisse:

(env) huettemann@Detlefs-iMac wav2exif % python3 wav2text.py /Volumes/Untitled/DCIM/135_FUJI
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6268.JPG: hübsch anzusehen aber leider invasiv die kanadische Goldrute auf unserem Feld
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6283.JPG: der kleine Sportplatz, neben der holländersiedlung in Spandau Gedankenstrich starken
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6282.JPG: eine Katze auf dem Bahnweg entlang der Bahnstrecke in Staaken
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6269.JPG: die Rückseite der linden-grundschule in Staaken
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6280.JPG: Blüten im Gegenlicht im Nostalgie-Look
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6267.JPG: unsere Milli hat weder etwas gewittert
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6264.JPG: mein tägliches foto für das Jahresprojekt auf dem Feld
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6270.JPG: Tischtennisplatte bei der Linden Grundschule in Staaken
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6271.JPG: noch mehr Kanadische Goldrute auf dem Feld in Staaken
    1 image files updated
fetched /Volumes/Untitled/DCIM/135_FUJI/DSCF6265.JPG: der Herbst kommt
    1 image files updated

Importiere ich nun die Dateien in Lightroom, so wird die Audioaufzeichnung automatisch ebenfalls importiert (siehe Markierung 1). Zusätzlich ist der transcodierte Text der Aufzeichnung in der Image Description hinterlegt (Markierung 2)

Import der Dateien in Lightroom
Import der Dateien in Lightroom

Automatische Ausgabe der ImageDescription als figcaption in HugoCMS

Das ist schon mal prima. Ich hab außerdem in meiner Website die Image Einbindung so programmiert, dass Image Descriptions - sofern vorhanden - automatisch mit ausgegeben werden:

Blüten im Gegenlicht im Nostalgie-Look

Der entsprechende Abschnitt in meinem image-shortcode sieht so aus:

{{ $img := $.Page.Resources.Match (printf "*%s*" (.Get 0)) }}
{{ range $img }}

    {{ $f := .Resize "900x" }}
    {{ with $f.Exif }}
        {{ if (not  $text) }}
            {{ $text = .Tags.ImageDescription}}
        {{ end }}
    {{ end }}
    <p>
    <figure>
        <figcaption>{{ $text }}</figcaption>
        <div class="post-photo">
        ...

Mein image-shortcode ist noch um einiges länger, da ich auch andere Exif Daten auswerte - um diese per RollOver als Hinweis zum Bild mit auszugeben.

Fazit

Voicememos zu EXIF Daten zu machen, ist prinzipiell eine gute Sache. Da die Voicememos aber auch als Audio in Lightroom importiert werden, kann man gegebenenfalls dort die Originalaufnahmen anhören.

Texte zu Bildern als Bildunterschrift (Lightroom) bzw ImageDescription (EXIF) zu verwalten und auch beim Export mit auszugeben, ist sehr nützlich für mich - ich kann die Texte in Lightreoom nachträglich editieren. Lightroom wird damit zum Content Management System.

Weitere Beiträge zum Thema