Whatsapp History Export für Excel Pivot Auswertung vorbereiten (inkl. Unicode Emojis)

Voraussetzung:

  • Deutscher (macht einen Unterschied beim Datumsform) Whatsapp Export per E-Mail ohne Medien
  • 2 Personen (also kein Gruppenchat)
  • Windows & Excel (ja ja)

Benötigte Software

  • notepad++
  • excel

Ich habe als Trenner folgendes Zeichen verwendet: \ weil das in meiner Unterhaltung sicher nicht vorkam. Je nach Chat ist ggf. ein anderes sinnvoll. Soll ein anderes Zeichen verwendet werden, muss Punkt 4 entsprechend geändert werden (z. b. \3\\\4 zu \3-\4 etc.)
Ebenso müssen $NAME1 & $NAME2 entsprechend den Chatpartner angepasst werden.

1. Datei mit Notepad++ öffnen
2. Kodierung -> UTF8
3. Zeilen zusammenfügen (= alle Linebreaks entfernen): Strg + A & Str + J 

Der Rest ist nur noch regexp (Strg + H)
4. Suche den Anfang jeder Nachricht, formatiere das Datum um, trenne die Uhrzeit ab und füge davor einen Linebreak ein: Search: (\d{2}).(\d{2}).(\d{2}),\s(\d{2}):(\d{2})\s-\s($NAME1|$NAME2):\s | replace: \r\n\1.\2.\3\\\4:\5\\\6\\
5. Replace NUL-Symbol: Search: \x00 | replace: (leerzeichen)
6. Lösche die Zeilen in denen Medien enthalten waren. Diesen Schritt überspringen wenn die absolute Gesamtanzahl der Nachrichtne ermittelt werden soll. Search: (\d{2}).(\d{2}).(\d{2})\\(\d{2}):(\d{2})\\($NAME1|$NAME2)\\<Medien weggelassen> | replace: nothing 
7. Lösche die in Schritt 6 leer gemachten Zeilen sauber mit Regexp: Search: \r\n\s+\r\n | replace: \r\n
9. Lösche unbekannte (Unicode?)-Symbole: Search: 🤔 | replace: nothing
10. In meinem Chat waren noch 2 LF ohne vorangehendes CR. Diese Löschen wir: Search: (?<!\r)\n | replace: nothing
11. Speichern (oder besser eine Kopie speichern).

Der Excel-Part:
12. Neue Datei, Reiter "Daten", Links oben auf "Aus Text" und dann dem Dialog folgen. Entsprechende Datenformate beim Import auswählen. Bei Import als Trenner das Zeichen aus Punkt 4 verwenden (bei mir \); Beim Datum unter "Weitere" als Dezimaltrennzeichen ein "." statt (voreingestelltem) "," verwenden (beim Auswahl des Datenformats)`, dann wird auch die Uhrzeit korrekt importiert

Dann noch Zeilen oberhalb einfügen und mit Überschriften versehen (Datum, Uhrzeit, Name, Nachricht).

Jetzt solltet ihr eine sauber formatierte, Excel-Tabelle haben, die keine unnötigen Leerzeichen / Symbole / Linebreaks am Anfang und Ende enthält, pro Zeile eine Nachricht hat und alle Excel bekannten Unicode-Emojis enthält. Diese lässt sich perfekt für eine Pivot-Tabellen Auswertung (und natürlich Diagramme) verwenden.

Viele Spaß