Hallo zusammen,
auf dem Usergroup Treffen in Holzminden gibt es einen Workshop über Text Mining. Es ist nicht notwendig, dafür über die entsprechenden Dateien zu verfügen. Wer aber den Workshop aktiv verfolgen möchte oder nachträglich vergleichbare Informationen nutzen, kann die Daten hier herunterladen. Im Wesentlichen werde ich das berühmte Beispiel von John Sall über die Montgomery Police Traffic Violations benutzen. Ich stelle eine größere Datei von etwa 300 MB zur Verfügung sowie eine kleinere von etwa 40 MB. Welche man nimmt ist letztlich egal.
Bestandteil des Textmining ist ein Editor für die Entwicklung regulärer Ausdrücke. Ich werde das von Grund auf erklären, wer Material zum Nachlesen wünscht, findet es in den beiden PDF Dokumenten.
Hier sind die Links zu den Dokumenten:
Ich freue mich auf den Workshop,
herzliche Grüße
Bernd Heinen