Visual Analytics

a Daniel Keim et al.: Mastering the information age solving problems with visual analytics. Eurographics Association, 2010.
b Patrick Fiaux et al.: Bixplorer: Visual Analytics with Biclusters. Computer 46 (8) pp. 90-94, 2013.
c Emmanuel Müller et al.: Discovering multiple clustering solutions: Grouping objects in different views of the data. IEEE International Conference on Data Engineering (ICDE), 2012.
d Michael Hund et al.: Visual Quality Assessment of Subspace Clustering. KDD Workshop on Interactive Data Exploration and Analytics (IDEA), 2016.

Zusammenfassung:

Diese Vorlesung vermittelt, wie große, hochdimensionale, partiell unzuverlässige und unvollständige Daten analysiert werden können unter Nutzung von Datenanalysetechniken und interaktiven Visualisierungen, die eng gekoppelt sind. Dabei werden die Eigenschaften und Parameter wichtiger Datenanalysemethoden erklärt und gezeigt, wie diese Methoden in Visual Analytics-Systeme integriert werden können.

Der interdisziplinäre Charakter der Entwicklung und Nutzung von Visual Analytics-Ansätzen wird betont. Dazu zählen auch Fragen der visuellen Wahrnehmung und der kognitiven Verarbeitung visueller Daten und deren Rolle in Entscheidungsprozessen. Besonderes Augenmerk wird auf den Wissenserzeugungsprozess gelegt; also den Prozess mit dem Beobachtungen, Hypothesen, statistische Ergebnisse und andere Artefakte erzeugt und verwaltet werden. Die Anwendungsbeispiele reichen von Finanzdaten (Aktienkursen), Daten von Kreditkartenbewegungen, Genexpressionsdaten bis zu epidemiologischen Daten und Patientendaten. Zielgruppen solcher Anwendungen sind Investoren, Sicherheitsabteilungen, Biologen, Statistiker und Ärzte.


Organisatorisches

Hörerkreis: WB CV-Bachelor ab 6; WB INF-Bachelor ab 6; WB IngIF-Bachelor ab 6; WB WIF-Bachelor ab 6; WPF CV-Master 1-3; WPF INF-Master 1-3; WPF IngIF-Master 1-3; WPF WIF-Master 1-3; WPF DKE-Master 1-3; WPF DigiEng-Master 1-3
Abschluss: Prüfung (mündlich)
ECTS-Credits: 5-6

Prüfungsvoraussetzungen: werden zum Beginn der Veranstaltung bekannt gegeben

  • Erfolgreiche Bearbeitung von 3 Miniprojekten (mind. 6 von 9 Pkt. und mind. 1 Pkt. bei Projekt 3)
  • Anwesenheit*** zu den Projektbesprechungsterminen (09.05., 13.06., 04.07.)
  • Mind. 1 Präsentation in der Übung
  • Rechtzeitige Prüfungsanmeldung (ca. vier Wochen vorher!)

*** Einmalig im Semester ist die Abwesenheit während eines Pflichttermins unter folgenden Bedingungen möglich: (1) Die Abwesenheit wird dem Übungsleiter im Voraus per E-Mail angekündigt. (2) Das Ergebnis des Projekts wird dem Übungsleiter spätestens 1 Tag vor der dafür vorgesehenen Übung vorgestellt. Dazu muss ein individueller Termin per E-Mail vereinbart werden.

Aktuelles:
05.07.: Die mündlichen Prüfungen finden im Büro von Prof. Preim (G29-R211) statt.
31.05.: Die Anmeldung zur mündlichen Prüfung ist ab sofort im ISG-Sekretariat (G29-R218) bei Frau Schumann möglich. An folgenden Tagen werden Prüfungstermine angeboten: 09.07., 10.07., 07.08., 08.08., 24.09., 25.09.
20.04.: Ergänzender Hinweis bei Abwesenheit zu Pflicht-Übungstermin. Siehe Prüfungsvoraussetzungen.
13.04.: Die Beschreibungen der Extra-Aufgaben für die Masterstudierenden, die 6CP benötigen, sind online (siehe unten). Die Einschreibung zu den Aufaben findet zum Ende der Übung am 18.04. statt.

Vorlesung

Ort: G29-E037
Zeit: Do., 09:00 bis 11:00 (wöchentlich) (→ siehe LSF)
1. Vorlesung: 05.04.2018

Dozent: Prof. Bernhard Preim
Büro: G29-211
Tel.: (0391) 67 5 85 12
E-Mail: preim@isg.cs.uni-magdeburg.de

Ablauf und Folien:

Übung

Die Fähigkeit, durch analytisches Denken und intelligente Kombination von Algorithmen des Machine Learnings mit Visualisierung aus großen Datenmengen für eine bestimmte Problemstellung nützliches Wissen, Handlungsempfehlungen abzuleiten oder komplexe Visual Analytics Systeme zu implementieren, erlernt man vor allem durch praktische Erfahrung.

Das Ziel der Übung ist, das Handwerkszeug zur Realisierung von datengetriebenen Lösungen zu vermitteln. Dazu werden wir ausgewählte Konzepte und Algorithmen aus der Vorlesung vertiefen und interaktiv an interessanten Anwendungsbeispielen visualisieren. So werden wir Modelle entwickeln, die beispielsweise versuchen zu erklären, warum nur die wenigsten Umfrageinstitute auf einen Sieg von Donald Trump bei den Präsidentschaftswahlen 2016 gesetzt haben, wie wir automatisch handgeschriebene Ziffern auslesen können und ob es einen Zusammenhang zwischen Bruttoinlandsprodukt und Lebenserwartung der Bevölkerung eines Landes gibt und ob sich der Zusammenhang in den letzten Jahrzehnten verändert hat.

Dabei steht im Vordergrund (i) zu verstehen, für welche Aufgabenstellungen welche Algorithmen am geeignetsten sind und (ii) wie man die datengetriebene Lösungen prototypisch implementieren kann, angefangen von Datenimport, über Datenbereinigung, Variablentransformation, Visualisierung, Modellierung bis hin zur Präsentation der Ergebnisse.

Dabei werden wir überwiegend mit der Programmiersprache R arbeiten. R eignet sich durch komplexe Machine-Learning-Packages wie caret, rpart, e1071 und arules sowie durch das Tidyverse-Prinzip zur konsistenten Datenanalyse mit Packages wie ggplot2, dplyr und tidyr hervorragend für Visual Analytics Projekte.

In den ersten beiden Übungen wird es einen kleinen Crashkurs zu R geben. Vorkenntnisse in R werden nicht zwingend vorausgesetzt, sind aber natürlich empfehlenswert.

Übung 1:
Ort: G29-426
Zeit: Mi., 13:00 bis 15:00
1. Übung: 11.04.2018

Übungsleiter: Uli Niemann
Büro: G29-310
Tel.: (0391) 67 54 905
E-Mail: uli.niemann@ovgu.de

(Voraussichtlicher) Ablauf:

Zusatzaufgabe für Master-Studierende

Visual Analytics wird in diesem Semester als Brückenmodul angeboten. Das heißt, die Veranstaltung kann sowohl von Bachelor- als auch Masterstudierenden besucht werden. Bachelorstudierende können die Lehrveranstaltung mit 5 CP abschließen. Masterstudierende erhalten die Möglichkeit, das Modul mit 6 CP abzuschließen. Vorausetzung dafür ist die erfolgreiche Bearbeitung einer Zusatzaufgabe während des Semesters.

Es stehen Themen für 2 Programmierprojekte und 8 Präsentationen zur Auswahl. Ein Programmierprojekt kann von mehr als einer Gruppe bearbeitet werden. Ein Präsentationsthema wird einmal vergeben. Die Präsentationen finden im Rahmen der Übung statt, siehe Ablaufplan.

Die Vergabe der Themen findet zum Ende der Übung am 18.04.2018 statt. Die spätestmöglichste Einschreibung für ein Thema ist am 03.05.2018. Der Abgabetermin für die Programmierprojekte ist 29.06.2018.