Visual Analytics

a Daniel Keim et al.: Mastering the information age solving problems with visual analytics. Eurographics Association, 2010.
b Patrick Fiaux et al.: Bixplorer: Visual Analytics with Biclusters. Computer 46 (8) pp. 90-94, 2013.
c Emmanuel Müller et al.: Discovering multiple clustering solutions: Grouping objects in different views of the data. IEEE International Conference on Data Engineering (ICDE), 2012.
d Michael Hund et al.: Visual Quality Assessment of Subspace Clustering. KDD Workshop on Interactive Data Exploration and Analytics (IDEA), 2016.

Zusammenfassung:

Diese Vorlesung vermittelt, wie große, hochdimensionale, partiell unzuverlässige und unvollständige Daten analysiert werden können unter Nutzung von Datenanalysetechniken und interaktiven Visualisierungen, die eng gekoppelt sind. Dabei werden die Eigenschaften und Parameter wichtiger Datenanalysemethoden erklärt und gezeigt, wie diese Methoden in Visual Analytics-Systeme integriert werden können.

Der interdisziplinäre Charakter der Entwicklung und Nutzung von Visual Analytics-Ansätzen wird betont. Dazu zählen auch Fragen der visuellen Wahrnehmung und der kognitiven Verarbeitung visueller Daten und deren Rolle in Entscheidungsprozessen. Besonderes Augenmerk wird auf den Wissenserzeugungsprozess gelegt; also den Prozess mit dem Beobachtungen, Hypothesen, statistische Ergebnisse und andere Artefakte erzeugt und verwaltet werden. Die Anwendungsbeispiele reichen von Finanzdaten (Aktienkursen), Daten von Kreditkartenbewegungen, Genexpressionsdaten bis zu epidemiologischen Daten und Patientendaten. Zielgruppen solcher Anwendungen sind Investoren, Sicherheitsabteilungen, Biologen, Statistiker und Ärzte.


Organisatorisches

Hörerkreis: WB CV-Bachelor ab 6; WB INF-Bachelor ab 6; WB IngINF-Bachelor ab 6; WB WIF-Bachelor ab 6; WPF DKE-Master 1-3; WPF DigiEng-Master 1-3
Abschluss: Prüfung (mündlich)
ECTS-Credits: 5

Prüfungsvoraussetzungen:

Die Anmeldung zur mündlichen Prüfung ist ab sofort im ISG-Sekretariat (G29-R218) bei Frau Schumann möglich.

29.06.: Ab sofort steht eine Liste mit möglichen Fragen zur Vorbereitung auf die mündliche Prüfung zur Verfügung.

10.07.: Die mündlichen Prüfungen finden im Büro von Prof. Preim (G29-R211) statt.

Vorlesung

Ort: G29-E037
Zeit: Do., 09:00 bis 11:00 (wöchentlich) (→ siehe LSF)
1. Vorlesung: 06.04.2017

Dozent: Prof. Bernhard Preim
Büro: G29-211
Tel.: (0391) 67 5 85 12
E-Mail: preim@isg.cs.uni-magdeburg.de

Ablauf und Folien:

Übung

Die Fähigkeit, durch analytisches Denken und intelligente Kombination von Algorithmen des Machine Learnings mit Visualisierung aus großen Datenmengen für eine bestimmte Problemstellung nützliches Wissen, Handlungsempfehlungen abzuleiten oder komplexe Visual Analytics Systeme zu implementieren, erlernt man vor allem durch praktische Erfahrung.

Das Ziel der Übung ist, das Handwerkszeug zur Realisierung von datengetriebenen Lösungen zu vermitteln. Dazu werden wir ausgewählte Konzepte und Algorithmen aus der Vorlesung vertiefen und interaktiv an interessanten Anwendungsbeispielen visualisieren. So werden wir Modelle entwickeln, die beispielsweise versuchen zu erklären, warum nur die wenigsten Umfrageinstitute auf einen Sieg von Donald Trump bei den Präsidentschaftswahlen 2016 gesetzt haben, wie wir automatisch handgeschriebene Ziffern auslesen können und ob es einen Zusammenhang zwischen Bruttoinlandsprodukt und Lebenserwartung der Bevölkerung eines Landes gibt und ob sich der Zusammenhang in den letzten Jahrzehnten verändert hat.

Dabei steht im Vordergrund (i) zu verstehen, für welche Aufgabenstellungen welche Algorithmen am geeignetsten sind und (ii) wie man die datengetriebene Lösungen prototypisch implementieren kann, angefangen von Datenimport, über Datenbereinigung, Variablentransformation, Visualisierung, Modellierung bis hin zur Präsentation der Ergebnisse.

Dabei werden wir überwiegend mit der Programmiersprache R arbeiten. R eignet sich durch komplexe Machine-Learning-Packages wie caret, rpart, e1071 und arules sowie durch das Tidyverse-Prinzip zur konsistenten Datenanalyse mit Packages wie ggplot2, dplyr und tidyr hervorragend für Visual Analytics Projekte.

In den ersten beiden Übungen wird es einen kleinen Crashkurs zu R geben. Vorkenntnisse in R werden nicht zwingend vorausgesetzt, sind aber natürlich empfehlenswert.

Übung 1:
Ort: G29-426
Zeit: Mi., 13:00 bis 15:00
1. Übung: 12.04.2017

Übung 2:
Ort: G29-426
Zeit: Do., 13:00 bis 15:00
1. Übung: 13.04.2017

Übungsleiter: Uli Niemann
Büro: G29-223
Tel.: (0391) 67 52 759
E-Mail: uli.niemann@isg.cs.uni-magdeburg.de

(Voraussichtlicher) Ablauf:

# Gr.1 Gr.2 Thema Material
1 12.04. 13.04. Introduction to R & RStudio Folien
2 19.04. 20.04. Exploratory Data Analysis Folien, heights.csv
Aufgabenblatt 1
(fällig zum 26./27.04.)
R Markdown Template
Beispiellösung
3 26.04. 27.04. Clustering: Partitional and hierarchical methods & clustering validation Folien Aufgabenblatt 2
(fällig zum 03./04.05.)
R Markdown Template
4 03.05. 04.05. Density-based clustering Aufgabenblatt 3
(fällig zum 10.05.)
R Markdown Template
Beispiellösung
5 10.05. 11.05. Regression Folien Aufgabenblatt 4
(fällig zum 17.05.)
R Markdown Template
Beispiellösung
6 17.05. 18.05. Introduction to Machine Learning: Logistic Regression, Naive Bayes, KNN Folien, cleaned_heights.RDS, digits.RDS
Aufgabenblatt 5
(fällig zum 24.05.)
R Markdown Template
Beispiellösung (.Rmd)
Beispiellösung (.html)
7 24.05. 01.06. Kontrolle Aufgabenblatt 5
8 31.05. 08.06. Decision Trees & Random Forests Folien, weather_nominal.csv
Aufgabenblatt 6
(fällig zum 07.06.)
R Markdown Template
Beispiellösung (.Rmd)
9 07.06. 15.06. Association Rule Discovery Folien
Aufgabenblatt 7
(fällig zum 14.06.)
R Markdown Template
Lösung zu Aufgabe 1
10 14.06. 22.06. Dimensionality Reduction Folien
cities.csv
Aufgabenblatt 8
(fällig zum 28.06.)
R Markdown Template
11 21.06. 29.06. KEINE ÜBUNG
12 28.06. 06.07. Interactive web-based VisAnalytics with R Shiny Folien
Aufgabenblatt 9
(fällig zum 05.07.)
13 05.07. Präsentationen der Zusatzaufgaben

Zusatzaufgabe für Master-Studierende

Visual Analytics wird in diesem Semester als Brückenmodul angeboten. Das heißt, die Veranstaltung kann sowohl von Bachelor- als auch Masterstudierenden besucht werden. Bachelorstudierende können die Lehrveranstaltung mit 5 CP abschließen. Masterstudierende erhalten die Möglichkeit, das Modul mit 6 CP abzuschließen. Vorausetzung dafür ist die erfolgreiche Bearbeitung einer Zusatzaufgabe während des Semesters. Die Vorstellung der Ergebnisse als Vortrag bzw. Live-Demo findet in der letzten Vorlesungswoche des Semesters statt.

Thema 1 - Vortrag Visual Analytics for Business Intelligence
Thema 2 - Programmieraufgabe Clustering of Multi-Variate Time-Series (Diabetic Foot Syndrome)