Seminarinhalt
- Big Data - Konzeptuelle Grundlagen
- Einführung
- Klassifizierung von Methoden
- Überwachtes und unüberwachtes Lernen
- Big Data - Grundlegende Tools
- Apache Hadoop
- Hadoop distributed File System (HDFS)
- SQL/NoSQL Abfragen
- AWS Setup für Big Data
- AWS Services für Big Data
- Apache Hadoop und Amazon EMR
- Installation und Konfiguration eines Amazon EMR Clusters
- Programmierframeworks für Amazon EMR (z.B. Hive, Pig, usw.)
- Hadoop User Experience (HUE)
- AWS Datenverarbeitung
- In-Memory Datenanalyse mit Apache Spark und Amazon EMR
- AWS Datenspeicherung
- (Fast) Realtime Datenverarbeitung mit AWS Kinesis
- Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
- Kosten, IT-Sicherheit und Virtualisierung
- AWS Abrechnungsmodelle
- IT-Sicherheit und AWS Big-Data Anwendungen
- Interaktive Datenabfrage- und Analyse mit Amazon Athena
- Automatisirtes extrahieren, transformieren und laden von daten mittels AWS Glue
- Virtualisierung von Daten und Abfragen via Amazon QuickSight