Data Literacy
Grundlagen der Datenkompetenz

Im digitalen Zeitalter braucht es Datenexpertinnen und Datenexperten. Die Fähigkeit, Daten richtig zu verarbeiten und zu interpretieren, ist in der digitalen Wissensgesellschaft unabdingbar geworden. Daten aller Art "lesen" zu können, gewinnt auch in Unternehmen immer mehr an Bedeutung. Das Hochschulzertifikat "Data Literacy" vermittelt Ihnen Datenkompetenz auf akademischem Niveau.
Inhalte
Einführung in Python für Data Science
- Einführung in die Programmiersprache Python
- Einführung in relevante Data-Science-Bibliotheken wie NumPy, Pandas, Matplotlib und SciPy
- Einführung in IPython, Jupyter Notebook und JupyterLab
Datenmanipulation und -visualisierung
- Import verschiedener Dateiformate mit Python Bibliotheken
- Datenbereinigung und Preprocessing
- Datenrepräsentation und -visualisierung
Feature Engineering
- Implementierung fehlender Daten
- Explorative Datenanalyse
- Feature Scaling und Normalization
- Feature Selection
Applied Machine Learning in Python
- Kategorien von Machine Learning
- Einführung in Scikit-Learn
- Regression und Prediction
- Lineare Regression
- Gradientenverfahren (Batch-, Stochastik- und Mini-Batch-Gradientenverfahren)
- Polynomiale Regression
- "The Curse of Dimensionality"
- Regularisierung linearer Modelle
- Logistische Regression
- Klassifizierung
- K-Nearest Neighbors
- Support Vector Machines
- Modellvalidierung
- Naïve Bayes
- Decision Trees und Random Forests
- Dimensionsreduktion
- Projection und Manifold Learning
- Principal Component Analysis (PCA)
- Clustering
- K-means
- Hierarchische Clusteranalyse
Zielgruppe
Der Zertifikatskurs richtet sich an alle Personen, die im Bereich Datenverarbeitung Kompetenzen auf akademischem Niveau erwerben und in ihrem Unternehmen einbringen wollen. Das Modul wendet sich dabei explizit an Absolvent*innen aller Disziplinen. Von den vermittelten Data Literacy-Kompetenzen profitieren Personen aller Studienfächer und Sektoren.
Die Ausbildung findet in Kleingruppen mit maximal acht Teilnehmenden statt. Dies ermöglicht eine persönliche Betreuung durch die Dozierenden und fördert den Lernprozess.
Nutzen für die Teilnehmenden
- Sie gewinnen ein praktisches Verständnis dafür, wie Daten bearbeitet, manipuliert und statistisch analysiert werden.
- Sie lernen verschiedene Regressionsverfahren, Klassifikations- und Clustering-Methoden kennen und wenden geeignete Algorithmen zur Problemlösung an.
- Sie entwickeln ein Grundverständnis für den Lebenszyklus des maschinellen Lernens – von der Datenverarbeitung bis zum Export eines trainierten Modells.
- Sie lernen, wie man Methoden zur Reduktion der Merkmalsraumdimension wie "Principal Component Analysis" einsetzt.
- Sie lernen das Problem des "Curse of Dimensionality" kennen und erfahren, wie das Risiko, ein "overfitted" oder "biased" Modell zu trainieren, vermieden werden kann.
- Sie profitieren von einem hohen Praxisbezug, indem Sie anhand eigener Daten die geeignete Datenverarbeitung, das Feature-Engineering und das Modelltraining auswählen und implementieren.
Zulassungsvoraussetzungen
Abgeschlossenes Bachelorstudium sowie Grundkenntnisse in einer Programmiersprache und Mathematik
Abschluss
Die Prüfungsleistung besteht aus einer Projektarbeit, in der das theoretisch erworbene Wissen praktisch angewendet wird.
Bei Absolvierung aller Präsenztage und dem erfolgreichen Ablegen der Prüfungsleistung erhalten die Teilnehmenden das Hochschulzertifikat "Data Literacy". Das Zertifikat wird mit zehn Credit Points (ECTS) bewertet, die bei einer späteren Hochschulausbildung ggf. angerechnet werden können.
Kurssprache
Der Kurs findet überwiegend in englischer Sprache statt. Fragen und Diskussionen sind jederzeit auf Deutsch möglich.
Kursleitung
Prof. Dr. Roland Mandl, wissenschaftliche Leitung
OTH Regensburg, Fakultät Elektro- und Informationstechnik
Ghassan Al-Falouji, M.Eng.
Al-Falouji ist wissenschaftlicher Mitarbeiter und Promovend in der Arbeitsgruppe "Intelligent Systems" der Christian-Albrechts-Universität zu Kiel. Zuvor war er als wissenschaftlicher Mitarbeiter an verschiedenen Hochschulen tätig, darunter an der OTH Regensburg und an der Universität Passau. Al-Falouji verfügt über umfangreiche Erfahrung in angewandten Forschungsprojekten zum Einsatz von Machine Learning Techniken in industriellen Anwendungen. Besondere Expertise besitzt er in den Bereichen Temporal Data Analysis, Causal Learning, Autonomous Learning und Multi-Agent Learning.
Termine
Block 1: 14. - 17. September 2022
Block 2: 22. - 24. September 2022
jeweils von 08.15 - 17.00 Uhr
Hinweis:
Die Teilnehmenden werden darum gebeten, einen eigenen Laptop oder ein eigenes Tablet mit einem aktuellen Betriebssystem mitzubringen.
Kosten
3.500 € (inkl. Kursunterlagen und Zertifikatsgebühr)
Anmeldung
Hier können Sie sich anmelden.
Ihre Ansprechpartnerin

Bianca Sporer
Tel.: 0941 943-9832
E-Mail: bianca.sporer(at)oth-regensburg.de