Seminar »Datenanalyse mit Python« vom 15. bis 16. Mai 2017
Nach diesem Kurs können Sie tabellarische Daten mit Python automatisiert aufbereiten, zusammenfassen und Diagramme erstellen.
Wann | 15.05.2017 um 09:00 bis 16.05.2017 um 17:00 |
---|---|
Wo | Veit Schiele Communications GmbH, Mansteinstr. 7, D-10783 Berlin |
Name | Veit Schiele |
Kontakttelefon | +49 30 8185667-1 |
Termin übernehmen | ![]() ![]() |




Zielgruppe
Analysten, Wissenschaftler und Ingenieure, die größere Datenmengen effizienter handhaben möchten.
Voraussetzungen
Grundkenntnisse in Python
Kursbeschreibung
Die Python-Bibliothek pandas bietet ein praktisches Alltagswerkzeug zur Analyse tabellarischer Daten. Dieser Kurs verbessert Ihren Werkzeugsatz für die Arbeit mit Datensätzen von wenigen hundert bis einigen Millionen Einträgen in Python. Der Kurs behandelt an praktischen Beispielen sowohl die erkundende Datenanalyse, das Ermitteln von Kennzahlen und das Erstellen anschaulicher Grafiken. Durch die Integration mit interaktiven Analyseumgebungen wie IPython und Jupyter lassen sich viele Fragestellungen schnell umsetzen.
Kursdauer
2 Tage
Agenda
Tag 1 | Tag 2 |
---|---|
Einführung in pandas | Aggregatfunktionen |
Datenaufbereitung | Analyse von Zeitreihen |
Daten zusammenfassen | geographische Daten |
Datenvisualisierung | pandas in der Praxis |
Tag 1
Einführung in pandas
- Die Arbeitsumgebung zur interaktiven Datenanalyse
- Kurzübersicht zu pandas
- Series
- DataFrame
- Neuerungen in Python 3
- Jupyter Notebooks
Datenaufbereitung
- CSV- und Excel-Dateien in pandas einlesen
- Daten sortieren
- Daten filtern
- Tabellen transponieren
- Auswahl von Zeilen und Spalten
- pandas-Tabellen speichern
Daten zusammenfassen
- statistische Kenngrößen ermitteln
- Tabellen zusammenführen
- hierarchische Indizierung
- Kreuztabellen
- Pivot-Tabellen
Datenvisualisierung
- Diagramme mit matplotlib erstellen
- matplotlib aus pandas verwenden
- Daten in Jupyter notebooks visualisieren
- Heatmaps
- Multi-Panel-Diagramme
- qualitativ hochwertige Diagramme generieren
- andere Bibliotheken zur Datenvisualisierung
Tag 2
Aggregatfunktionen
- Iteration über Zeilen und Spalten
- Gruppieren
- Aggregieren
- Transformieren
- Anwenden eigener Funktionen
Analyse von Zeitreihen
- Serien von Datumsstempeln
- Umskalieren von Zeitreihen
- Anpassen von Zeitzonen
- Umgang mit lückenhaften Daten
- rollender Durchschnitt
- einfache Prognosen
Umgang mit geographischen Daten
- Speichern von Koordinaten in pandas
- Zeichnen von Karten mit Basemap
Pandas in der Praxis
- Mythen und Fakten
- Numpy
- Modellbildung in scikit-learn
- alternative Programmpakete und Strategien zur Datenmodellierung
- Umgang mit großen Datenmengen
- Best Practices