Veit Schiele Communications

Veit Schiele Communications
StartseiteDienstleistungenSchulungenSeminarkalenderSeminar »Datenanalyse mit Python« vom 18. bis 19. September 2017

Seminar »Datenanalyse mit Python« vom 18. bis 19. September 2017

Nach diesem Kurs können Sie tabellarische Daten mit Python automatisiert aufbereiten, zusammenfassen und Diagramme erstellen.
erstellt von Veit Schielezuletzt verändert: 13.07.2017 14:15
Wann 18.09.2017 um 09:00 bis
19.09.2017 um 17:00
Wo Veit Schiele Communications GmbH, Mansteinstr. 7, D-10783 Berlin
Name
Kontakttelefon +49 30 8185667-1
Termin übernehmenvCal
iCal
../../../images/bar-chart.png/image_mini../../../images/madonna.png/image_mini../../../images/diff.png/image_mini../../../images/scatter-chart.png/image_mini

Zielgruppe

Analysten, Wissenschaftler und Ingenieure, die größere Datenmengen effizienter handhaben möchten.

Voraussetzungen

Grundkenntnisse in Python

Kursbeschreibung

Die Python-Bibliothek pandas bietet ein praktisches Alltagswerkzeug zur Analyse tabellarischer Daten. Dieser Kurs verbessert Ihren Werkzeugsatz für die Arbeit mit Datensätzen von wenigen hundert bis einigen Millionen Einträgen in Python. Der Kurs behandelt an praktischen Beispielen sowohl die erkundende Datenanalyse, das Ermitteln von Kennzahlen und das Erstellen anschaulicher Grafiken. Durch die Integration mit interaktiven Analyseumgebungen wie IPython und Jupyter lassen sich viele Fragestellungen schnell umsetzen.

Kursdauer

2 Tage

Agenda

Tag 1Tag 2
Einführung in pandasAggregatfunktionen
DatenaufbereitungAnalyse von Zeitreihen
Daten zusammenfassengeographische Daten
Datenvisualisierungpandas in der Praxis

Tag 1

Einführung in pandas

  • Die Arbeitsumgebung zur interaktiven Datenanalyse
  • Kurzübersicht zu pandas
  • Series
  • DataFrame
  • Neuerungen in Python 3
  • Jupyter Notebooks

Datenaufbereitung

  • CSV- und Excel-Dateien in pandas einlesen
  • Daten sortieren
  • Daten filtern
  • Tabellen transponieren
  • Auswahl von Zeilen und Spalten
  • pandas-Tabellen speichern

Daten zusammenfassen

  • statistische Kenngrößen ermitteln
  • Tabellen zusammenführen
  • hierarchische Indizierung
  • Kreuztabellen
  • Pivot-Tabellen

Datenvisualisierung

  • Diagramme mit matplotlib erstellen
  • matplotlib aus pandas verwenden
  • Daten in Jupyter notebooks visualisieren
  • Heatmaps
  • Multi-Panel-Diagramme
  • qualitativ hochwertige Diagramme generieren
  • andere Bibliotheken zur Datenvisualisierung

Tag 2

Aggregatfunktionen

  • Iteration über Zeilen und Spalten
  • Gruppieren
  • Aggregieren
  • Transformieren
  • Anwenden eigener Funktionen

Analyse von Zeitreihen

  • Serien von Datumsstempeln
  • Umskalieren von Zeitreihen
  • Anpassen von Zeitzonen
  • Umgang mit lückenhaften Daten
  • rollender Durchschnitt
  • einfache Prognosen

Umgang mit geographischen Daten

  • Speichern von Koordinaten in pandas
  • Zeichnen von Karten mit Basemap

Pandas in der Praxis

  • Mythen und Fakten
  • Numpy
  • Modellbildung in scikit-learn
  • alternative Programmpakete und Strategien zur Datenmodellierung
  • Umgang mit großen Datenmengen
  • Best Practices