MOC 20775 Performing Data Engineering on Microsoft HD Insight

Seminarinformationen

Seminar - Ziel

In diesem Kurs lernen die Teilnehmer die Fähigkeit, um Big Data Workflows mithilfe HDInsight zu planen und zu implementieren.

Der Kurs kann zur Vorbereitung auf die Zertifizierung als Microsoft Certified Solutions Expert (MCSE): MCSE: Data Management and Analytics dienen.

Teilnehmer - Zielgruppe

  • Data Professionals

Kurs - Voraussetzungen

  • Erfahrung mit der Programmierung mit R und mit gängigen R-Paketen
  • Grundkenntnise über grundlegende statistischen Methoden und Best Practices der Datenanalyse
  • Erfahrung mit dem Microsoft Windows Betriebssystem
  • Praktische Erfahrung mit relationalen Datenbanken

Seminardauer

  • 5 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

HDInsight

  • Big Data
  • Hadoop
  • MapReduce
  • Einführung in HDInsight

HDInsight Cluster Bereitstellung

  • Clustertypen
  • Cluster mit Azure und Azure PowerShell verwalten

Nutzerauthorisierung für Access Ressources

  • Non-Domain Joined Clusters
  • Domain-Joined Clusters konfigurieren und verwalten

Daten laden

  • Speicher
  • Tools
  • Nutzen maximieren

Troubleshooting

  • Analyse von Protokollen
  • YARN Protokolle
  • Heap Dumps
  • OMS

Batch-Lösungen implementieren

  • Apache-Hive-Speicher
  • Mit Hive und Pig abfragen
  • HDInsight operationalisieren

Entwerfen von Batch-ETL-Lösungen mit Spark

  • Spark
  • ETL mit Spark
  • Performance

Datenanalyse mit Spark SQL

  • Iterative und interaktive Abfragen implementieren
  • Exploratory Data Analysis

Datenanalyse mit Hive und Phoenix

  • Interaktive Abfragen implementieren
  • Exploratory Data Analysis
  • Interaktive Verarbeitung mithilfe Apache Phoenix

Streaming Lösungen mit Kafka und HBase

  • Kafka Cluster bauen und bereitstellen
  • Veröffentlichen, konsumieren und bearbeiten
  • Daten speichern und abfragen

Lösungen für Echtzeitvereinbarung von Big Data mit Apache Storm entwickeln

  • Langzeitdaten
  • Daten streamen
  • Topologien erstellen
  • Apache Storm konfigurieren

Spark Streaming Applikationserstellung

  • Arbeiten mit Spark Streaming
  • Spark Structured Streaming Applikationen erstellen
  • Persistence und Visualization

Weitere Schulungen zu Thema MS SQL Server 2016

MOC 10987 Performance Tuning and Optimizing SQL Databases

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Ihnen werden die Fertigkeiten und Skills vermittelt, die man für die Optimierung und das Performance-Tuning ihrer Datenbanken benötigt. Das Seminar wird auf SQL Server 2016 durchgeführt.

MOC 20762 Developing SQL Databases

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In dieser Schulung erlangen Teilnehmern das Fachwissen, welches Sie zur Entwicklung einer Microsoft SQL Server 2016 Datenbank benötigen. Es wird vor allem auf den richtigen Umgang mit den Produktfeatures von SQL Server 2016, sowie auf dessen Web Tools, die zur Entwicklung der ...

MOC 20773 Analyzing Big Data with Microsoft R

- u.a. in Stuttgart, Leipzig, Düsseldorf, Essen, Freiburg

In dieser Schulung befassen sich die Teilnehmer mit der Analysie großer Datasets mithilfe des Microsoft R Server sowie dessen Verwendung im Big Data Bereich, wie Hadoop oder Spark Cluster oder einer SQL Server Datenbank.

MOC 20774 Perform Cloud Data Science with Azure Machine Learning

- u.a. in Bremen, Hamburg, Düsseldorf, Heidelberg, Darmstadt

in diesem Kurs befassen sich die Teilnehmer mit der Analyse und Präsentation von Daten mithilfe von Azure Machine Learning. Außerdem erhalten Sie eine Einführung in die Verwendung von Machine Learning mit Big-Data-Tools wie HDInsight und R Services.