HDInsight

Letzte Aktualisierung: Januar 2015

Azure HDInsight ist ein Dienst, der Apache™ Hadoop™-Cluster in der Cloud sowie ein Softwareframework bereitstellt, das für die Verwaltung, Analyse und Berichterstattung von Big Data konzipiert wurde. Es stellt das HDFS/MapReduce-Softwareframework und die zugehörigen Projekte wie Pig, Hive und Sqoop in einer vereinfachten, skalierbareren und kostengünstigeren Umgebung zur Verfügung. Das HDInsight SDK stellt außerdem die Microsoft Avro-Bibliothek für Datenserialisierung zur Verfügung.

Die wesentliche Dokumentation, die die ersten Schritte mit dem Azure HDInsight-Dienst beschreibt, ist verfügbar unter Azure HDInsight-Dokumentation.

Der HDInsight-Dienst verwendet Azure-PowerShell, um Hadoop-Aufträge zu konfigurieren, auszuführen und nachzuverarbeiten. Die Dokumentation zu den Verwaltungs-Cmdlets von Azure PowerShell, die zum Verwalten von HDInsight verwendet werden, ist unter Azure HDInsight-Cmdlets verfügbar.

Der HDInsight-Dienst hat ein .NET-SDK, das mit Erstellung, Konfiguration, Senden und Überwachung von Hadoop-Jobs in Verbindung stehende Klassen bereitstellt, die von einem Azure HDInsight-Dienst verwaltet werden. Es stellt darüber hinaus Klassen bereit, die zur Verwaltung von Azure-Abonnements mithilfe des HDInsight-Diensts und zur Konfiguration der Cluster, der Speicherkonten, der MapReduce-Programme und der Hive- und Oozie-Komponenten, die mit den durch ein Azure-Abonnement verwalteten Clusters verbunden sind, verwendet wird.

Das HDInsight .NET SDK stellt außerdem die Microsoft Avro-Bibliothek zur Verfügung, eine Implementierung des Avro-Datenserialisierungssystems, die reichhaltige, JSON-definierte Datenstrukturen sowie einen Objektcontainer zum Speichern persistenter Daten bereitstellt. Das Avro-Datenformat kann von zahlreichen Sprachen verarbeitet werden: C, C++, C#, Java, PHP, Python und Ruby werden zurzeit unterstützt. Anweisungen zum Verwenden der Microsoft Avro-Bibliothek zum Serialisieren von Objekten und anderen Datenstrukturen in Streams finden Sie unter Serialisieren von Daten mit der Microsoft Avro-Bibliothek.

Die Dokumentation für das .NET-SDK, einschließlich der Avro-Bibliothek, ist unter HDInsight SDK Reference Documentation verfügbar.

Siehe auch

Anzeigen: