DQS-Bereinigungstransformation

Gilt für:SQL Server SSIS Integration Runtime in Azure Data Factory

Die DQS-Bereinigungstransformation korrigiert Daten aus einer verbundenen Datenquelle mithilfe von Data Quality Services (DQS), indem sie genehmigte Regeln anwendet, die für die verbundene Datenquelle oder eine ähnliche Datenquelle erstellt wurden. Weitere Informationen zu Datenkorrekturregeln finden Sie unter DQS Knowledge Bases and Domains. Weitere Informationen zu DQS finden Sie unter Data Quality Services Concepts.

Die DQS-Bereinigungstransformation bestimmt, ob die Daten korrigiert werden müssen, indem sie die Daten in einer Eingabespalte verarbeitet. Dabei gelten folgende Bedingungen:

  • Die Spalte ist für die Datenkorrektur ausgewählt.

  • Der Datentyp der Spalte wird in der Datenkorrektur unterstützt.

  • Der Spalte ist eine Domäne mit einem kompatiblen Datentyp zugeordnet.

Die Transformation umfasst auch eine Fehlerausgabe, die Sie zur Behandlung von Fehlern auf Zeilenebene konfigurieren können. Die Fehlerausgabe wird mit dem Transformations-Editor für die DQS-Bereinigungkonfiguriert.

Sie können die Fuzzy Grouping Transformation in den Datenfluss einschließen, um Zeilen mit Daten zu ermitteln, bei denen es sich wahrscheinlich um Duplikate handelt.

Data Quality-Projekte und -Werte

Wenn Sie Daten mit der DQS-Bereinigungstransformation verarbeiten, wird ein Bereinigungsprojekt auf dem Data Quality-Server erstellt. Das Projekt wird mit dem Data Quality Client verwaltet. Mit dem Data Quality Client können Sie außerdem die Projektwerte in eine DQS-Wissensdatenbankdomäne importieren. Sie können die Werte nur in eine Domäne (oder verknüpfte Domäne) importieren, für deren Verwendung die DQS-Bereinigungstransformation konfiguriert wurde.

Transformations-Editor für die DQS-Bereinigung (Dialogfeld)

Im Dialogfeld Transformations-Editor für die DQS-Bereinigung können Sie Daten mithilfe von Data Quality Services (DQS) korrigieren. Weitere Informationen finden Sie unter Data Quality Services Concepts.

Was möchten Sie tun?

Öffnen des Transformations-Editors für die DQS-Bereinigung

  1. Fügen Sie die DQS-Bereinigungstransformation dem Integration Services-Paket in SQL Server Data Tools (SSDT) hinzu.

  2. Klicken Sie mit der rechten Maustaste auf die Komponente, und klicken Sie anschließend auf Bearbeiten.

Festlegen der Optionen auf der Registerkarte "Verbindungs-Manager"

Data Quality Services-Verbindungs-Manager
Wählen Sie in der Liste einen vorhandenen DQS-Verbindungs-Manager aus, oder erstellen Sie eine neue Verbindung, indem Sie auf Neuklicken.

Neu
Erstellen Sie mithilfe des Dialogfelds Verbindungs-Manager für DQS-Bereinigung einen neuen Verbindungs-Manager. Siehe Festlegen der Optionen im Dialogfeld „Verbindungs-Manager für DQS-Bereinigung“

Data Quality-Wissensdatenbank
Wählen Sie eine vorhandene DQS-Wissensdatenbank für die verbundene Datenquelle aus. Weitere Informationen zur DQS-Wissensdatenbank finden Sie unter DQS Knowledge Bases and Domains.

Verbindung verschlüsseln
Gibt an, ob die Verbindung verschlüsselt werden soll, um die Datenübertragung zwischen dem DQS-Server und Integration Services zu verschlüsseln.

Verfügbare Domänen
Listet die verfügbaren Domänen für die ausgewählte Wissensdatenbank auf. Es gibt zwei Typen von Domänen: einzelne Domänen und Verbunddomänen, die aus mindestens zwei einzelnen Domänen bestehen.

Weitere Informationen zum Zuordnen von Spalten zu Verbunddomänen finden Sie unter Map Columns to Composite Domains.

Weitere Informationen zu Domänen finden Sie unter DQS Knowledge Bases and Domains.

Konfigurieren der Fehlerausgabe
Gibt an, wie Fehler auf Zeilenebene verarbeitet werden. Wenn durch die Transformation Daten aus der verbundenen Datenquelle korrigiert werden, können aufgrund unerwarteter Datenwerte oder Überprüfungseinschränkungen Fehler auftreten.

Folgende Werte sind gültig:

  • Fehler bei Komponentegibt an, dass die Transformation fehlgeschlagen ist und dass die Eingabedaten nicht in die Data Quality Services-Datenbank eingefügt werden. Dies ist der Standardwert.

  • Zeile umleitengibt an, dass die Eingabedaten nicht in die Data Quality Services-Datenbank eingefügt und an die Fehlerausgabe umgeleitet werden.

Festlegen der Optionen auf der Registerkarte "Zuordnung"

Weitere Informationen zum Zuordnen von Spalten zu Verbunddomänen finden Sie unter Map Columns to Composite Domains.

Verfügbare Eingabespalten
Listet die Spalten aus der verbundenen Datenquelle auf. Wählen Sie Spalten aus, die zu korrigierende Daten enthalten.

Eingabespalte
Zeigt eine im Bereich Verfügbare Eingabespalten ausgewählte Eingabespalte an.

Domäne
Wählen Sie eine Domäne aus, die der Eingabespalte zugeordnet werden soll.

Alias – Quelle
Zeigt die Quellspalte an, die den ursprünglichen Spaltenwert enthält.

Klicken Sie in das Feld, um den Spaltennamen zu ändern.

Ausgabealias
Zeigt die Spalte an, die vom Transformations-Editor für die DQS-Bereinigungausgegeben wird. Die Spalte enthält den ursprünglichen Spaltenwert oder den korrigierten Wert.

Klicken Sie in das Feld, um den Spaltennamen zu ändern.

Alias – Status
Zeigt die Spalte an, die Statusinformationen für die korrigierten Daten enthält. Klicken Sie in das Feld, um den Spaltennamen zu ändern.

Festlegen der Optionen auf der Registerkarte "Erweitert"

Ausgabe standardisieren
Gibt an, ob die Daten im standardisierten Format auf Grundlage des für Domänen definierten Ausgabeformats ausgegeben werden. Weitere Informationen zum standardisierten Format finden Sie unter Datenbereinigung.

Confidence
Gibt an, ob der Vertrauensgrad für korrigierte Daten eingeschlossen wird. Der Vertrauensgrad gibt die DQS-Sicherheitsstufe der Korrektur oder des Vorschlags an. Weitere Informationen zu Vertrauensgraden finden Sie unter Datenbereinigung.

`Reason`
Gibt an, ob der Grund für die Datenkorrektur eingeschlossen wird.

Angefügte Daten
Gibt an, ob weitere, von einem vorhandenen Verweisdatenanbieter empfangene Daten ausgegeben werden. Weitere Informationen finden Sie unter Reference Data Services in DQS.

Angefügtes Datenschema
Gibt an, ob das Datenschema ausgegeben wird. Weitere Informationen finden Sie unter Anfügen einer Domäne oder Verbunddomäne an Verweisdaten.

Festlegen der Optionen im Dialogfeld "Verbindungs-Manager für DQS-Bereinigung"

Servername
Wählen Sie den Namen des DQS-Servers aus, mit dem Sie eine Verbindung herstellen möchten, oder geben Sie ihn ein. Weitere Informationen zum Server finden Sie unter DQS Administration.

Verbindung testen
Klicken Sie auf diese Schaltfläche, um zu überprüfen, ob die angegebene Verbindung gültig ist.

Sie können das Dialogfeld Verbindungs-Manager für DQS-Bereinigung auch wie folgt über den Verbindungsbereich öffnen:

  1. Öffnen Sie in SQL Server Data Tools (SSDT) ein vorhandenes Integration Services-Projekt, oder erstellen Sie ein neues Projekt.

  2. Klicken Sie im Verbindungsbereich mit der rechten Maustaste auf Neue Verbindung, und klicken Sie anschließend auf DQS.

  3. Klicken Sie auf Hinzufügen.