Transformations-Editor für Fuzzygruppierung (Registerkarte Spalten)

Mithilfe der Registerkarte Spalten des Dialogfeldes Transformations-Editor für Fuzzygruppierung können Sie die Spalten angeben, die zum Gruppieren von Zeilen mit doppelten Werten verwendet werden sollen.

Weitere Informationen zur Transformation für Fuzzygruppierung finden Sie unter Transformation für Fuzzygruppierung.

Optionen

  • Verfügbare Eingabespalten
    Wählen Sie aus dieser Liste die Eingabespalten, mit denen Zeilen mit doppelten Werten gruppiert werden sollen.
  • Name
    Zeigt die Namen der verfügbaren Eingabespalten an.
  • Pass-Through
    Wählen Sie aus, ob die Eingabespalte in der Ausgabe der Transformation eingeschlossen sein soll. Alle für die Gruppierung verwendeten Spalten werden automatisch in die Ausgabe kopiert. Sie können weitere Spalten einschließen, indem Sie diese Spalten auswählen.
  • Eingabespalte
    Wählen Sie eine der zu einem früheren Zeitpunkt in der Liste Verfügbare Eingabespalten ausgewählten Eingabespalten aus.
  • Ausgabealias
    Geben Sie einen beschreibenden Namen für die entsprechende Ausgabespalte ein. Standardmäßig stimmt der Name der Ausgabespalte mit dem Namen der Eingabespalte überein.
  • Gruppenausgabealias
    Geben Sie einen beschreibenden Namen für die Spalte ein, die den kanonischen Wert für die gruppierten Duplikate enthalten soll. Der Standardname dieser Ausgabespalte entspricht dem Namen der Eingabespalte mit dem Anhang _clean.
  • Übereinstimmungstyp
    Wählen Sie genaue oder Fuzzyübereinstimmungen aus. Zeilen werden als Duplikate angesehen, wenn Sie über alle Spalten hinweg eine genügend große Ähnlichkeit mit dem Typ einer Fuzzyübereinstimmung haben. Wenn Sie für bestimmte Spalten auch die genaue Übereinstimmung angeben, werden in den Spalten mit den genauen Übereinstimmungen nur Zeilen mit identischen Werten als mögliche Duplikate angesehen. Wenn Sie also wissen, dass eine bestimmte Spalte keine Fehler oder Inkonsistenzen enthält, können Sie für diese Spalte die genaue Übereinstimmung angeben, um die Genauigkeit der Fuzzyübereinstimmungen für andere Spalten zu erhöhen.
  • Minimale Ähnlichkeit
    Legen Sie mithilfe des Schiebereglers den Schwellenwert für Ähnlichkeit auf Verknüpfungsebene fest. Je näher der Wert an 1 liegt, desto stärker muss die Ähnlichkeit zwischen Suchwert und Quellwert sein, um als Übereinstimmung zu gelten. Durch eine Erhöhung des Schwellenwertes kann die Geschwindigkeit beim Abgleich erhöht werden, weil als Kandidaten dann weniger Datensätze berücksichtigt werden müssen.
  • Ähnlichkeitsausgabealias
    Geben Sie den Namen für eine Ausgabespalte an, die die Ähnlichkeitsergebnisse für die ausgewählte Verknüpfung enthält. Wenn Sie diesen Wert nicht angeben, wird die Ausgabespalte nicht erstellt.
  • Zahlen
    Gibt die Bedeutung führender und nachfolgender Zahlen beim Vergleichen der Spaltendaten an. Wenn beispielsweise führende Zahlen von Bedeutung sind, wird "123 Main Street" nicht mit "456 Main Street" gruppiert.

    Wert Beschreibung

    Neither

    Weder führende noch nachfolgende Zahlen sind von Bedeutung.

    Leading

    Nur führende Zahlen sind von Bedeutung.

    Trailing

    Nur nachfolgende Zahlen sind von Bedeutung.

    LeadingAndTrailing

    Sowohl führende als auch nachfolgende Zahlen sind von Bedeutung.

Siehe auch

Andere Ressourcen

Integration Services Error and Message Reference
Vorgehensweise: Identifizieren ähnlicher Datenzeilen mithilfe der Transformation für Fuzzygruppierung

Hilfe und Informationen

Informationsquellen für SQL Server 2005