Opciones de Solicitud de perfil de dependencia funcional (tarea de generación de perfiles de datos)

Utilice el panel Propiedades de la solicitud de la página Solicitudes de perfil para establecer las opciones de Solicitud de perfil de dependencia funcional seleccionadas en el panel de solicitudes. Un perfil de dependencia funcional informa de hasta qué punto los valores de una columna (la columna dependiente) dependen de los valores de otra columna o de un conjunto de columnas (la columna determinante). Este perfil también puede ayudarle a identificar problemas de los datos, por ejemplo valores que no sean válidos. Por ejemplo, imagine que genera un perfil de la dependencia entre una columna de código postal y una columna de estados de Estados Unidos. En este perfil, el mismo código postal debería tener siempre el mismo estado, pero el perfil detecta infracciones de la dependencia.

Nota

Las opciones que se describen en este tema aparecen en la página Solicitudes de perfil del Editor de tareas de generación de perfiles de datos. Para obtener más información acerca de esta página del editor, vea Editor de tareas de generación de perfiles de datos (página Solicitudes de perfil).

Para obtener más información acerca de cómo usar la tarea de generación de perfiles de datos, vea Configurar la tarea de generación de perfiles de datos. Para obtener más información acerca de cómo usar el visor de perfiles de datos para analizar la salida de la tarea de generación de perfiles de datos, vea Ver la salida de perfiles en el visor de perfiles de datos.

Selección de las columnas determinante y dependiente

Una Solicitud de perfil de dependencia funcional calcula el grado en que la columna o conjunto de columnas del lado determinante (especificadas en la propiedad DeterminantColumns) determina la columna del lado dependiente (que se especifica en la propiedad DependentColumn). Por ejemplo, una columna de estados de Estados Unidos debería ser funcionalmente dependiente de una columna de códigos postales de Estados Unidos. Es decir, si el código postal (columna determinante) es 98052, el estado (columna dependiente) siempre debería ser Washington.

Para el lado determinante, puede especificar una columna o un conjunto de columnas en la propiedad DeterminantColumns. Por ejemplo, considere una tabla de ejemplo que contenga las columnas A, B y C. Puede hacer las selecciones siguientes para la propiedad DeterminantColumns:

  • Al seleccionar el carácter comodín (*), la tarea de generación de perfiles de datos prueba cada columna como lado determinante de la dependencia.

  • Al seleccionar el carácter comodín (*) y otra columna o columnas, la tarea de generación de perfiles de datos prueba cada combinación de columnas como lado determinante de la dependencia. Por ejemplo, considere una tabla de ejemplo que contiene las columnas A, B y C. Si especifica (*) y la columna C como el valor de la propiedad DeterminantColumns, la tarea de generación de perfiles de datos prueba las combinaciones (A, C) y (B, C) como el lado determinante de la dependencia.

Para el lado dependiente, puede especificar una columna única o el carácter comodín (*) en la propiedad DependentColumn. Al seleccionar (*), la tarea de generación de perfiles de datos prueba la columna o conjunto de columnas del lado determinante con cada columna.

Nota

Si selecciona (*), esta opción podría provocar un gran número de cálculos y disminuir el rendimiento de la tarea. Sin embargo, si la tarea encuentra un subconjunto que satisface el umbral para una dependencia funcional, la tarea no analiza las combinaciones adicionales. Por ejemplo, en la tabla de ejemplo descrita anteriormente, si la tarea determina que la columna C es una columna determinante, no sigue analizando los candidatos compuestos.

Opciones de Propiedades de la solicitud

Para cada Solicitud de perfil de dependencia funcional, el panel Propiedades de la solicitud muestra los grupos de opciones siguientes:

  • Data, que incluye las opciones DeterminantColumns y DependentColumn.

  • General

  • Options

Opciones de Data

  • ConnectionManager
    Seleccione el administrador de conexión de ADO.NET existente que usa el Proveedor de datos .NET para SQL Server (SqlClient) con el fin de conectarse a la base de datos de SQL Server que contiene la tabla o la vista con la que se va a generar el perfil.

  • TableOrView
    Seleccione la tabla o vista cuyo perfil se va a generar.

  • DeterminantColumns
    Seleccione la columna o conjunto de columnas determinantes. Es decir, seleccione la columna o conjunto de columnas cuyos valores determinan el valor de la columna dependiente.

    Para obtener más información, vea las secciones, "Selección de las columnas determinante y dependiente" y "Opciones DeterminantColumns y DependentColumn", en este tema.

  • DependentColumn
    Seleccione la columna dependiente. Es decir, seleccione la columna cuyo valor se determina mediante el valor de la columna o conjunto de columnas del lado determinante.

    Para obtener más información, vea las secciones, "Selección de las columnas determinante y dependiente" y "Opciones DeterminantColumns y DependentColumn", en este tema.

Opciones DeterminantColumns y DependentColumn

Las opciones siguientes se presentan para cada columna seleccionada para generar un perfil en DeterminantColumns y DependentColumn.

Para obtener más información, vea la sección "Selección de las columnas determinante y dependiente" anteriormente en este tema.

  • IsWildCard
    Especifica si se ha seleccionado el carácter comodín (*). Esta opción está establecida en True si ha seleccionado (*) para generar un perfil de todas las columnas. Es False si ha seleccionado una columna individual para la que generar un perfil. Esta opción es de sólo lectura.

  • ColumnName
    Muestra el nombre de la columna seleccionada. Esta opción está en blanco si ha seleccionado (*) para generar un perfil de todas las columnas. Esta opción es de sólo lectura.

  • StringCompareOptions
    Seleccione las opciones para comparar los valores de cadena. Esta propiedad presenta las opciones indicadas en la tabla siguiente. El valor predeterminado de esta opción es Default.

    Nota

    Cuando use el carácter comodín (*) para ColumnName, CompareOptions es de sólo lectura y se establece en el valor Default.

    Valor

    Descripción

    Default

    Ordena y compara datos basados en la intercalación de la columna en la tabla de origen.

    BinarySort

    Ordena y compara los datos según los patrones de bits definidos para cada carácter. El criterio de ordenación binario utiliza la distinción entre mayúsculas y minúsculas, y de acentos. El orden binario es también el más rápido.

    DictionarySort

    Ordena y compara los datos según el orden y las reglas de comparación definidas en los diccionarios del idioma o alfabeto asociado.

    Si selecciona DictionarySort, también puede seleccionar cualquier combinación de las opciones enumeradas en la tabla siguiente. De forma predeterminada, no se selecciona ninguna de estas opciones adicionales.

    Valor

    Descripción

    IgnoreCase

    Especifica si la comparación distingue entre mayúsculas y minúsculas. Si se establece esta opción, la comparación de las cadenas omite la distinción entre mayúsculas y minúsculas. Por ejemplo, "ABC" se interpreta igual que "abc".

    IgnoreNonSpace

    Especifica si la comparación distingue entre caracteres con espacio y signos diacríticos. Si se establece esta opción, la comparación omite los signos diacríticos. Por ejemplo, "å" se considera igual que "a".

    IgnoreKanaType

    Especifica si la comparación distingue entre los dos tipos de caracteres kana japoneses: hiragana y katakana. Si se establece esta opción, la comparación de las cadenas omite los tipos de caracteres kana.

    IgnoreWidth

    Especifica si la comparación distingue entre un carácter de un solo byte y el mismo carácter cuando se representa con un carácter de doble byte. Si se establece esta opción, la comparación de las cadenas trata las representaciones de un solo byte y de doble byte del mismo carácter como idénticas.

Opciones generales

  • RequestID
    Escriba un nombre descriptivo para identificar esta solicitud de perfil. Generalmente, no tiene que cambiar el valor generado automáticamente.

Opciones

  • ThresholdSetting
    Especifique el valor de umbral. El valor predeterminado de esta propiedad es Specified.

    Valor

    Descripción

    None

    No especifica un umbral. El nivel de dependencia funcional se indica independientemente de su valor.

    Specified

    Utilice el umbral que se especifica en FDStrengthThreshold. Sólo se indica el nivel de dependencia funcional si es mayor que el umbral.

    Exact

    No especifica un umbral. El nivel de dependencia funcional sólo se indica si la dependencia funcional entre las columnas seleccionadas es exacta.

  • FDStrengthThreshold
    Especifique el umbral (con un valor entre 0 y 1) por encima del que se debería notificar un nivel de dependencia funcional. El valor predeterminado de esta propiedad es 0.95. Esta opción sólo se habilita cuando la opción Specified se selecciona como ThresholdSetting.

  • MaxNumberOfViolations
    Especifique el número máximo de infracciones de la dependencia funcional que va a notificarse en la salida. El valor predeterminado de esta propiedad es 100. Esta opción se deshabilita cuando la opción Exact se selecciona como ThresholdSetting.