Opciones de Solicitud de perfil de inclusión de valores (tarea de generación de perfiles de datos)

Use el panel Propiedades de la solicitud de la página Solicitudes de perfil para establecer las opciones de Solicitud de perfil de inclusión de valores seleccionadas en el panel de solicitudes. Un perfil de inclusión de valores calcula la superposición en los valores entre dos columnas o conjuntos de columnas. Por lo tanto, también puede determinar si una columna o un conjunto de columnas es adecuado para actuar como una clave externa entre las tablas seleccionadas. Este perfil también puede ayudarle a identificar problemas de los datos, por ejemplo valores que no sean válidos. Por ejemplo, suponga que usa un perfil de inclusión de valores para generar el perfil de la columna de identificadores de producto de una tabla de ventas. El perfil detecta que la columna contiene valores que no están en la columna de identificadores de producto de la tabla de productos.

Nota

Las opciones que se describen en este tema aparecen en la página Solicitudes de perfil del Editor de tareas de generación de perfiles de datos. Para obtener más información acerca de esta página del editor, vea Editor de tareas de generación de perfiles de datos (página Solicitudes de perfil).

Para obtener más información acerca de cómo usar la tarea de generación de perfiles de datos, vea Configurar la tarea de generación de perfiles de datos. Para obtener más información acerca de cómo usar el visor de perfiles de datos para analizar la salida de la tarea de generación de perfiles de datos, vea Ver la salida de perfiles en el visor de perfiles de datos.

Selección de columnas para la propiedad InclusionColumns

Una Solicitud de perfil de inclusión de valores calcula si todos los valores de un subconjunto se encuentran en el superconjunto. El superconjunto suele ser una tabla de referencia o búsqueda. Por ejemplo, la columna de estado de una tabla de direcciones es la tabla de subconjunto. Cada código de estado de dos caracteres de esta columna también se debería encontrar en la tabla de códigos de estado del servicio postal de Estados Unidos, que es la tabla de superconjunto.

Cuando se usa el carácter comodín (*) como valor de la columna de subconjunto o de superconjunto, la tarea de generación de perfiles de datos compara cada columna de ese lado con la columna especificada en el otro.

Nota

Si selecciona (*), esta opción podría provocar un gran número de cálculos y disminuir el rendimiento de la tarea.

Descripción de los valores del umbral

Puede usar dos valores de umbral diferentes para precisar la salida de una solicitud de perfil de inclusión de valores.

Al especificar un valor distinto de None para InclusionThresholdSetting, el perfil sólo notifica el nivel de inclusión del subconjunto en el superconjunto bajo una de las condiciones siguientes:

  • Cuando el perfil de inclusión supera el umbral que se especifica en InclusionStrengthThreshold.

  • Cuando el perfil de inclusión tiene un valor de 1.0 e InclusionStrengthThreshold se establece en Exact.

Puede precisar más la salida si filtra las combinaciones en las que la columna de superconjunto no sea una clave adecuada para la tabla de superconjunto debido a que contenga valores no únicos. Cuando especifica un valor distinto de None para SupersetColumnsKeyThresholdSetting, el perfil sólo notifica el nivel de inclusión del subconjunto en el superconjunto en una de las condiciones siguientes:

  • Cuando la conveniencia de las columnas de superconjunto como una clave en la tabla de superconjunto supera el umbral especificado en SupersetColumnsKeyThreshold

  • Cuando el nivel de inclusión tiene un valor ó 1.0 y el valor de SupersetColumnsKeyThreshold está establecido en Exact.

Opciones de Propiedades de la solicitud

Para cada Solicitud de perfil de inclusión de valores, el panel Propiedades de la solicitud muestra los grupos siguientes de opciones:

  • Data, que incluye las opciones SubsetTableOrView, SupersetTableOrView e InclusionColumns

  • General

  • Opciones

Opciones de Data

  • ConnectionManager
    Seleccione el administrador de conexión de ADO.NET existente que usa el Proveedor de datos .NET para SQL Server (SqlClient) con el fin de conectarse a la base de datos de SQL Server que contiene la tabla o la vista con la que se va a generar el perfil.

  • SubsetTableOrView
    Seleccione la tabla o vista cuyo perfil se va a generar.

    Para obtener más información, vea la sección, "Opciones de SubsetTableOrView y SupersetTableOrView" en este tema.

  • SupersetTableOrView
    Seleccione la tabla o vista cuyo perfil se va a generar.

    Para obtener más información, vea la sección, "Opciones de SubsetTableOrView y SupersetTableOrView" en este tema.

  • InclusionColumns
    Seleccione las columnas o conjuntos de columnas en las tablas de superconjunto y subconjunto.

    Para obtener más información, vea las secciones "Selección de columnas para la propiedad InclusionColumns" y "Opciones de InclusionColumns" en este tema.

Opciones de SubsetTableOrView y SupersetTableOrView

  • Schema
    Especifica el esquema al que pertenece la tabla seleccionada. Esta opción es de solo lectura.

  • TableOrView
    Muestra el nombre de la tabla seleccionada. Esta opción es de solo lectura.

Opciones de InclusionColumns

Las opciones siguientes se presentan para cada conjunto de columnas seleccionado para generar perfiles en InclusionColumns.

Para obtener más información, vea la sección "Selección de columnas para la propiedad InclusionColumns" anteriormente en este tema.

  • IsWildcard
    Especifica si se ha seleccionado el carácter comodín (*). Esta opción está establecida en True si ha seleccionado (*) para generar un perfil de todas las columnas. Es False si ha seleccionado una columna individual para la que generar un perfil. Esta opción es de solo lectura.

  • ColumnName
    Muestra el nombre de la columna seleccionada. Esta opción está en blanco si ha seleccionado (*) para generar un perfil de todas las columnas. Esta opción es de solo lectura.

  • StringCompareOptions
    Seleccione las opciones para comparar los valores de cadena. Esta propiedad presenta las opciones indicadas en la siguiente tabla. El valor predeterminado de esta opción es Default.

    Nota

    Cuando use el carácter comodín (*) para ColumnName, CompareOptions es de solo lectura y se establece en el valor Default.

    Valor

    Descripción

    Default

    Ordena y compara datos basados en la intercalación de la columna en la tabla de origen.

    BinarySort

    Ordena y compara los datos según los patrones de bits definidos para cada carácter. El orden binario usa la distinción de mayúsculas y minúsculas, y de acentos. El orden binario es también el más rápido.

    DictionarySort

    Ordena y compara los datos según el orden y las reglas de comparación definidas en los diccionarios del idioma o alfabeto asociado.

    Si selecciona DictionarySort, también puede seleccionar cualquier combinación de las opciones enumeradas en la tabla siguiente. De forma predeterminada, no se selecciona ninguna de estas opciones adicionales.

    Valor

    Descripción

    IgnoreCase

    Especifica si la comparación distingue entre mayúsculas y minúsculas. Si se establece esta opción, la comparación de las cadenas omite la distinción entre mayúsculas y minúsculas. Por ejemplo, "ABC" se interpreta igual que "abc".

    IgnoreNonSpace

    Especifica si la comparación distingue entre caracteres con espacio y signos diacríticos. Si se establece esta opción, la comparación omite los signos diacríticos. Por ejemplo, "å" se considera igual que "a".

    IgnoreKanaType

    Especifica si la comparación distingue entre los dos tipos de caracteres kana japoneses: hiragana y katakana. Si se establece esta opción, la comparación de las cadenas omite los tipos de caracteres kana.

    IgnoreWidth

    Especifica si la comparación distingue entre un carácter de un solo byte y el mismo carácter cuando se representa con un carácter de doble byte. Si se establece esta opción, la comparación de las cadenas trata las representaciones de un solo byte y de doble byte del mismo carácter como idénticas.

Opciones generales

  • RequestID
    Escriba un nombre descriptivo para identificar esta solicitud de perfil. Generalmente, no tiene que cambiar el valor generado automáticamente.

Opciones

  • InclusionThresholdSetting
    Seleccione el valor de umbral para precisar la salida del perfil. El valor predeterminado de esta propiedad es Specified. Para obtener más información, vea la sección "Descripción de los valores del umbral" anteriormente en este tema.

    Valor

    Descripción

    None

    No especifica un umbral. El nivel de la clave se notifica independientemente de su valor.

    Specified

    Use el umbral que se especifica en InclusionStrengthThreshold. Sólo se notifica el nivel de inclusión si es mayor que el umbral.

    Exact

    No especifica un umbral. Sólo se notifica el nivel de inclusión si los valores del subconjunto están completamente incluidos en los valores del superconjunto.

  • InclusionStrengthThreshold
    Especifique el umbral (con un valor entre 0 y 1) por encima del que se debería indicar un nivel de inclusión. El valor predeterminado de esta propiedad es 0.95. Esta opción solo se habilita cuando la opción Specified se selecciona como InclusionThresholdSetting.

    Para obtener más información, vea la sección "Descripción de los valores del umbral" anteriormente en este tema.

  • SupersetColumnsKeyThresholdSetting
    Especifique el umbral del superconjunto. El valor predeterminado de esta propiedad es Specified. Para obtener más información, vea la sección "Descripción de los valores del umbral" anteriormente en este tema.

    Valor

    Descripción

    None

    No especifica un umbral. El nivel de inclusión se notifica sin tener en cuenta el nivel de clave de la columna de superconjunto.

    Specified

    Use el umbral que se especifica en SupersetColumnsKeyThreshold. Sólo se notifica el nivel de inclusión si el nivel de clave de la columna de superconjunto es mayor que el umbral.

    Exact

    No especifica un umbral. Sólo se notifica el nivel de inclusión si las columnas de superconjunto son una clave exacta en la tabla de superconjunto.

  • SupersetColumnsKeyThreshold
    Especifique el umbral (con un valor entre 0 y 1) por encima del que se debería indicar un nivel de inclusión. El valor predeterminado de esta propiedad es 0.95. Esta opción solo está habilitada cuando Specified está seleccionado como SupersetColumnsKeyThresholdSetting.

    Para obtener más información, vea la sección "Descripción de los valores del umbral" anteriormente en este tema.

  • MaxNumberOfViolations
    Especifique el número máximo de infracciones de la inclusión que va a notificarse en la salida. El valor predeterminado de esta propiedad es 100. Esta opción se deshabilita cuando la opción Exact se selecciona como InclusionThresholdSetting.