Очистка данных
[Эта документация предназначена исключительно для предварительного ознакомления и в следующих выпусках может быть изменена. Пустые разделы включены в качестве заполнителей.]
Очистка данных позволяет повысить качество данных, кроме того, в службах Службы Integration Services предусмотрено преобразование «Корректировка данных», позволяющее легко и эффективно повысить качество данных. Этот компонент используется специально для корректировки данных на основе правил, которые можно создавать с помощью служб Data Quality Services.
Правила качества данных
Правила обеспечения качества данных используются для удаления синтаксических ошибок из терминов и разделения терминов, которые были ошибочно объединены в один термин. Ниже приведены примеры синтаксических исправлений, вносимых при помощи правил:
Термин «Люксемборг» указан неправильно. Правила исправят эту ошибку и заменят термином с верной орфографией — «Люксембург».
Термин «классданных» является неверным сочетанием слов «класс» и «данных». Правила используются для того, чтобы заменить неверное сочетание слов на правильное — «класс данных»
Следует создавать правила для всех наборов данных, содержащих текстовые поля, в которых могут быть ошибки. Например, правила создаются для таблицы с данными сотрудников, в которую вручную вводятся имена, должности и адреса электронной почты. Правила, создаваемые для работы с этой таблицей, можно использовать для корректировки неверно указанных имен и должностей, а также для обновления неполных или неправильно отформатированных адресов электронной почты.
Связанные задачи
Дополнительные сведения о применении правил качества данных для источника данных см. в разделе Применение правил качества данных к источнику данных.
См. также
|