Búsqueda similar (FAST Search Server 2010 for SharePoint)

Las características de búsqueda similar permiten buscar documentos similares a los resultados de la consulta ya recuperados.

Última modificación: jueves, 01 de septiembre de 2011

Hace referencia a: SharePoint Server 2010

En este artículo
Tipo de consulta de búsqueda similar
Referencia del vector del elemento de similitud
Ordenación de resultados de consultas de búsqueda similar

La evaluación de similitud se basa en una medida estadística. FAST Search Server 2010 for SharePoint crea automáticamente un componente de similitud que se agrega a la consulta.

Se aplica a: Microsoft FAST Search Server 2010 for SharePoint

Tipo de consulta de búsqueda similar

Esta propiedad representa el tipo de consulta de búsqueda similar que se va a realizar.

Los vectores de documento de cada elemento, que se ordenan por peso decreciente, pueden usarse para crear tres tipos de búsquedas por similitud en un elemento d, dada una consulta original Q. Estas solicitudes de búsqueda por similitud se transforman en una nueva consulta única, con la siguiente reescritura de la consulta (que se muestra con una representación simbólica, no en el lenguaje de consulta exacto):

  • FindSimilar: Query = Q OR <s1,w1> [OR <sm,wm>]* los vectores de similitud se agregan a la consulta mediante un operador OR. Esto significa que la consulta original se incluye en la consulta reescrita, pero la nueva consulta puede coincidir con elementos similares, incluso si no se cumple la consulta original.

  • RefineSimilar: Query = Q AND (<s1,w1> [OR <sm,wm>]*) la consulta coincidirá si se cumplen las condiciones de la consulta original y las condiciones de vector de similitud. Por ejemplo, ajuste la consulta original para que contenga elementos similares en el elemento indicado en <SimilarTo>.

  • ExcludeSimilar: Query = Q ANDNOT (<s1,w1> [OR <sm,wm>]*) la consulta coincidirá si se cumplen las condiciones de la consulta original, pero no las condiciones de similitud.

    <s,w> indica el vector de similitud del elemento tal como se calcula durante el procesamiento del elemento.

**De forma predeterminada:**FindSimilar

Nota

El componente de similitud que se agrega a la consulta (<s1,w1> [OR <sm,wm>]*), está consultando el índice de texto completo predeterminado.

Referencia del vector del elemento de similitud

Esta propiedad representa una referencia de similitud al buscar elementos similares. Es una representación del vector de similitud que se devuelve para cada elemento en el resultado de consulta en la propiedad administrada docvector.

El valor es una cadena con formato según el formato siguiente:

[string1,weight1][string2,weight2]...[stringN,weightN]

Al realizar una consulta de búsqueda similares, el elemento SimilarTo debe contener un parámetro de string con el valor de la propiedad administrada docvector del elemento que se usa como referencia de similitud. El vector de similitud consta de un conjunto de expresiones "término,peso", que indican los términos o conceptos más importantes del elemento y la importancia percibida correspondiente (peso). Los términos pueden ser palabras o frases.

El peso es un valor flotante comprendido entre 0 y 1, donde 1 indica la mayor importancia.

El vector de similitud se crea durante el procesamiento del elemento e indica los términos o conceptos más importantes del elemento y el peso correspondiente.

Ordenación de resultados de consultas de búsqueda similar

La propiedad FindSimilar especifica si los resultados de la consulta basada en similitud están ordenados por similitud o rango.

Al realizar una consulta de búsqueda similar, los resultados se pueden ordenar de dos maneras:

  • Por el resultado de relevancia (rango). Es el método de ordenación para las consultas normales y corresponde a SortSimilar="False".

  • Por similitud. Es el valor de ordenación predeterminado para las consultas por similitud, donde los elementos más parecidos se muestran en primer lugar. Esto corresponde a SortSimilar = "True".

Valor predeterminado: True