Share via


Procédure : charger des analyseurs lexicaux tiers sous licence

SQL Server 2008 comprend des analyseurs lexicaux tiers sous licence pour les langues suivantes :

  • Danois

  • Polonais

  • Turc

Ces analyseurs lexicaux sont disponibles mais ne sont pas installés par défaut ; ils doivent être enregistrés puis ajoutés manuellement à la liste des LCID pris en charge pour l'interrogation et l'indexation de texte intégral.

Informations préalables requises

Avant de pouvoir charger un analyseur lexical, vous devez disposer des informations suivantes :

  • Nom de chacune des instances de SQL Server sur lesquelles vous souhaitez inscrire les analyseurs lexicaux

  • Chemin d'accès FTDATA pour chaque instance

    Après avoir récupéré les ID d'instance, vous devez récupérer le chemin d'accès au dossier FTData spécifique à l'instance. Ce chemin d'accès servira pour l'ajout de valeurs de configuration qui spécifient les fichiers du lexique et du dictionnaire des synonymes relatifs à une langue.

Pour obtenir l'ID d'instance pour une instance de SQL Server

  1. Cliquez sur Démarrer, puis sur Exécuter.

  2. Dans la boîte de dialogue Exécuter, dans la zone Ouvrir, tapez Regedit.

  3. Cliquez sur OK.. L'Éditeur du Registre s'ouvre.

  4. Accédez à HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\Instance Names\SQL. À cet endroit, le volet droit affiche dans la colonne Données le nom et l'ID de chaque instance de SQL Server installée. Obtenez l'ID de chacune des instances de serveur sur lesquelles vous allez charger des analyseurs lexicaux tiers.

Pour obtenir le chemin d'accès FTData pour chaque instance

  1. Cliquez sur Démarrer, puis sur Exécuter.

  2. Dans la boîte de dialogue Exécuter, dans la zone Ouvrir, tapez Regedit.

  3. Cliquez sur OK.

  4. Dans l'Éditeur du Registre, sélectionnez la clé de Registre suivante pour une instance de SQL Server: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\instance_ID\MSSQLServer où instance_ID est l'identificateur de l'instance de serveur sur laquelle vous chargez des analyseurs lexicaux. Par exemple, pour l'instance de serveur par défaut, la valeur de la clé de Registre est la suivante :

    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\Setup

    Le volet droit affiche la valeur FullTextDefaultPath, qui contient le chemin d'accès au dossier FTData spécifique à l'instance. Par exemple, pour l'instance par défaut de SQL Server 2008, le chemin d'accès est le suivant :

    C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\FTData

Inscription d'un analyseur lexical et des composants linguistiques connexes

La procédure d'installation d'analyseurs lexicaux tiers sous licence de Microsoft consiste en trois phases. La liste ci-après répertorie ces phrases, dont les étapes sont décrites plus loin dans cette section.

  1. Ajoutez les ClassID COM des interfaces de l'analyseur lexical et du générateur de formes dérivées pour la langue à inscrire en tant que clé dans le nœud <InstanceRoot>\MSSearch\CLSID du Registre.

  2. Ajoutez une clé au nœud <InstanceRoot>\MSSearch\Language pour la langue concernée.

  3. Ajoutez les valeurs de configuration qui spécifient l'emplacement des fichiers du lexique et du dictionnaire des synonymes de la langue concernée.

[!REMARQUE]

L'analyseur lexical du danois sert d'exemple dans cette section. Les valeurs requises pour l'installation des analyseurs lexicaux pour chacune des langues sont présentées dans les tableaux figurant plus loin dans cette rubrique.

Phase 1 : ajouter les ClassID COM des interfaces de l'analyseur lexical et du générateur de formes dérivées pour la langue à inscrire

AttentionAttention

Une modification incorrecte du Registre peut sérieusement endommager votre système. Avant d'apporter des modifications au Registre, il convient de sauvegarder les données importantes qui se trouvent sur l'ordinateur.

Pour ajouter le ou les ClassID COM de ces composants pour le danois** :**

  1. Ouvrez l'Éditeur du Registre en exécutant la procédure suivante :

    1. Cliquez sur Démarrer, puis sur Exécuter.

    2. Dans la boîte de dialogue Exécuter, dans la zone Ouvrir, tapez Regedit.

  2. Dans l'Éditeur du Registre, sélectionnez la clé de Registre suivante pour la première instance de SQL Server : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\CLSID

  3. Dans la barre de menus, cliquez successivement sur Edition, Nouveau et Clé.

  4. Tapez {16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}.

  5. Appuyez sur la touche Entrée.

  6. Dans le volet droit, cliquez avec le bouton droit sur la valeur de registre Par défaut, puis cliquez sur Modifier.

  7. Dans la boîte de dialogue Modification de la chaîne, dans la zone Données de la valeur, tapez danlr.dll, puis cliquez sur OK.

  8. Répétez les étapes 3 à 7, en remplaçant la valeur de l'étape 4 par {83BC7EF7-D27B-4950-A743-0F8E5CA928F8}.

Pour une langue donnée, suivez les étapes ci-dessus, en remplaçant les valeurs de clé des étapes 4 et 8 par les valeurs de clé de la langue souhaitée. Ces valeurs sont répertoriées ci-dessous. À l'étape 7, remplacez danlr.dll par le nom de la DLL correspondant à la langue souhaitée.

Langue

Valeur de clé pour l'étape 4

Nom de la DLL pour l'étape 7

Valeur de clé pour l'étape 8

Danois

{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}

danlr.dll

{83BC7EF7-D27B-4950-A743-0F8E5CA928F8}

Polonais

{B8713269-2D9D-4BF5-BF40-2615D75723D8}

lrpolish.dll

{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6}

Turc

{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6}

trklr.dll

{8DF412D1-62C7-4667-BBEC-38756576C21B}

Phase 2 : ajoutez une clé au nœud <InstanceRoot>\MSSearch\Language pour la langue concernée.

Pour ajouter une clé à ce nœud pour la langue danoise :

  1. Sélectionnez la clé de Registre suivante pour l'instance par défaut de SQL Server : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language

  2. Répétez les étapes 3 à 5 de la procédure précédente, en remplaçant le nom de la clé de l'étape 4 par dan.

Pour une langue donnée, suivez les étapes ci-dessus, en remplaçant le nom de clé de l'étape 4 par les valeurs répertoriées ci-dessous pour la langue correspondante.

Langue

Nom de clé pour l'étape 4

Danois

dan

Polonais

plk

Turc

trk

Phase 3 : ajoutez les valeurs de configuration qui indiquent l'emplacement de chaque composant linguistique pour une langue.

Pour ajouter les valeurs de configuration de ces composants pour la langue danoise :

  1. Sélectionnez la clé de registre entrée dans la phase 2 ci-dessus. Pour l'instance par défaut de SQL Server, cette clé serait : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\dan

  2. Dans la barre de menus, cliquez successivement sur Edition, Nouveau et Valeur de chaîne.

  3. Tapez TsaurusFile.

  4. Appuyez sur ENTRÉE.

  5. Cliquez avec le bouton droit sur la valeur de registre TsaurusFile que vous venez d'ajouter, puis cliquez sur Modifier.

  6. Dans la boîte de dialogue Modification de la chaîne, dans la zone Donnéesde la valeur, tapez tsdan.xml.

  7. Cliquez sur OK.

Répétez les étapes 2 à 7 pour les autres composants linguistiques de la langue : le fichier de dictionnaire des synonymes, les paramètres régionaux de langue, l'analyseur lexical et le générateur de formes dérivées. Les valeurs d'inscription de ces composants pour le danois, le polonais ou le turc sont fournies ci-après.

Valeurs pour le danois

Répétez les étapes 2 à 7 pour ajouter chaque jeu de valeurs répertorié ci-après, en remplaçant le type (étape 2), le nom (étapes 3 et 5) et les données (étape 6) spécifiques à la langue pour chaque valeur.

Type de valeur pour l'étape 2

Nom des valeurs pour les étapes 3 et 5

Type de valeur pour l'étape 6

Valeur de chaîne

TsaurusFile

tsdan.xml

Valeur DWORD

Paramètres régionaux

00000406

Valeur de chaîne

WBreakerClass

{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}

Valeur chaîne

StemmerClass

{83BC7EF7-D27B-4950-A743-0F8E5CA928F8}

Valeurs pour le polonais

Pour la langue polonaise, suivez les étapes exposées plus haut en utilisant les valeurs répertoriées ci-dessous. Sélectionnez la clé de registre entrée pour le polonais dans la phase 2 ci-dessus. Pour l'instance par défaut de SQL Server, cette clé serait : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\plk

Exécutez les étapes 2 à 7 pour ajouter chaque jeu de valeurs répertorié ci-après, en remplaçant le type (étape 2), le nom (étapes 3 et 5) et les données (étape 6) spécifiques à la langue pour chaque valeur.

Type de valeur pour l'étape 2

Nom des valeurs pour les étapes 3 et 5

Données de valeur pour l'étape 6

Valeur de chaîne

TsaurusFile

tsplk.xml

Valeur DWORD

Paramètres régionaux

00000415

Valeur de chaîne

WBreakerClass

{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6}

Valeur de chaîne

StemmerClass

{B8713269-2D9D-4BF5-BF40-2615D75723D8}

Valeurs pour le turc

Pour la langue turque, suivez les étapes exposées plus haut en utilisant les valeurs répertoriées ci-dessous. Sélectionnez la clé de registre entrée pour le turc dans la phase 2 ci-dessus. Pour l'instance par défaut de SQL Server, cette clé serait : HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\trk

Exécutez les étapes 2 à 7 pour ajouter chaque jeu de valeurs répertorié ci-après, en remplaçant le type (étape 2), le nom (étapes 3 et 5) et les données (étape 6) spécifiques à la langue pour chaque valeur.

Type de valeur pour l'étape 2

Nom des valeurs pour les étapes 3 et 5

Données de valeur pour l'étape 6

Valeur de chaîne

TsaurusFile

tstrk.xml

Valeur DWORD

Paramètres régionaux

0000041f

Valeur de chaîne

WBreakerClass

{8DF412D1-62C7-4667-BBEC-38756576C21B}

Valeur de chaîne

StemmerClass

{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6}

Mise à jour de la liste des langues prises en charge par la recherche en texte intégral

Après avoir chargé des analyseurs lexicaux tiers, vous devez actualiser la liste des LCID pris en charge pour l'interrogation et l'indexation de texte intégral. Pour actualiser cette liste, utilisez la procédure stockée système sp_fulltext_service pour mettre à jour la liste des langues, comme suit :

exec sp_fulltext_service 'update_languages';

Les langues des analyseurs lexicaux récemment chargés sont maintenant listées par l'affichage catalogue sys.fulltext_languages.