CREATE FULLTEXT INDEX(Transact-SQL)

데이터베이스의 테이블 또는 인덱싱된 뷰에서 전체 텍스트 인덱스를 만듭니다. 테이블 또는 인덱싱된 뷰당 하나의 전체 텍스트 인덱스만 허용되고 각 전체 텍스트 인덱스는 하나의 테이블 또는 인덱싱된 뷰에 적용됩니다.

전체 텍스트 인덱스는 최대 1024개의 열을 포함할 수 있습니다.

항목 링크 아이콘Transact-SQL 구문 표기 규칙

구문

CREATE FULLTEXT INDEX ON table_name
      [ ( { column_name 
             [ TYPE COLUMN type_column_name ]
             [ LANGUAGE language_term ] 
        } [ ,...n] 
            ) ]
    KEY INDEX index_name 
        [ ON <catalog_filegroup_option> ]
        [ WITH [ ( ] <with_option> [ ,...n] [ ) ] ]
[;]

<catalog_filegroup_option>::=
  {
        fulltext_catalog_name 
  | ( fulltext_catalog_name, FILEGROUP filegroup_name )
  | ( FILEGROUP filegroup_name, fulltext_catalog_name )
  | ( FILEGROUP filegroup_name )
  }

<with_option>::=
  {
   CHANGE_TRACKING [ = ] { MANUAL | AUTO | OFF [, NO POPULATION ] } 
  | STOPLIST [ = ] { OFF | SYSTEM | stoplist_name }
  }

인수

  • table_name
    전체 텍스트 인덱스에 있는 열을 포함하는 테이블 또는 인덱싱된 뷰의 이름입니다.

  • column_name
    전체 텍스트 인덱스에 포함된 열의 이름입니다. char, varchar, nchar, nvarchar, text, ntext, image, xml, varbinary 및 varbinary(max) 유형의 열만 전체 텍스트 검색을 위해 인덱싱할 수 있습니다. 여러 열을 지정하려면 다음과 같이 column_name 절을 반복합니다.

    CREATE FULLTEXT INDEX ON table_name (column_name1 […], column_name2 […]) …

  • TYPE COLUMN type_column_name
    varbinary, varbinary(max) 또는 image 문서의 문서 유형을 보관하는 데 사용되는 테이블 열의 이름인 type_column_name을 지정합니다. 유형 열이라고 하는 이 열에는 사용자 제공 파일 확장명(.doc, .pdf, .xls 등)이 포함됩니다. 유형 열은 char, nchar, varchar 또는 nvarchar 형식이어야 합니다.

    TYPE COLUMN type_column_name은 column_name이 varbinary, varbinary(max) 또는 image 열을 지정하여 데이터가 이진 데이터로 저장되는 경우에만 지정합니다. 그렇지 않으면 SQL Server에서 오류가 반환됩니다.

    [!참고]

    인덱싱할 때 전체 텍스트 엔진은 각 테이블 행의 유형 열에 있는 약어를 사용하여 column_name의 문서에 사용할 전체 텍스트 검색 필터를 식별합니다. 이 필터는 문서를 이진 스트림으로 로드하고 서식 정보를 제거하며 문서의 텍스트를 단어 분리기 구성 요소로 보냅니다. 자세한 내용은 전체 텍스트 검색 필터를 참조하십시오.

  • LANGUAGE language_term
    column_name에 저장된 데이터의 언어입니다.

    language_term은 선택 사항이며 언어의 LCID(로캘 ID)에 해당하는 문자열, 정수 또는 16진수 값으로 지정할 수 있습니다. 값을 지정하지 않으면 SQL Server 인스턴스의 기본 언어가 사용됩니다.

    language_term을 지정하면 해당 언어가 char, nchar, varchar, nvarchar, text 및 ntext 열에 저장된 데이터를 인덱싱하는 데 사용됩니다. 열에 대한 전체 텍스트 조건자의 일부로 language_term을 지정하지 않으면 이 언어가 쿼리 시에 기본 언어로 사용됩니다.

    문자열로 지정하는 경우 language_term은 syslanguages 시스템 테이블의 alias 열 값에 해당합니다. 문자열은 **'language_term'**과 같이 작은따옴표로 묶어야 합니다. 정수로 지정하는 경우 language_term은 언어를 식별하는 실제 LCID입니다. 16진수 값으로 지정하는 경우 language_term은 0x로 시작하는 LCID의 16진수 값입니다. 16진수 값은 선행 0을 포함하여 8자리 수를 초과할 수 없습니다.

    값이 DBCS(더블바이트 문자 집합) 형식인 경우 SQL Server에서는 값을 유니코드로 변환합니다.

    단어 분리기 및 형태소 분석기와 같은 리소스는 language_term으로 지정된 언어에 사용해야 합니다. 이러한 리소스가 지정된 언어를 지원하지 않는 경우 SQL Server에서 오류를 반환합니다.

    sp_configure 저장 프로시저를 사용하여 MicrosoftSQL Server 인스턴스의 기본 전체 텍스트 언어에 대한 정보에 액세스할 수 있습니다. 자세한 내용은 sp_configure(Transact-SQL)default full-text language 옵션을 참조하십시오.

    BLOB이 아닌 열 및 XML이 아닌 열에 여러 언어로 된 텍스트 데이터가 포함되어 있거나 열에 저장된 텍스트의 언어를 알 수 없는 경우 중립(0x0) 언어 리소스를 사용하는 것이 적합할 수 있습니다. 그러나 중립(0x0) 언어 리소스를 사용할 때 발생할 수 있는 결과를 먼저 이해해야 합니다. 중립(0x0) 언어 리소스를 사용할 경우의 결과와 가능한 해결 방법에 대한 자세한 내용은 전체 텍스트 인덱스 생성 시 언어 선택을 위한 최선의 방법을 참조하십시오.

    XML 유형 또는 BLOB 유형의 열로 저장된 문서의 경우 인덱싱 시에 문서 내의 언어 인코딩이 사용됩니다. 예를 들어 XML 열에서는 XML 문서의 xml:lang 특성이 언어를 식별합니다. 쿼리 시에 language_term이 전체 텍스트 쿼리의 일부로 지정되지 않은 경우 language_term에 지정된 이전 값이 전체 텍스트 쿼리의 기본 언어로 사용됩니다.

  • KEY INDEX index_name
    table_name의 고유 키 인덱스 이름입니다. KEY INDEX는 고유하며 단일 키의 Null을 허용하지 않는 열이어야 합니다. 전체 텍스트 고유 키에 사용 가능한 가장 작은 고유 키 인덱스를 선택합니다. 최상의 성능을 위해 전체 텍스트 키에 정수 데이터 형식을 사용하는 것이 좋습니다.

  • fulltext_catalog_name
    전체 텍스트 인덱스에 사용되는 전체 텍스트 카탈로그입니다. 카탈로그는 데이터베이스에 이미 있어야 합니다. 이 절은 선택 사항입니다. 지정하지 않으면 기본 카탈로그가 사용됩니다. 기본 카탈로그가 없으면 SQL Server에서 오류를 반환합니다.

  • FILEGROUP filegroup_name
    주어진 파일 그룹에 지정된 전체 텍스트 인덱스를 만듭니다. 파일 그룹은 이미 존재해야 합니다. FILEGROUP 절을 지정하지 않으면 전체 텍스트 인덱스가 분할되지 않은 테이블의 경우 기본 테이블 또는 뷰와 같은 파일 그룹에 배치되고 분할된 테이블의 경우 주 파일 그룹에 배치됩니다.

  • CHANGE_TRACKING [ = ] { MANUAL | AUTO | OFF [ , NO POPULATION ] }
    SQL Server에서 전체 텍스트 인덱스가 적용되는 테이블 열의 변경 내용(업데이트, 삭제 또는 삽입)을 해당 전체 텍스트 인덱스로 전파할지 여부를 지정합니다. WRITETEXT 및 UPDATETEXT를 통한 데이터 변경 내용은 전체 텍스트 인덱스에 반영되지 않고 변경 내용 추적 시 선택되지도 않습니다.

    • MANUAL
      ALTER FULLTEXT INDEX … START UPDATE POPULATION Transact-SQL 문을 호출하면 추적된 변경 내용이 수동으로 전파되도록 지정합니다(수동 채우기). SQL Server 에이전트를 사용하여 이 Transact-SQL 문을 주기적으로 호출할 수 있습니다.

    • AUTO
      기본 테이블에서 데이터가 수정되면 추적된 변경 내용이 자동으로 전파되도록 지정합니다(자동 채우기). 변경 내용은 자동으로 전파되지만 전체 텍스트 인덱스에 즉시 반영되지 않을 수 있습니다. AUTO가 기본값입니다.

    • OFF [ , NO POPULATION]
      SQL Server에서 인덱싱된 데이터의 변경 내용 목록을 유지하지 않도록 지정합니다. NO POPULATION을 지정하지 않으면 SQL Server는 생성된 인덱스를 완전히 채웁니다.

      NO POPULATION 옵션은 CHANGE_TRACKING이 OFF일 경우에만 사용할 수 있습니다. NO POPULATION을 지정하면 SQL Server에서 인덱스를 만든 후 인덱스를 채우지 않습니다. 사용자가 ALTER FULLTEXT INDEX 명령에 START FULL POPULATION 또는 START INCREMENTAL POPULATION 절을 실행한 후에만 인덱스가 채워집니다.

  • STOPLIST [ = ] { OFF | SYSTEM | stoplist_name }
    전체 텍스트 중지 목록을 인덱스와 연결합니다. 이 인덱스는 지정된 중지 목록에 속한 토큰으로 채워지지 않습니다. STOPLIST를 지정하지 않으면 SQL Server이 시스템 전체 텍스트 중지 목록을 인덱스와 연결합니다.

    • OFF
      중지 목록을 전체 텍스트 인덱스와 연결하지 않도록 지정합니다.

    • SYSTEM
      기본 전체 텍스트 시스템 STOPLIST가 이 전체 텍스트 인덱스에 사용되도록 지정합니다.

    • stoplist_name
      전체 텍스트 인덱스와 연결할 중지 목록의 이름을 지정합니다.

주의

전체 텍스트 인덱스에 대한 자세한 내용은 데이터베이스에 대한 전체 텍스트 카탈로그 및 인덱스 구성을 참조하십시오.

xml 열에서는 XML 요소의 내용을 인덱싱하지만 XML 태그는 무시하는 전체 텍스트 인덱스를 만들 수 있습니다. 특성 값은 숫자 값이 아니면 전체 텍스트 인덱싱됩니다. 요소 태그는 토큰 경계로 사용됩니다. 여러 언어를 포함하는 올바른 형식의 XML 또는 HTML 문서와 조각이 지원됩니다. 자세한 내용은 XML 열의 전체 텍스트 인덱스를 참조하십시오.

인덱스 키 열에는 정수 데이터 형식을 사용하는 것이 좋습니다. 이렇게 하면 쿼리 실행 시간이 최적화됩니다.

변경 내용 추적과 NO POPULATION 매개 변수 간의 상호 작용

전체 텍스트 인덱스가 채워지는지 여부는 변경 내용 추적이 설정되어 있는지 여부와 ALTER FULLTEXT INDEX 문에 WITH NO POPULATION이 지정되어 있는지 여부에 따라 달라집니다. 다음 표에서는 이러한 상호 작용의 결과를 요약합니다.

변경 내용 추적

WITH NO POPULATION

결과

설정 안 됨

지정 안 됨

인덱스에 대해 전체 채우기가 수행됩니다.

설정 안 됨

지정됨

ALTER FULLTEXT INDEX...START POPULATION 문이 실행될 때까지 인덱스 채우기가 발생하지 않습니다.

설정됨

지정됨

오류가 발생하고 인덱스가 변경되지 않습니다.

설정됨

지정 안 됨

인덱스에 대해 전체 채우기가 수행됩니다.

전체 텍스트 인덱스에 대한 자세한 내용은 전체 텍스트 인덱스 채우기를 참조하십시오.

사용 권한

사용자는 전체 텍스트 카탈로그에 대한 REFERENCES 권한과 테이블 뷰 또는 인덱싱된 뷰에 대한 ALTER 권한이 있거나 sysadmin 고정 서버 역할, db_owner 또는 db_ddladmin 고정 데이터베이스 역할의 멤버여야 합니다.

SET STOPLIST가 지정된 경우 사용자가 지정된 중지 목록에 대한 REFERENCES 권한이 있어야 합니다. 이 권한은 STOPLIST의 소유자가 부여할 수 있습니다.

[!참고]

public에는 SQL Server의 기본 중지 목록에 대한 REFERENCE 권한이 부여됩니다.

1. 고유 인덱스, 전체 텍스트 카탈로그 및 전체 텍스트 인덱스 만들기

다음 예에서는 AdventureWorks 예제 데이터베이스의 HumanResources.JobCandidate 테이블에 있는 JobCandidateID 열에 대한 고유 인덱스를 만듭니다. 그런 다음 기본 전체 텍스트 카탈로그 ft를 만듭니다. 마지막으로 ft 카탈로그 및 시스템 중지 목록을 사용하여 Resume 열에 대한 전체 텍스트 인덱스를 만듭니다.

USE AdventureWorks;
GO
CREATE UNIQUE INDEX ui_ukJobCand ON HumanResources.JobCandidate(JobCandidateID);
CREATE FULLTEXT CATALOG ft AS DEFAULT;
CREATE FULLTEXT INDEX ON HumanResources.JobCandidate(Resume) 
   KEY INDEX ui_ukJobCand 
   WITH STOPLIST = SYSTEM;
GO

2. 여러 테이블 열에 대한 전체 텍스트 인덱스 만들기

다음 예에서는 AdventureWorks 예제 데이터베이스의 Production.ProductReview 테이블에 있는 ReviewerName, EmailAddress 및 Comments 열에 대한 전체 텍스트 인덱스를 만듭니다. 이 예에서는 각 열에 대해 해당 열의 데이터 언어인 영어의 LCID 1033을 지정합니다. 이 전체 텍스트 인덱스는 기본 전체 텍스트 카탈로그 및 기존 고유 키 인덱스 PK_ProductReview_ProductReviewID를 사용합니다. 권장한 대로 이 인덱스 키는 정수 열 ProductReviewID에 있습니다.

USE AdventureWorks;
GO
CREATE FULLTEXT INDEX ON Production.ProductReview
( 
  ReviewerName
     Language 1033,
  EmailAddress
     Language 1033,
  Comments 
     Language 1033     
 ) 
KEY INDEX PK_ProductReview_ProductReviewID ; 
GO

3. 전체 텍스트 인덱스를 채우지 않고 만들기

다음 예에서는 AdventureWorks 예제 데이터베이스에 전체 텍스트 카탈로그 documents_catalog를 만듭니다. 그런 다음 이 새 카탈로그를 사용하는 전체 텍스트 인덱스를 만듭니다. 이 전체 텍스트 인덱스는 Production.Document 테이블의 Document 열에 있습니다. 이 예에서는 열의 데이터 언어인 영어의 LCID 1033을 지정합니다. 이 전체 텍스트 인덱스는 기본 전체 텍스트 카탈로그 및 기존 고유 키 인덱스 PK_Document_DocumentID를 사용합니다. 권장한 대로 이 인덱스 키는 정수 열 DocumentID에 있습니다. 이 예에서는 채우기 작업을 수행하지 않고 변경 내용 추적이 해제되도록 지정하며 나중에 사용률이 낮은 시간에 ALTER FULLTEXT INDEX 문을 사용하여 새 인덱스에 대해 전체 채우기를 시작하고 자동 변경 내용 추적을 사용하도록 설정합니다.

USE AdventureWorks;
GO
CREATE FULLTEXT CATALOG documents_catalog;
GO
CREATE FULLTEXT INDEX ON Production.Document
( Document 
    TYPE COLUMN FileExtension
    Language 1033 )
   KEY INDEX PK_Document_DocumentID
      ON documents_catalog
      WITH CHANGE_TRACKING OFF, NO POPULATION;
   GO

다음과 같이 나중에 사용률이 낮은 시간에 인덱스를 채웁니다.

ALTER FULLTEXT INDEX ON Production.Document SET CHANGE_TRACKING AUTO;
GO

변경 내역

업데이트된 내용

"예" 섹션에 다른 예를 추가했습니다.

"변경 내용 추적과 NO POPULATION 매개 변수 간의 상호 작용" 섹션을 추가했습니다.