사용자 정의 스포츠 토토 베트맨 검색 구성의 동작은 쉽게 혼란스러워. 이 섹션에 설명 된 기능은 다음과 같습니다 스포츠 토토 베트맨 검색 개체를 테스트하는 데 유용합니다. 당신은 완전한 것을 테스트 할 수 있습니다 구성 또는 파서 및 사전을 별도로 테스트합니다.
함수TS_DEBUG
허용
스포츠 토토 베트맨 검색 구성의 쉬운 테스트.
TS_DEBUG ([ config RegConfig, ]문서 스포츠 토토 베트맨,
밖으로alias 스포츠 토토 베트맨,
밖으로설명 스포츠 토토 베트맨,
밖으로토큰 스포츠 토토 베트맨,
밖으로Dictionaries RegDictionary [],
밖으로Dictionary Regdictionary,
밖으로lexemes 스포츠 토토 베트맨 [])
레코드를 반환
TS_DEBUG
정보를 표시합니다
모든 토큰에 대해문서파서에 의해 생성되고 구성된 사람에 의해 처리 된대로
사전. 에 지정된 구성을 사용합니다.config, 또는default_text_search_config그 주장이 있다면
생략.
TS_DEBUG
한 행을 반환합니다
각 토큰은 파서에 의해 스포츠 토토 베트맨에서 식별되었습니다. 열
반품은
alias 스포츠 토토 베트맨- 토큰 유형의 짧은 이름
설명 스포츠 토토 베트맨- 토큰 유형 설명
토큰 스포츠 토토 베트맨- 토큰의 스포츠 토토 베트맨
사전 RegDictionary []- 선택한 사전 이 토큰 유형의 구성
Dictionary RegDictionary- 인식 된 사전 토큰, 또는null없다면
Lexemes 스포츠 토토 베트맨 []- Lexeme (들)이 생성 한 lexeme 토큰을 인식 한 사전NULL아무것도하지 않았다면; 빈 배열 ()는 그것이 정지로 인식되었음을 의미합니다 단어
여기 간단한 예가 있습니다 :
선택 *에서 ts_debug에서 ( '영어', '뚱뚱한 고양이는 매트에 앉았습니다 - 뚱뚱한 쥐를 먹었습니다.); 별칭 | 설명 | 토큰 | 사전 | 사전 | Lexemes ------------+---------------------------------------------------------------------------- asciiword | 단어, 모든 ascii | A | English_Stem | English_stem | blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 지방 | English_Stem | English_stem | 지방 blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 고양이 | English_Stem | English_stem | 고양이 blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | SAT | English_Stem | English_stem | 앉았다 blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | on | English_Stem | English_stem | blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | A | English_Stem | English_stem | blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 매트 | English_Stem | English_stem | 매트 blank | 공간 기호 | | | | blank | 공간 기호 | - | | | asciiword | 단어, 모든 ascii | 그것은 | English_Stem | English_stem | blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | ate | English_Stem | English_stem | 먹었다 blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | A | English_Stem | English_stem | blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 지방 | English_Stem | English_stem | 지방 blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 쥐 | English_Stem | English_stem | 쥐
보다 광범위한 데모를 위해 먼저 A를 만듭니다.public.english구성 및 영어를위한 Ispell 사전 :
스포츠 토토 베트맨 검색 구성 contepiguration public.english (copy = pg_catalog.english); 스포츠 토토 베트맨 검색 사전 생성 English_ispell ( 템플릿 = ispell, dictfile = 영어, afffile = 영어, stopwords = 영어 ); Alter Text 검색 구성 public.english English_ispell, English_stem;로 asciiword의 Alter Mapping Alter Mapping
선택 *에서 ts_debug ( 'public.english', '가장 밝은 초신성'); 별칭 | 설명 | 토큰 | 사전 | 사전 | Lexemes -------------------------------------------------------------------------------------------------------------------------- asciiword | 단어, 모든 ascii | | English_ispell, English_Stem | English_ispell | blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 가장 밝은 | English_ispell, English_Stem | English_ispell | 밝은 blank | 공간 기호 | | | | asciiword | 단어, 모든 ascii | 초신성 | English_ispell, English_Stem | English_stem | supernova
이 예에서 단어Brightest파서에 의해ASCII 단어(별명asciiword). 이것을 위해 토큰 타입 사전 목록은English_ispellandEnglish_stem. 단어는에 의해 인정되었습니다.English_ispell명사Bright. 단어SupernovaesEnglish_ispell사전으로 전달되었습니다 다음 사전과 다행히도 인정되었습니다 (실제로English_stem는 눈덩이 사전입니다 모든 것을 인식합니다. 그래서 그것이 그에 배치 된 이유입니다 사전 목록의 끝).
단어theEnglish_ispelldictionary as a stop 단어 (섹션 12.6.1) 색인되지 않습니다. 공간이 버려집니다 또한 구성은 사전을 전혀 제공하지 않기 때문입니다 그들을 위해.
명시 적으로 출력 폭을 줄일 수 있습니다. 보고 싶은 열 지정 :
별명, 토큰, 사전, Lexemes를 선택하십시오 ts_debug ( 'public.english', '가장 밝은 초신성'); 별칭 | 토큰 | 사전 | Lexemes -----------+----------------------------------------- asciiword | | English_ispell | blank | | | asciiword | 가장 밝은 | English_ispell | 밝은 blank | | | asciiword | 초신성 | English_stem | supernova
다음 함수는 스포츠 토토 베트맨를 직접 테스트 할 수 있습니다 파서 검색.
TS_PARSE (parser_name 스포츠 토토 베트맨, 문서 스포츠 토토 베트맨, 밖으로Tokid 정수, out토큰 스포츠 토토 베트맨) 반환Setof RecordTS_PARSE (parser_oid OID, 문서 스포츠 토토 베트맨, 밖으로Tokid 정수, out토큰 스포츠 토토 베트맨) 반환Setof Record
TS_PARSE
주어진 주어진Document그리고 시리즈를 반환합니다
구문 분석에 의해 생성 된 각 토큰 당 하나의 기록. 각 레코드
포함Tokid지정된 표시
토큰 유형 및 A토큰토큰의 스포츠 토토 베트맨. 예를 들어:
선택 *에서 ts_parse ( 'default', '123- 숫자'); Tokid | 토큰 -------+-------- 22 | 123 12 | 12 | - 1 | 에이 12 | 1 | 숫자
TS_TOKEN_TYPE (parser_name 스포츠 토토 베트맨, outTOKID 정수, 밖으로alias 스포츠 토토 베트맨, out설명 스포츠 토토 베트맨) 반환기록 설정TS_TOKEN_TYPE (parser_oid OID, outTOKID Integer, 밖으로alias 스포츠 토토 베트맨, out설명 스포츠 토토 베트맨) 반환Setof Record
TS_TOKEN_TYPE
테이블을 반환합니다
지정된 파서가 할 수있는 각 유형의 토큰을 설명합니다.
인정하다. 각 토큰 유형에 대해 테이블은 정수를 제공합니다TOKID파서가 레이블을 붙이는 데 사용하는 것입니다
그 유형의 토큰,alias구성 명령에서 토큰 유형의 이름을 지정하고 짧은설명. 예를 들어:
선택 *에서 ts_token_type ( 'default'); Tokid | 별칭 | 설명 -------+---------------------------------------------------------------- 1 | asciiword | 단어, 모든 ascii 2 | 단어 | 단어, 모든 편지 3 | numword | 단어, 문자 및 숫자 4 | 이메일 | 이메일 주소 5 | url | URL 6 | 호스트 | 주인 7 | sfloat | 과학적 표기법 8 | 버전 | 버전 번호 9 | hword_numpart | 하이픈으로 된 단어 부분, 문자 및 숫자 10 | hword_part | 하이픈으로 된 단어 부분, 모든 글자 11 | hword_asciipart | 하이픈으로 된 단어 부품, 모든 ascii 12 | blank | 공간 기호 13 | 태그 | XML 태그 14 | 프로토콜 | 프로토콜 헤드 15 | numhword | 하이픈으로 된 단어, 글자 및 숫자 16 | asciihword | 하이픈으로 된 단어, 모든 ascii 17 | hword | 하이픈으로 된 단어, 모든 글자 18 | url_path | URL 경로 19 | 파일 | 파일 또는 경로 이름 20 | 플로트 | 소수점 표기법 21 | int | 서명 된 정수 22 | uint | 서명되지 않은 정수 23 | 엔티티 | XML 엔티티
thets_lexize
함수
사전 테스트를 용이하게합니다.
ts_lexize (dict RegDictionary, 토큰 스포츠 토토 베트맨23136_23148스포츠 토토 베트맨 []
ts_lexize
배열을 반환합니다
입력 인 경우 Lexemes토큰IS
사전에 알려져 있거나 토큰이있는 경우 빈 배열
사전에 알려져 있지만 중지 단어입니다.nullif it is an unknown word.
예 :
ts_lexize ( 'English_stem', 'stars')를 선택합니다. ts_lexize ---------- 별 ts_lexize ( 'English_stem', 'a')를 선택하십시오. ts_lexize ----------
참고 :the
ts_lexize
함수는 단일을 기대합니다토큰, 스포츠 토토 베트맨가 아닙니다. 여기에 있습니다 혼란 스러울 수있는 경우 :ts_lexize ( 'thesaurus_astro', 'supernovae stars')를 선택하십시오. ?열? --------- 티The Surus DictionaryThesaurus_astro문구를 알고 있습니다Supernovae Stars그러나
ts_lexize
구문 분석하지 않기 때문에 실패합니다 입력 스포츠 토토 베트맨는 단일 토큰으로 취급합니다. 사용Plainto_tsquery
또는to_tsvector
동의어 사전 테스트 사전, 예 :Plainto_tsquery ( 'Supernovae Stars')를 선택하십시오. Plainto_tsquery ------------------ 'sn'