| 윈 토토 : 문서 : 9.4 : 윈 토토 | |||
|---|---|---|---|
| PostgreSQL : 문서 : 9.4 : 토토 꽁 머니 예 | 스포츠 토토 결과 : 문서 : 9.4 : 전문 검색 | 12장. 전체 사설 토토 사이트 검색 | PostgreSQL : 문서 : 9.4 : 토토 베이 and Gin Index 유형 |
사용자 정의 사설 토토 사이트 검색 구성의 동작은 쉽게 혼란스러울 수 있습니다. 이 섹션에 설명된 기능은 사설 토토 사이트 검색 개체를 테스트하는 데 유용합니다. 전체 구성을 테스트하거나 파서 및 사전을 별도로 테스트할 수 있습니다.
함수ts_debug사설 토토 사이트 검색 구성을 쉽게 테스트할 수 있습니다.
ts_debug([ 구성 regconfig, ] 문서 사설 토토 사이트,
밖으로별칭 사설 토토 사이트,
밖으로설명 사설 토토 사이트,
밖으로토큰 사설 토토 사이트,
밖으로사전 등록사전[],
밖으로사전 regdictionary,
밖으로어휘 사설 토토 사이트[])
레코드 세트를 반환합니다.
ts_debug모든 토큰에 대한 정보를 표시합니다문서파서에 의해 생성되고 구성된 사전에 의해 처리됩니다. 다음에서 지정한 구성을 사용합니다.구성또는default_text_search_config해당 인수가 생략된 경우.
ts_debug파서가 사설 토토 사이트에서 식별한 각 토큰에 대해 하나의 행을 반환합니다. 반환된 열은 다음과 같습니다.
별칭 사설 토토 사이트— 토큰 유형의 짧은 이름
설명 사설 토토 사이트— 토큰 유형 설명
토큰 사설 토토 사이트— 토큰 사설 토토 사이트
사전 regdictionary[]— 이 토큰 유형에 대한 구성에 의해 선택된 사전
사전 regdictionary— 토큰을 인식한 사전, 또는NULL아무도 하지 않았다면
어휘 사설 토토 사이트[]— 토큰을 인식한 사전에서 생성된 어휘소, 또는NULL아무도 하지 않았다면; 빈 배열({})는 중지 단어로 인식되었음을 의미합니다.
다음은 간단한 예입니다:
SELECT * FROM ts_debug('english','a fat cat sat on a mat - it eat a fat rat');
별칭 | 설명 | 토큰 | 사전 | 사전 | 어휘소
---------+------+-------+---+---------------+---------
ASCII워드 | 단어, 모두 ASCII | | english_stem | 영어_줄기 |
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 지방 | english_stem | 영어_줄기 | 지방
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 고양이 | english_stem | 영어_줄기 | 고양이
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 토 | english_stem | 영어_줄기 | 앉았다
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 에 | english_stem | 영어_줄기 |
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | | english_stem | 영어_줄기 |
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 매트 | english_stem | 영어_줄기 | 매트
공백 | 공간 기호 | | | |
공백 | 공간 기호 | - | | |
ASCII워드 | 단어, 모두 ASCII | 그것 | english_stem | 영어_줄기 |
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 먹었다 | english_stem | 영어_줄기 | 먹었다
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | | english_stem | 영어_줄기 |
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 지방 | english_stem | 영어_줄기 | 지방
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 쥐 | english_stem | 영어_줄기 | 쥐
보다 광범위한 데모를 위해 먼저 다음을 만듭니다.public.english영어용 구성 및 Ispell 사전:
사설 토토 사이트 검색 구성 만들기 public.english ( COPY = pg_catalog.english );
사설 토토 사이트 검색 사전 만들기 english_ispell(
템플릿 = ispell,
DictFile = 영어,
AffFile = 영어,
StopWords = 영어
);
사설 토토 사이트 검색 구성 변경 public.english
english_ispell, english_stem을 사용하여 asciiword에 대한 매핑 변경;
SELECT * FROM ts_debug('public.english','가장 밝은 초신성');
별칭 | 설명 | 토큰 | 사전 | 사전 | 어휘소
---------+----+-------------+------------------+---+-------------
ASCII워드 | 단어, 모두 ASCII | | english_ispell,english_stem | english_ispell |
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 가장 밝다 | english_ispell,english_stem | english_ispell | 밝은
공백 | 공간 기호 | | | |
ASCII워드 | 단어, 모두 ASCII | 초신성 | english_ispell,english_stem | 영어_줄기 | 초신성
이 예에서는 단어가장 밝음파서가 다음과 같이 인식했습니다.ASCII 단어(별칭asciiword). 이 토큰 유형의 사전 목록은 다음과 같습니다.english_ispell그리고english_stem. 해당 단어는 다음에서 인식되었습니다.english_ispell, 이를 명사로 줄였습니다.밝다. 단어초신성알 수 없음english_ispell사전이므로 다음 사전으로 전달되었고 다행히 인식되었습니다(실제로는english_stem은 모든 것을 인식하는 Snowball 사전입니다. 이것이 사전 목록의 끝에 배치된 이유입니다.)
단어그다음에 의해 인식되었습니다.english_ispell불용어로서의 사전(섹션 12.6.1) 색인이 생성되지 않습니다. 구성에서 공백에 대한 사전을 전혀 제공하지 않기 때문에 공백도 삭제됩니다.
보려는 열을 명시적으로 지정하여 출력 너비를 줄일 수 있습니다:
별칭, 토큰, 사전, 어휘 선택
FROM ts_debug('public.english','가장 밝은 초신성');
별칭 | 토큰 | 사전 | 어휘소
---------+-------------+---+-------------
ASCII워드 | | english_ispell |
공백 | | |
ASCII워드 | 가장 밝다 | english_ispell | 밝은
공백 | | |
ASCII워드 | 초신성 | 영어_줄기 | 초신성다음 함수를 사용하면 사설 토토 사이트 검색 파서를 직접 테스트할 수 있습니다.
ts_parse(파서_이름 사설 토토 사이트, 문서 사설 토토 사이트,
밖으로토키드 정수, 아웃토큰 사설 토토 사이트) 반환레코드 집합ts_parse(parser_oid oid, 문서 사설 토토 사이트,
밖으로토키 정수, 아웃토큰 사설 토토 사이트) 반환레코드 집합
ts_parse주어진 내용을 분석합니다문서그리고 구문 분석을 통해 생성된 각 토큰에 대해 하나씩 일련의 레코드를 반환합니다. 각 레코드에는 다음이 포함됩니다.토키드할당된 토큰 유형 및 a를 표시토큰토큰의 사설 토토 사이트입니다. 예를 들어:
SELECT * FROM ts_parse('기본값', '123 - 숫자');
토키드 | 토큰
------+---------
22 | 123
12 |
12 | -
1 | 에이
12 |
1 | 숫자
ts_token_type(파서_이름 사설 토토 사이트, 아웃토키드 정수,
밖으로별칭 사설 토토 사이트, 아웃설명 사설 토토 사이트) 반환레코드 집합ts_token_type(parser_oid oid, 아웃토키드 정수,
밖으로별칭 사설 토토 사이트, 아웃설명 사설 토토 사이트) 반환레코드 집합
ts_token_type지정된 파서가 인식할 수 있는 각 토큰 유형을 설명하는 테이블을 반환합니다. 각 토큰 유형에 대해 표는 정수를 제공합니다.토키드파서가 해당 유형의 토큰에 라벨을 지정하는 데 사용하는별칭구성 명령에서 토큰 유형의 이름을 지정하고 짧은설명. 예를 들어:
SELECT * FROM ts_token_type('기본값');
토키드 | 별칭 | 설명
-----+------+--------------------------------------------
1 | ASCII워드 | 워드, 모두 ASCII
2 | 단어 | 단어, 모든 문자
3 | 숫자 | 단어, 문자, 숫자
4 | 이메일 | 이메일 주소
5 | URL | URL
6 | 호스트 | 주인
7 | 부유물 | 과학적 표기법
8 | 버전 | 버전 번호
9 | hword_numpart | 하이픈으로 연결된 단어 부분, 문자 및 숫자
10 | hword_part | 하이픈으로 연결된 단어 부분, 모든 문자
11 | hword_asciipart | 하이픈으로 연결된 단어 부분, 모두 ASCII
12 | 공백 | 공간 기호
13 | 태그 | XML 태그
14 | 프로토콜 | 프로토콜 헤드
15 | 숫자 | 하이픈으로 연결된 단어, 문자 및 숫자
16 | ASCII워드 | 하이픈으로 연결된 단어, 모두 ASCII
17 | 한워드 | 하이픈으로 연결된 단어, 모든 문자
18 | URL_경로 | URL 경로
19 | 파일 | 파일 또는 경로 이름
20 | 플로트 | 십진법
21 | 정수 | 부호 있는 정수
22 | 단위 | 부호 없는 정수
23 | 엔터티 | XML 엔터티그ts_lexize함수는 사전 테스트를 용이하게 합니다.
ts_lexize(dict regdictionary, 토큰 사설 토토 사이트) 반환사설 토토 사이트[]
ts_lexize입력된 경우 어휘 배열을 반환합니다.토큰사전에 알려져 있거나 토큰이 사전에 알려져 있지만 중지 단어인 경우 빈 배열입니다. 또는NULL알 수 없는 단어인 경우.
예:
SELECT ts_lexize('english_stem', '별');
ts_lexize
-----------
별
SELECT ts_lexize('english_stem', 'a');
ts_lexize
-----------
참고:그
ts_lexize함수는 단일을 기대합니다토큰, 사설 토토 사이트가 아닙니다. 다음은 혼란스러울 수 있는 경우입니다.SELECT ts_lexize('thesaurus_astro','초신성 별')은 null입니다. ?열? ---------- 티동의어 사전thesaurus_astro문구를 알고 있습니다초신성별하지만
ts_lexize입력 사설 토토 사이트를 구문 분석하지 않고 단일 토큰으로 처리하므로 실패합니다. 사용plainto_tsquery또는to_tsVector동의어 사전을 테스트하려면 다음과 같이 하세요.SELECT plainto_tsquery('초신성 별'); plainto_tsquery ----------------- 'sn'