토토
는 Lexemes에서 악센트 (diacritic signs)를 제거하는 텍스트 검색 사전입니다. 필터링 사전으로, 사전의 정상적인 동작과 달리 출력이 항상 다음 사전 (있는 경우)으로 전달됩니다. 이를 통해 전체 텍스트 검색을위한 악센트 감민 처리가 가능합니다.
현재의 구현토토
정상화 사전으로 사용할 수 없습니다.THESAURUS
사전.
이 모듈이 고려됩니다“신뢰할 수있는”Create
현재 데이터베이스의 권한.
anunccent
사전은 다음 옵션을 수락합니다.
규칙
는 번역 규칙 목록을 포함하는 파일의 기본 이름입니다. 이 파일은에 저장해야합니다.$ sharedir/tsearch_data/
(where$ sharedir
의미토토설치의 공유 데이터 디렉토리). 그 이름은 끝나야합니다.RULES
(에 포함되지 않아야합니다규칙
매개 변수).
규칙 파일에는 다음 형식이 있습니다.
각 줄은 하나의 번역 규칙을 나타냅니다. 첫 번째는 두 번째로 번역됩니다. 예를 들어,
à a Á a  a  a ä a Å a Æ ae
두 토토는 공백으로 분리되어야하며, 라인의 선두 또는 후행 공백은 무시됩니다.
또는 한 줄에 한 토토 만 주어지면 해당 토토의 인스턴스가 삭제됩니다. 이것은 악센트가 별도의 토토로 표시되는 언어에 유용합니다.
실제로, 각각“캐릭터”whitespace를 포함하지 않는 토토열 일 수 있으므로토토
사전은 diacritic 제거 외에 다른 종류의 기판 치환에 사용될 수 있습니다.
다른 것과 마찬가지로토토텍스트 검색 구성 파일, 규칙 파일은 UTF-8 인코딩에 저장해야합니다. 데이터는로드시 현재 데이터베이스의 인코딩으로 자동으로 변환됩니다. 변형 할 수없는 문자가 포함 된 모든 줄은 조용히 무시되므로 규칙 파일은 현재 인코딩에 적용 할 수없는 규칙을 포함 할 수 있습니다.
대부분의 유럽 언어에 직접 유용한 더 완전한 예는 찾을 수 있습니다.토토.rules
,$ sharedir/tsearch_data/
언제토토
모듈이 설치되었습니다. 이 규칙 파일은 악센트가있는 문자를 악센트가없는 동일한 문자로 변환하며, 동등한 일련의 간단한 문자 (예 : Æ에서 Ae)로 인대를 확장합니다..
설치토토
확장자 텍스트 검색 템플릿을 만듭니다토토
및 사전토토
기준. 그만큼토토
Dictionary는 기본 매개 변수 설정이 있습니다규칙 = 'unccent'
, 표준으로 즉시 사용할 수있게합니다토토.rules
파일. 원한다면 매개 변수를 변경할 수 있습니다 (예 :
mydb =# Alter Text 검색 사전 토토 (Rules = 'my_rules');
또는 템플릿을 기반으로 새로운 사전 생성.
사전을 테스트하려면 시도 할 수 있습니다.
mydb =# ts_lexize ( '토토', 'Hôtel'); ts_lexize ---------- 호텔
삽입 방법을 보여주는 예가 있습니다토토
텍스트 검색 구성으로의 사전 :
mydb =# 텍스트 검색 구성 fr (copy = french); mydb =# 텍스트 검색 구성 fr hword, hword_part, word의 Alter 매핑 비한이없는 프랑스어; mydb =# select to_tsvector ( 'fr', 'hôtels de la mer'); to_tsvector -------------------- '호텔': 1 'mer': 4 (1 줄) mydb =# select to_tsvector ( 'fr', 'hôtel de la mer') @@ to_tsquery ( 'fr', 'Hotels'); ?열? --------- 티 (1 줄) mydb =# select ts_headline ( 'fr', 'hôtel de la mer', to_tsquery ( 'fr', 'Hotels')); ts_headline ------------------------- <b Hôtel </b de la mer (1 행)
토토에 올바르지 않은 내용이 있으면 일치하지 않습니다. 특정 기능에 대한 귀하의 경험 또는 추가 설명이 필요합니다. 사용이 양식토토 문제를보고하려면