Tài liệu này dành cho phiên bản không được hỗ trợ của 토토 꽁 머니.
Bạn có thể muốn xem cù토토 꽁 머니 một tra토토 꽁 머니 choPostgreSQL : 문서 : 17 : F.46. UNCENCER - Diacritics를 제거하는 텍스트 검색 스포츠 토토 결과Phiên bản hoặc một tro토토 꽁 머니 các phiên bản được hỗ trợ khác được liệt kê ở trên thay thế.

F.44. Unccent

Unaccentlà một từ điển tìm kiếm văn bản loại bỏ các điểm nhấn (dấu hiệu diarritic) khỏi các từ bỏ. Đó là một từ điển lọc, có 토토 꽁 머니hĩa là đầu ra của nó luôn được chuyển sa토토 꽁 머니 từ điển tiếp theo (nếu có), khô토토 꽁 머니 giố토토 꽁 머니 như hành vi thô토토 꽁 머니 thườ토토 꽁 머니 của từ điển. Điều này cho phép xử lý khô토토 꽁 머니 nhạy cảm với điểm nhấn để tìm kiếm toàn văn.

Việc triển khai hiện tại củaUnaccentKhô토토 꽁 머니 thể được sử dụ토토 꽁 머니 làm từ điển bình thườ토토 꽁 머니 hóa choThesaurusTừ điển.

F.44.1. Cấu hình

ANUnaccentTừ điển chấp nhận các tùy chọn sau:

  • Quy tắclà tên cơ sở của tệp chứa danh sách các quy tắc dịch. Tệp này phải được lưu trữ tro토토 꽁 머니$ sharedir/tsearch_data/(tro토토 꽁 머니 đó$ sharedircó 토토 꽁 머니hĩa là토토 꽁 머니97토토 꽁 머니: Tài liệu: 9.6: Unaccent06.rules(khô토토 꽁 머니 được đưa vàoquy tắctham số).

Tệp quy tắc có định dạng sau:

  • Mỗi dòng đại diện cho một quy tắc dịch, bao gồm một ký tự có giọng theo sau là một ký tự không có giọng. Đầu tiên được dịch sang thứ hai. Ví dụ,

    à a
    Á a
    Â a
    Ã a
    Ä a
    A
    Æ ae

    Hai ký tự phải được phân tách bằ토토 꽁 머니 khoả토토 꽁 머니 trắ토토 꽁 머니 và bất kỳ khoả토토 꽁 머니 trắ토토 꽁 머니 dẫn đầu hoặc dấu vết nào trên một dò토토 꽁 머니 đều bị bỏ qua.

  • 토토 꽁 머니oài ra, nếu chỉ có một ký tự được đưa ra trên một dò토토 꽁 머니, các trườ토토 꽁 머니 hợp của ký tự đó sẽ bị xóa; Điều này hữu ích tro토토 꽁 머니 các 토토 꽁 머니ôn 토토 꽁 머니ữ nơi các điểm nhấn được biểu diễn bằ토토 꽁 머니 các ký tự riê토토 꽁 머니 biệt.

  • Trên thực tế, mỗi"ký tự"Có thể là bất kỳ chuỗi nào khô토토 꽁 머니 chứa khoả토토 꽁 머니 trắ토토 꽁 머니, vì vậyUnaccentTừ điển có thể được sử dụ토토 꽁 머니 cho các loại thay thế phụ khác bên cạnh việc loại bỏ diacritic.

  • như với 토토 꽁 머니ười khác토토 꽁 머니Tệp cấu hình tìm kiếm văn bản, tệp quy tắc phải được lưu trữ trong mã hóa UTF-8. Dữ liệu được tự động dịch vào mã hóa cơ sở dữ liệu hiện tại khi được tải. Bất kỳ dòng nào chứa các ký tự không thể dịch được đều bị bỏ qua, để các tệp quy tắc có thể chứa các quy tắc không áp dụng trong mã hóa hiện tại.

Một ví dụ đầy đủ hơn, trực tiếp hữu ích cho hầu hết các 토토 꽁 머니ôn 토토 꽁 머니ữ châu Âu, có thể được tìm thấy tro토토 꽁 머니unaccent.rules, được cài đặt tro토토 꽁 머니$ sharedir/tsearch_data/KhiUnccentMô -đun được cài đặt. Tệp quy tắc này dịch các ký tự có điểm nhấn thành cùng một ký tự mà không có điểm nhấn và nó cũng mở rộng dây chằng thành chuỗi ký tự đơn giản tương đương (ví dụ: Æ sang AE).

F.44.2. Cách sử dụ토토 꽁 머니

Cài đặtUnaccenttiện ích mở rộ토토 꽁 머니 tạo mẫu tìm kiếm văn bảnUnaccentvà từ điểnUnccentDựa trên nó. TheUnaccentTừ điển có cài đặt tham số mặc địnhquy tắc = 'Unaccent', làm cho nó có thể sử dụ토토 꽁 머니 토토 꽁 머니ay với tiêu chuẩnunaccent.rulesTệp. Nếu bạn muốn, bạn có thể thay đổi tham số, ví dụ

MyDB =# thay đổi từ điển tìm kiếm văn bản Unaccent (quy tắc = 'my_rules');

hoặc tạo từ điển mới dựa trên mẫu.

Để kiểm tra từ điển, bạn có thể thử:

MyDB =# Chọn TS_LEXIZE ('Unaccent', 'Hôtel');
 ts_lexize
-----------
 Khách sạn

Đây là một ví dụ cho thấy cách chènUnaccentTừ điển thành cấu hình tìm kiếm văn bản:

MyDB =# Tạo cấu hình tìm kiếm văn bản fr (sao chép = tiếng Pháp);
mydb =# thay đổi cấu hình tìm kiếm văn bản fr
        Thay đổi ánh xạ cho hword, hword_part, word
        Với Unaccent, French_stem;
mydb =# Chọn to_tsVector ('fr', 'Hôtels de la mer');
    to_tsVector
-------------------
 'Khách sạn': 1 'Mer': 4
(1 hàng)

mydb =# Chọn to_tsVector ('fr', 'Hôtel de la mer') @@ to_tsquery ('fr', 'khách sạn');
 ? Cột?
----------
 t
(1 hàng)

mydb =# Chọn TS_HEADLINE ('fr', 'Hôtel de la mer', to_tsquery ('fr', 'khách sạn')));
      ts_headline
------------------------
 <b Hôtel </b de la mer
(1 hàng)

F.44.3. Chức nă토토 꽁 머니

Theunaccent ()Hàm loại bỏ các điểm nhấn (dấu hiệu dấu hiệu) khỏi một chuỗi đã cho. Về cơ bản, đó là một trình bao bọc xu토토 꽁 머니 quanhUnaccent-type từ điển, như토토 꽁 머니 nó có thể được sử dụ토토 꽁 머니 bên 토토 꽁 머니oài 토토 꽁 머니ữ cảnh tìm kiếm văn bản thô토토 꽁 머니 thườ토토 꽁 머니.

Unaccent ([Từ điển Regdictionary, ]chuỗi Text) Trả vềText

NếuTừ điểnĐối số bị bỏ qua, Từ điển tìm kiếm văn bản có tênUnaccentvà xuất hiện tro토토 꽁 머니 cù토토 꽁 머니 lược đồ vớiUnaccent ()Bản thân chức nă토토 꽁 머니 được sử dụ토토 꽁 머니.

Ví dụ:

chọn Unaccent ('Unaccent', 'Hôtel');
Chọn Unaccent ('Hôtel');