F.48. Unccent

범퍼카 토토là một từ điển tìm kiếm văn bản loại bỏ các điểm nhấn (dấu hiệu diarritic) khỏi các từ bỏ. Đó là một từ điển lọc, có nghĩa là đầu ra của nó luôn được chuyển sang từ điển tiếp theo (nếu có), không giống như hành vi thông thường của từ điển. Điều này cho phép xử lý không nhạy cảm với điểm nhấn để tìm kiếm toàn văn.

Việc triển khai hiện tại của범퍼카 토토Không thể được sử dụng làm từ điển bình thường hóa choThesaurusTừ điển.

Mô -đun này được coi làHồiđáng tin cậyxông, nghĩa là, nó có thể được cài đặt bởi những người không giám sát cóTạoĐặc quyền trên cơ sở dữ liệu hiện tại.

F.48.1. Cấu hình

an범퍼카 토토Từ điển chấp nhận các tùy chọn sau:

  • Quy tắclà tên cơ sở của tệp chứa danh sách các quy tắc dịch. Tệp này phải được lưu trữ trong$ sharedir/tsearch_data/(trong đó$ sharedircó nghĩa làPostgreSQLThư mục dữ liệu chung của cài đặt). Tên của nó phải kết thúc trong.rules(không được bao gồm trongquy tắctham số).

Tệp quy tắc có định dạng sau:

  • Mỗi dòng đại diện cho một quy tắc dịch, bao gồm một ký tự có giọng theo sau là một ký tự không có giọng. Đầu tiên được dịch sang thứ hai. Ví dụ,

    à a
    Á a
    Â a
    Ã a
    Ä a
    A
    Æ ae

    Hai ký tự phải được phân tách bằng khoảng trắng và bất kỳ khoảng trắng dẫn đầu hoặc dấu vết nào trên một dòng đều bị bỏ qua.

  • Ngoài ra, nếu chỉ có một ký tự được đưa ra trên một dòng, các phiên bản của ký tự đó sẽ bị xóa; Điều này hữu ích trong các ngôn ngữ nơi các điểm nhấn được biểu diễn bằng các ký tự riêng biệt.

  • Trên thực tế, mỗiNhân vậtKhănCó thể là bất kỳ chuỗi nào không chứa khoảng trắng, vì vậy범퍼카 토토Từ điển có thể được sử dụng cho các loại thay thế phụ khác bên cạnh việc loại bỏ diacritic.

  • như với người khácPostgreSQLTệp cấu hình tìm kiếm văn bản, tệp quy tắc phải được lưu trữ trong mã hóa UTF-8. Dữ liệu được tự động dịch vào mã hóa cơ sở dữ liệu hiện tại khi được tải. Bất kỳ dòng nào chứa các ký tự không thể dịch được đều bị bỏ qua, để các tệp quy tắc có thể chứa các quy tắc không áp dụng trong mã hóa hiện tại.

Một ví dụ đầy đủ hơn, có thể tìm thấy trực tiếp cho hầu hết các ngôn ngữ châu Âu, có thể được tìm thấy trongunaccent.rules, được cài đặt trong$ sharedir/tsearch_data/Khi범퍼카 토토Mô -đun được cài đặt. Tệp quy tắc này dịch các ký tự có điểm nhấn thành cùng một ký tự mà không có điểm nhấn và nó cũng mở rộng dây chằng thành chuỗi các ký tự đơn giản tương đương (ví dụ: æ sang AE).

F.48.2. Cách sử dụng

Cài đặt범퍼카 토토tiện ích mở rộng tạo mẫu tìm kiếm văn bản범퍼카 토토và từ điển범퍼카 토토Dựa trên nó. The범퍼카 토토Từ điển có cài đặt tham số mặc địnhquy tắc = '범퍼카 토토', làm cho nó có thể sử dụng ngay với tiêu chuẩnunaccent.rulesTệp. Nếu bạn muốn, bạn có thể thay đổi tham số, ví dụ

MyDB =# thay đổi từ điển tìm kiếm văn bản 범퍼카 토토 (quy tắc = 'my_rules');

hoặc tạo từ điển mới dựa trên mẫu.

Để kiểm tra từ điển, bạn có thể thử:

MyDB =# Chọn TS_LEXIZE ('범퍼카 토토', 'Hôtel');
 ts_lexize
-----------
 Khách sạn

Đây là một ví dụ cho thấy cách chènUnccentTừ điển thành cấu hình tìm kiếm văn bản:

MyDB =# Tạo cấu hình tìm kiếm văn bản fr (sao chép = tiếng Pháp);
mydb =# thay đổi cấu hình tìm kiếm văn bản fr
        Thay đổi ánh xạ cho hword, hword_part, word
        Với 범퍼카 토토, French_stem;
mydb =# Chọn to_tsVector ('fr', 'Hôtels de la mer');
    to_tsVector
-------------------
 'Khách sạn': 1 'Mer': 4
(1 hàng)

mydb =# Chọn to_tsVector ('fr', 'Hôtel de la mer') @@ to_tsquery ('fr', 'khách sạn');
 ? Cột?
----------
 t
(1 hàng)

mydb =# Chọn TS_HEADLINE ('fr', 'Hôtel de la mer', to_tsquery ('fr', 'khách sạn')));
      ts_headline
------------------------
 <b Hôtel </b de la mer
(1 hàng)

F.48.3. Chức năng

The범퍼카 토토 ()Hàm loại bỏ các điểm nhấn (dấu hiệu dấu hiệu) khỏi một chuỗi đã cho. Về cơ bản, đó là một trình bao bọc xung quanh범퍼카 토토Từ điển -Type, nhưng nó có thể được sử dụng bên ngoài ngữ cảnh tìm kiếm văn bản thông thường.

범퍼카 토토 ([Từ điển Regdictionary, ]chuỗi Text) Trả vềText

NếuTừ điểnĐối số bị bỏ qua, Từ điển tìm kiếm văn bản có tên범퍼카 토토và xuất hiện trong cùng lược đồ với범퍼카 토토 ()Chức năng được sử dụng.

Ví dụ:

Chọn 범퍼카 토토 ('범퍼카 토토', 'Hôtel');
Chọn 범퍼카 토토 ('Hôtel');

Gửi hiệu chỉnh

Nếu bạn thấy bất cứ điều gì trong tài liệu không chính xác, không khớp Kinh nghiệm của bạn với tính năng cụ thể hoặc yêu cầu làm rõ thêm, Vui lòng sử dụngMẫu nàyĐể báo cáo vấn đề tài liệu.