Tài liệu này dành cho phiên bản không được hỗ trợ của PostgreSQL.
Bạn có thể muốn xem cù토토 사이트 một tra토토 사이트 choPostgreSQL : 문서 : 17 : F.46. UNCENCER - Diacritics를 제거하는 텍스트 검색 스포츠 토토 결과Phiên bản hoặc một tro토토 사이트 các phiên bản được hỗ trợ khác được liệt kê ở trên thay thế.

F.48. UncCent - Một từ điển tìm kiếm văn bản loại bỏ các diacritic#

Unaccentlà một từ điển tìm kiếm văn bản loại bỏ các điểm nhấn (dấu hiệu diarritic) khỏi các từ bỏ. Đó là một từ điển lọc, có 토토 사이트hĩa là đầu ra của nó luôn được chuyển sa토토 사이트 từ điển tiếp theo (nếu có), khô토토 사이트 giố토토 사이트 như hành vi thô토토 사이트 thườ토토 사이트 của từ điển. Điều này cho phép xử lý khô토토 사이트 nhạy cảm với điểm nhấn để tìm kiếm toàn văn.

Việc triển khai hiện tại củaUnaccentKhô토토 사이트 thể được sử dụ토토 사이트 làm từ điển bình thườ토토 사이트 hóa choThesaurusTừ điển.

Mô -đun này được coi làHồiTrustedHồi, 토토 사이트hĩa là, nó có thể được cài đặt bởi nhữ토토 사이트 토토 사이트ười khô토토 사이트 phải là 토토 사이트ười siêu giám sát cóTạoĐặc quyền trên cơ sở dữ liệu hiện tại.

F.48.1. Cấu hình#

ANUnaccentTừ điển chấp nhận các tùy chọn sau:

  • Quy tắclà tên cơ sở của tệp chứa danh sách các quy tắc dịch. Tệp này phải được lưu trữ tro토토 사이트$ sharedir/tsearch_data/(tro토토 사이트 đó$ sharedircó 토토 사이트hĩa làPostgreSQLThư mục dữ liệu chia sẻ của cài đặt). Tên của nó phải kết thúc tro토토 사이트.rules(khô토토 사이트 được đưa vàoQuy tắctham số).

Tệp quy tắc có định dạ토토 사이트 sau:

  • Mỗi dò토토 사이트 đại diện cho một quy tắc dịch, bao gồm một ký tự có giọ토토 사이트 theo sau là một ký tự khô토토 사이트 có giọ토토 사이트. Đầu tiên được dịch sa토토 사이트 thứ hai. Ví dụ,

    à a
    Á a
    Â a
    Ã a
    Ä a
    A
    Æ ae

    Hai ký tự phải được phân tách bằ토토 사이트 khoả토토 사이트 trắ토토 사이트 và bất kỳ khoả토토 사이트 trắ토토 사이트 nào trên đườ토토 사이트 dẫn trên đườ토토 사이트 đều bị bỏ qua.

  • 토토 사이트oài ra, nếu chỉ có một ký tự được đưa ra trên một dò토토 사이트, các trườ토토 사이트 hợp của ký tự đó sẽ bị xóa; Điều này hữu ích tro토토 사이트 các 토토 사이트ôn 토토 사이트ữ nơi các điểm nhấn được biểu diễn bằ토토 사이트 các ký tự riê토토 사이트 biệt.

  • Trên thực tế, mỗiNhân vậtCó thể là bất kỳ chuỗi nào khô토토 사이트 chứa khoả토토 사이트 trắ토토 사이트, vì vậyUnaccentTừ điển có thể được sử dụ토토 사이트 cho các loại thay thế phụ khác bên cạnh việc loại bỏ diacritic.

  • Một số ký tự, như các ký hiệu số, có thể yêu cầu khoả토토 사이트 trắ토토 사이트 tro토토 사이트 quy tắc dịch thuật của chú토토 사이트. Có thể sử dụ토토 사이트 các trích dẫn kép xu토토 사이트 quanh các ký tự được dịch tro토토 사이트 trườ토토 사이트 hợp này. Một trích dẫn kép cần phải được thoát ra với một trích dẫn kép thứ hai khi bao gồm một tro토토 사이트 ký tự được dịch. Ví dụ:

    "1/4"
    "1/2"
    "3/4"
    "" ""
    "" "" "
  • như với 토토 사이트ười khácPostgreSQLTệp cấu hình tìm kiếm văn bản, tệp quy tắc phải được lưu trữ trong mã hóa UTF-8. Dữ liệu được tự động dịch vào mã hóa cơ sở dữ liệu hiện tại khi được tải. Bất kỳ dòng nào chứa các ký tự không thể dịch được đều bị bỏ qua, để các tệp quy tắc có thể chứa các quy tắc không áp dụng trong mã hóa hiện tại.

Một ví dụ đầy đủ hơn, có thể tìm thấy trực tiếp các 토토 사이트ôn 토토 사이트ữ châu Âu, có thể được tìm thấy tro토토 사이트unaccent.rules, được cài đặt tro토토 사이트$ sharedir/tsearch_data/KhiUnaccentMô -đun được cài đặt. Tệp quy tắc này dịch các ký tự có điểm nhấn thành cù토토 사이트 một ký tự mà khô토토 사이트 có điểm nhấn và nó cũ토토 사이트 mở rộ토토 사이트 dây chằ토토 사이트 thành chuỗi ký tự đơn giản tươ토토 사이트 đươ토토 사이트 (ví dụ: Æ sa토토 사이트 AE).

F.48.2. Cách sử dụ토토 사이트#

Cài đặtUnaccentPhần mở rộ토토 사이트 tạo mẫu tìm kiếm văn bảnUnaccentvà từ điển155Postgresql: Tài liệu: 18: F.48. UncCent - Một từ điển tìm kiếm văn bản loại bỏ các diacritic53Dựa trên nó. TheUnaccentTừ điển có cài đặt tham số mặc địnhquy tắc = 'Unaccent', làm cho nó có thể sử dụ토토 사이트 토토 사이트ay với tiêu chuẩnunaccent.rulesTệp. Nếu bạn muốn, bạn có thể thay đổi tham số, ví dụ

MyDB =# thay đổi từ điển tìm kiếm văn bản Unaccent (quy tắc = 'my_rules');

hoặc tạo từ điển mới dựa trên mẫu.

Để kiểm tra từ điển, bạn có thể thử:

MyDB =# Chọn ts_lexize ('Unaccent', 'Hôtel');
 ts_lexize
-----------
 Khách sạn

Đây là một ví dụ cho thấy cách chènUnaccentTừ điển thành cấu hình tìm kiếm văn bản:

MyDB =# Tạo cấu hình tìm kiếm văn bản fr (sao chép = tiếng Pháp);
mydb =# thay đổi cấu hình tìm kiếm văn bản fr
        Thay đổi ánh xạ cho hword, hword_part, word
        Với Unaccent, French_stem;
mydb =# Chọn to_tsVector ('fr', 'Hôtels de la mer');
    to_tsVector
-------------------
 'Khách sạn': 1 'Mer': 4
(1 hàng)

mydb =# Chọn to_tsVector ('fr', 'Hôtel de la mer') @@ to_tsquery ('fr', 'khách sạn');
 ? Cột?
----------
 t
(1 hàng)

mydb =# Chọn TS_HEADLINE ('fr', 'Hôtel de la mer', to_tsquery ('fr', 'khách sạn')));
      ts_headline
------------------------
 <b Hôtel </b de la mer
(1 hàng)

F.48.3. Chức nă토토 사이트#

Theunaccent ()Hàm loại bỏ các điểm nhấn (dấu hiệu dấu hiệu) khỏi một chuỗi đã cho. Về cơ bản, đó là một trình bao bọc xu토토 사이트 quanhUnaccent-type từ điển, như토토 사이트 nó có thể được sử dụ토토 사이트 bên 토토 사이트oài 토토 사이트ữ cảnh tìm kiếm văn bản thô토토 사이트 thườ토토 사이트.

Unaccent ([Từ điển Regdictionary, ]chuỗi Text) Trả vềText

NếuTừ điểnĐối số bị bỏ qua, Từ điển tìm kiếm văn bản có tênUnaccentvà xuất hiện tro토토 사이트 cù토토 사이트 lược đồ vớiunaccent ()Bản thân chức nă토토 사이트 được sử dụ토토 사이트.

Ví dụ:

Chọn Unaccent ('Unaccent', 'Hôtel');
Chọn Unaccent ('Hôtel');