이 문서는 지원되지 않는 PostgreSQL 버전에 대한 것입니다.
다음에 대한 동일한 페이지를 보고 싶을 수도 있습니다.PostgreSQL : 문서 : 17 : 9.4. 스포츠 토토 결과 함수 및 연산자버전 또는 위에 나열된 다른 지원 버전 중 하나를 사용하세요.

9.4. 문자열 함수 및 연산자

이 섹션에서는 검사를 위한 함수와 연산자를 설명합니다. 문자열 값을 조작합니다. 이 컨텍스트의 문자열에는 다음이 포함됩니다. 유형의 값문자, 문자 다양텍스트. 별도로 명시하지 않는 한 아래 나열된 모든 기능은 다음에서 작동합니다. 이러한 모든 유형이 있지만 자동으로 발생할 수 있는 잠재적인 영향에 주의하세요. 를 사용할 때 공백 채우기문자유형. 일부 함수는 비트 문자열에도 기본적으로 존재합니다. 유형.

SQL일부 문자열을 정의합니다. 쉼표 대신 키워드를 사용하여 구분하는 함수 인수. 자세한 내용은 다음을 참조하세요.표 9-6. PostgreSQL또한 제공 일반 함수를 사용하는 이러한 함수 버전 호출 구문(참조테이블 9-7).

참고:이전포스트그레SQL8.3, 이 함수는 문자열이 아닌 여러 데이터 유형의 값을 다음과 같이 자동으로 허용합니다. 글쎄, 그 사람들의 암묵적인 강압이 존재하기 때문에 데이터 유형텍스트. 그 강요는 종종 놀라움을 불러일으키기 때문에 제거되었습니다. 행동. 그러나 문자열 연결 연산자는 (||)은 여전히 문자열이 아닌 입력을 허용합니다. 표시된 대로 하나 이상의 입력이 문자열 유형인 경우 에서테이블 9-6. 다른 경우에는 명시적인 강제를 삽입하세요.텍스트복제해야 하는 경우 이전 동작.

표 9-6.SQL문자열 함수 및 연산자

기능 반환 유형 설명 결과
문자열 || 문자열 텍스트 문자열 연결 '게시물' || 'greSQL' PostgreSQL
문자열 || 비문자열또는비문자열 || 문자열 텍스트 문자열이 아닌 입력 하나와 문자열 연결 '값: ' || 42 값: 42
bit_length(문자열) int 문자열의 비트 수 bit_length('호세') 32
문자_길이(문자열)또는문자_길이(문자열) int 문자열의 문자 수 char_length('호세') 4
하위(문자열) 텍스트 문자열을 소문자로 변환 하위('TOM')
옥텟_길이(문자열) int 문자열의 바이트 수 octet_length('호세') 4
오버레이(문자열배치문자열fromint [forint]) 텍스트 하위 문자열 교체 overlay('Txxxxas'가 'hom'을 배치함 2대4부터) 토마스
위치(하위 문자열in문자열) int 지정된 하위 문자열의 위치 위치('om' in '토마스') 3
하위 문자열(문자열 [fromint] [forint]) 텍스트 하위 문자열 추출 substring(2의 '토마스' for 2 3)
하위 문자열(문자열from패턴) 텍스트 POSIX 정규 표현식과 일치하는 하위 문자열을 추출합니다. 참조섹션 9.7용 패턴 일치에 대한 자세한 내용을 참조하세요. substring('토마스' from '...$') 마스
하위 문자열(문자열from패턴for탈출) 텍스트 일치하는 하위 문자열 추출SQL정규 표현식. 참조섹션 9.7더 보기 패턴 매칭에 대한 정보입니다. substring('토마스' from '#'의 경우 '%#"o_a#"_') 오마
트림([리딩 | 후행 | 둘 다] [문자] 에서문자열) 텍스트 다음만 포함하는 가장 긴 문자열을 제거합니다.문자(공백 기본값)의 시작/끝/양쪽 끝에서문자열 trim(둘 다 'x' 'xTomxx')
상위(문자열) 텍스트 문자열을 대문자로 변환 어퍼('톰')

추가 문자열 조작 기능을 사용할 수 있으며 에 나열됨표 9-7. 그 중 일부는 내부적으로 다음을 구현하는 데 사용됩니다.SQL-다음에 나열된 표준 문자열 함수테이블 9-6.

표 9-7. 기타 문자열 함수

기능 반환 유형 설명 결과
아스키(문자열) int ASCII코드 인수의 첫 번째 문자입니다. 에 대한UTF8유니코드 코드 포인트를 반환합니다. 캐릭터의. 다른 멀티바이트 인코딩의 경우 인수는 다음과 같아야 합니다.ASCII문자. ascii('x') 120
btrim(문자열 텍스트 [, 문자 텍스트]) 텍스트 다음으로 구성된 가장 긴 문자열을 제거합니다. 문자문자(a 기본적으로 공백) 시작과 끝에서문자열 btrim('xyxtrimyyx', 'xy') 트림
문자(int) 텍스트 주어진 코드를 가진 문자. 에 대한UTF8인수는 다음과 같이 처리됩니다. 유니코드 코드 포인트. 다른 멀티바이트 인코딩의 경우 인수는를 지정해야 합니다.ASCII문자. 널(0) 텍스트 데이터 유형은 문자를 사용할 수 없으므로 문자는 허용되지 않습니다. 그러한 바이트를 저장하십시오. 문자(65) A
연결(str "아무거나" [, str "아무거나" [, ...] ]) 텍스트 모든 인수를 연결합니다. NULL 인수는 다음과 같습니다. 무시됩니다. concat('abcde', 2, NULL, 22) abcde222
concat_ws(9월 텍스트, str "아무거나" [, str "아무거나" [, ...] ]) 텍스트 첫 번째 인수를 제외한 모든 인수를 구분 기호로 연결합니다. 첫 번째 매개변수는 구분 기호로 사용됩니다. NULL 인수는 무시됩니다. concat_ws(',', 'abcde', 2, NULL, 22) abcde,2,22
변환(문자열 바이테아, src_encoding 이름, dest_encoding 이름) 바이테아 문자열을 다음으로 변환dest_encoding. 원래 인코딩은 에 의해 지정됨src_encoding.문자열이 항목에서 유효해야 합니다. 인코딩. 전환은 다음과 같이 정의할 수 있습니다.전환 생성. 또한 일부가 있습니다 사전 정의된 변환. 참조표 9-8사용 가능한 변환에 대해. convert('text_in_utf8', 'UTF8', 'LATIN1') text_in_utf8다음으로 표시됨 Latin-1 인코딩(ISO 8859-1)
convert_from(문자열 바이테아, src_encoding 이름) 텍스트 문자열을 데이터베이스 인코딩으로 변환합니다. 원본 인코딩은 다음으로 지정됩니다.src_encoding.문자열이 항목에서 유효해야 합니다. 인코딩. convert_from('text_in_utf8', 'UTF8') text_in_utf8다음으로 표현됨 현재 데이터베이스 인코딩
convert_to(문자열 텍스트, dest_encoding 이름) 바이테아 문자열을 다음으로 변환dest_encoding. convert_to('일부 텍스트', 'UTF8') 일부 텍스트에 표시됨 UTF8 인코딩
디코드(문자열 텍스트, 형식 텍스트) 바이테아 다음의 텍스트 표현에서 바이너리 데이터를 디코딩문자열. 옵션:형식과 동일인코딩. 디코드('MTIzAAE=', 'base64') \x3132330001
인코드(데이터 바이테아, 형식 텍스트) 텍스트 바이너리 데이터를 텍스트 표현으로 인코딩합니다. 지원되는 형식은 다음과 같습니다.base64, 16진수, 탈출. 탈출0바이트와 높은 비트 세트 바이트를 8진수로 변환합니다. 시퀀스(\nnn) 및 백슬래시를 두 번 사용합니다. 인코드(E'123\\000\\001', 'base64') MTIzAAE=
형식(formatstr 텍스트 [, str "아무거나" [, ...] ]) 텍스트 문자열 형식을 지정합니다. 이 기능은 C와 유사합니다. 기능스프린트f; 하지만 단지 다음 변환 사양이 인식됩니다.%s보간 해당 인수를 문자열로;%I인수를 SQL로 이스케이프합니다. 식별자;%L이스케이프 SQL 리터럴로서의 인수;%%리터럴을 출력합니다%. 에이 변환은 명시적인 매개변수 위치를 참조할 수 있습니다. 변환 지정자 앞에를 추가하여n$, 여기서n인수입니다 위치. 또한 참조하세요예 39-1. format('안녕하세요 %s, %1$s', '세계') 안녕하세요 세계, 세계
initcap(문자열) 텍스트 각 단어의 첫 글자를 대문자로 변환 나머지는 소문자로 합니다. 단어는 일련의 영숫자가 아닌 문자로 구분된 영숫자 문자 문자. initcap('안녕 토마스') 안녕하세요 토마스
왼쪽(str 텍스트, n int) 텍스트 먼저 돌아가세요n문자열의 문자. 언제n음수입니다. 마지막을 제외하고 모두 반환합니다. |n| 문자. 왼쪽('abcde', 2) ab
길이(문자열) int 문자 수문자열 길이('호세') 4
길이(문자열 바이테아, 인코딩 이름 ) int 문자 수문자열주어진 내용에서인코딩.문자열이 항목에서 유효해야 합니다. 인코딩. length('호세', 'UTF8') 4
lpad(문자열 텍스트, 길이 int [, 채우기 텍스트]) 텍스트 채우세요문자열에 길이길이앞에 추가하여 캐릭터채우기(공백 기본적으로). 만약문자열이다 이미 다음보다 길다길이그러면 잘립니다(오른쪽). lpad('안녕', 5, 'xy') xyxhi
ltrim(문자열 텍스트 [, 문자 텍스트]) 텍스트 문자만 포함하는 가장 긴 문자열 제거 에서문자(공백 기본값)의 시작부터문자열 ltrim('zzzytrim', 'xyz') 트림
md5(문자열) 텍스트 다음의 MD5 해시를 계산합니다.문자열, 결과를 다음으로 반환합니다. 16진수 md5('abc') 900150983cd24fb0 d6963f7d28e17f72
pg_client_encoding() 이름 현재 클라이언트 인코딩 이름 pg_client_encoding() SQL_ASCII
quote_ident(문자열 텍스트) 텍스트 다음과 같이 사용되도록 적절하게 인용된 주어진 문자열을 반환합니다. 의 식별자SQL문 문자열. 견적은 필요한 경우에만 추가됩니다(즉, 문자열에 다음이 포함된 경우). 식별자가 아닌 문자이거나 대소문자가 구분됩니다). 포함된 따옴표는 올바르게 두 배로 표시됩니다. 또한 참조하세요예 39-1. quote_ident('푸바') "푸 바"
quote_literal(문자열 텍스트) 텍스트 다음과 같이 사용되도록 적절하게 인용된 주어진 문자열을 반환합니다. 의 문자열 리터럴SQL문 문자열. 임베디드 작은따옴표와 백슬래시는 올바르게 두 배가 됩니다. 참고 그quote_literal반환 널 입력 시 널; 인수가 null일 수 있는 경우,quote_nullable종종 더 적합합니다. 또한 참조하세요예 39-1. quote_literal(E'O\'라일리') 'O''라일리'
quote_literal( 모든 요소) 텍스트 주어진 값을 텍스트로 변환한 후 다음과 같이 인용합니다. 문자 그대로. 포함된 작은따옴표와 백슬래시는 다음과 같습니다. 제대로 두 배로 늘어났습니다. quote_literal(42.5) '42.5'
quote_nullable(문자열 텍스트) 텍스트 다음과 같이 사용되도록 적절하게 인용된 주어진 문자열을 반환합니다. 의 문자열 리터럴SQL문 문자열; 또는 만약 인수가 null이면 반환NULL. 포함된 작은따옴표와 백슬래시는 올바르게 사용됩니다. 두 배. 또한 참조하세요예 39-1. quote_nullable(NULL) NULL
quote_nullable( 모든 요소) 텍스트 주어진 값을 텍스트로 변환한 후 다음과 같이 인용합니다. 문자 그대로; 또는 인수가 null인 경우 반환NULL. 삽입된 작은따옴표 및 백슬래시는 올바르게 두 배가 됩니다. quote_nullable(42.5) '42.5'
regexp_matches(문자열 텍스트, 패턴 텍스트 [, 플래그 텍스트]) 텍스트 집합[] 다음으로 인해 캡처된 모든 하위 문자열을 반환합니다. POSIX 정규식과 일치하는문자열. 참조섹션 9.7.3더 많은 정보를 원하시면. regexp_matches('foobarbequebaz', '(바)(베크)') 바,베크
regexp_replace(문자열 텍스트, 패턴 텍스트, 교체 텍스트 [, 플래그 텍스트]) 텍스트 POSIX 일반과 일치하는 하위 문자열 교체 표현. 참조섹션 9.7.3자세한 정보는. regexp_replace('토마스', '.[mN]a.', 'M')
regexp_split_to_array(문자열 텍스트, 패턴 텍스트 [, 플래그 텍스트 ]) 텍스트[] 분할문자열POSIX 사용 정규 표현식을 구분 기호로 사용합니다. 참조섹션 9.7.3자세한 정보는. regexp_split_to_array('안녕하세요 세계', E'\\s+') 안녕하세요, 세상
regexp_split_to_table(문자열 텍스트, 패턴 텍스트 [, 플래그 텍스트]) 텍스트 집합 분할문자열POSIX 사용 정규 표현식을 구분 기호로 사용합니다. 참조섹션 9.7.3자세한 정보는. regexp_split_to_table('안녕하세요 세계', E'\\s+') 안녕하세요

세계

(2행)
반복(문자열 텍스트, 번호 int) 텍스트 반복문자열지정됨번호 반복('Pg', 4) PgPgPgPg
교체(문자열 텍스트, 에서 텍스트, 텍스트) 텍스트 다음의 모든 항목 바꾸기문자열하위 문자열from하위 문자열 포함 replace('abcdefabcdef', 'cd', 'XX') abXXefabXXef
역방향(str) 텍스트 역방향 문자열을 반환합니다. 역방향('abcde') edcba
맞습니다(str 텍스트, n int) 텍스트 마지막 반환n문자열의 문자. 언제n음수입니다. 첫 번째를 제외한 모두 반환 |n| 문자. 오른쪽('abcde', 2)
rpad(문자열 텍스트, 길이 int [, 채우기 텍스트]) 텍스트 채우세요문자열에 길이길이다음을 추가하여 문자채우기(공백 기본값). 만약문자열이다 이미 다음보다 길다길이그러면 잘립니다. rpad('안녕', 5, 'xy') hixyx
rtrim(문자열 텍스트 [, 문자 텍스트]) 텍스트 문자만 포함하는 가장 긴 문자열 제거 에서문자(공백 기본값)의 끝부터문자열 rtrim('trimxxxx', 'x') 트림
split_part(문자열 텍스트, 구분자 텍스트, 필드 int) 텍스트 분할문자열켜짐구분자그리고 주어진 필드를 반환합니다. (하나부터 계산) split_part('abc~@~def~@~ghi', '~@~', 2) def
strpos(문자열, 하위 문자열) int 지정된 하위 문자열의 위치(동일위치(하위 문자열문자열), 하지만 다음 사항에 유의하세요. 인수 순서가 반대임) strpos('높음', 'ig') 2
하위 문자열(문자열, 으로부터 [, 개수]) 텍스트 하위 문자열 추출(동일하위 문자열(문자열에서fromfor개수)) substr('알파벳', 3, 2) ph
to_ascii(문자열 텍스트 [, 인코딩 텍스트]) 텍스트 변환문자열ASCII다른 사람에게서 인코딩(다음의 변환만 지원함라틴어1, LATIN2, LATIN9WIN1250인코딩) to_ascii('카렐') 카렐
to_hex(번호 int또는비긴트) 텍스트 변환번호그쪽으로 동등한 16진수 표현 to_hex(2147483647) 7fffffff
번역(문자열 텍스트, 에서 텍스트, 텍스트) 텍스트 다음 문자문자열다음 문자와 일치함에서세트는 다음으로 대체됩니다. 의 해당 문자설정. 만일에서보다 깁니다, 추가 문자 발생 에서에서삭제되었습니다. translate('12345', '143', '도끼') a2x5

집계 함수도 참조string_aggin섹션 9.18.

표 9-8. 내장된 전환

변환 이름[a] 소스 인코딩 대상 인코딩
ascii_to_mic SQL_ASCII MULE_INTERNAL
ascii_to_utf8 SQL_ASCII UTF8
big5_to_euc_tw 빅5 EUC_TW
big5_to_mic 빅5 MULE_INTERNAL
big5_to_utf8 빅5 UTF8
euc_cn_to_mic EUC_CN MULE_INTERNAL
euc_cn_to_utf8 EUC_CN UTF8
euc_jp_to_mic EUC_JP MULE_INTERNAL
euc_jp_to_sjis EUC_JP SJIS
euc_jp_to_utf8 EUC_JP UTF8
euc_kr_to_mic EUC_KR MULE_INTERNAL
euc_kr_to_utf8 EUC_KR UTF8
euc_tw_to_big5 EUC_TW 빅5
euc_tw_to_mic EUC_TW MULE_INTERNAL
euc_tw_to_utf8 EUC_TW UTF8
gb18030_to_utf8 GB18030 UTF8
gbk_to_utf8 GBK UTF8
iso_8859_10_to_utf8 LATIN6 UTF8
iso_8859_13_to_utf8 LATIN7 UTF8
iso_8859_14_to_utf8 LATIN8 UTF8
iso_8859_15_to_utf8 LATIN9 UTF8
iso_8859_16_to_utf8 LATIN10 UTF8
iso_8859_1_to_mic 라틴어1 MULE_INTERNAL
iso_8859_1_to_utf8 라틴어1 UTF8
iso_8859_2_to_mic LATIN2 MULE_INTERNAL
iso_8859_2_to_utf8 LATIN2 UTF8
iso_8859_2_to_windows_1250 LATIN2 WIN1250
iso_8859_3_to_mic LATIN3 MULE_INTERNAL
iso_8859_3_to_utf8 LATIN3 UTF8
iso_8859_4_to_mic LATIN4 MULE_INTERNAL
iso_8859_4_to_utf8 LATIN4 UTF8
iso_8859_5_to_koi8_r ISO_8859_5 KOI8R
iso_8859_5_to_mic ISO_8859_5 MULE_INTERNAL
iso_8859_5_to_utf8 ISO_8859_5 UTF8
iso_8859_5_to_windows_1251 ISO_8859_5 WIN1251
iso_8859_5_to_windows_866 ISO_8859_5 WIN866
iso_8859_6_to_utf8 ISO_8859_6 UTF8
iso_8859_7_to_utf8 ISO_8859_7 UTF8
iso_8859_8_to_utf8 ISO_8859_8 UTF8
iso_8859_9_to_utf8 LATIN5 UTF8
johab_to_utf8 조하브 UTF8
koi8_r_to_iso_8859_5 KOI8R ISO_8859_5
koi8_r_to_mic KOI8R MULE_INTERNAL
koi8_r_to_utf8 KOI8R UTF8
koi8_r_to_windows_1251 KOI8R WIN1251
koi8_r_to_windows_866 KOI8R WIN866
koi8_u_to_utf8 KOI8U UTF8
mic_to_ascii MULE_INTERNAL SQL_ASCII
mic_to_big5 MULE_INTERNAL 빅5
mic_to_euc_cn MULE_INTERNAL EUC_CN
mic_to_euc_jp MULE_INTERNAL EUC_JP
mic_to_euc_kr MULE_INTERNAL EUC_KR
mic_to_euc_tw MULE_INTERNAL EUC_TW
mic_to_iso_8859_1 MULE_INTERNAL 라틴어1
mic_to_iso_8859_2 MULE_INTERNAL LATIN2
mic_to_iso_8859_3 MULE_INTERNAL LATIN3
mic_to_iso_8859_4 MULE_INTERNAL LATIN4
mic_to_iso_8859_5 MULE_INTERNAL ISO_8859_5
mic_to_koi8_r MULE_INTERNAL KOI8R
mic_to_sjis MULE_INTERNAL SJIS
mic_to_windows_1250 MULE_INTERNAL WIN1250
mic_to_windows_1251 MULE_INTERNAL WIN1251
mic_to_windows_866 MULE_INTERNAL WIN866
sjis_to_euc_jp SJIS EUC_JP
sjis_to_mic SJIS MULE_INTERNAL
sjis_to_utf8 SJIS UTF8
tcvn_to_utf8 WIN1258 UTF8
uhc_to_utf8 UHC UTF8
utf8_to_ascii UTF8 SQL_ASCII
utf8_to_big5 UTF8 빅5
utf8_to_euc_cn UTF8 EUC_CN
utf8_to_euc_jp UTF8 EUC_JP
utf8_to_euc_kr UTF8 EUC_KR
utf8_to_euc_tw UTF8 EUC_TW
utf8_to_gb18030 UTF8 GB18030
utf8_to_gbk UTF8 GBK
utf8_to_iso_8859_1 UTF8 라틴어1
utf8_to_iso_8859_10 UTF8 LATIN6
utf8_to_iso_8859_13 UTF8 LATIN7
utf8_to_iso_8859_14 UTF8 LATIN8
utf8_to_iso_8859_15 UTF8 LATIN9
utf8_to_iso_8859_16 UTF8 LATIN10
utf8_to_iso_8859_2 UTF8 LATIN2
utf8_to_iso_8859_3 UTF8 LATIN3
utf8_to_iso_8859_4 UTF8 LATIN4
utf8_to_iso_8859_5 UTF8 ISO_8859_5
utf8_to_iso_8859_6 UTF8 ISO_8859_6
utf8_to_iso_8859_7 UTF8 ISO_8859_7
utf8_to_iso_8859_8 UTF8 ISO_8859_8
utf8_to_iso_8859_9 UTF8 LATIN5
utf8_to_johab UTF8 조하브
utf8_to_koi8_r UTF8 KOI8R
utf8_to_koi8_u UTF8 KOI8U
utf8_to_sjis UTF8 SJIS
utf8_to_tcvn UTF8 WIN1258
utf8_to_uhc UTF8 UHC
utf8_to_windows_1250 UTF8 WIN1250
utf8_to_windows_1251 UTF8 WIN1251
utf8_to_windows_1252 UTF8 WIN1252
utf8_to_windows_1253 UTF8 WIN1253
utf8_to_windows_1254 UTF8 WIN1254
utf8_to_windows_1255 UTF8 WIN1255
utf8_to_windows_1256 UTF8 WIN1256
utf8_to_windows_1257 UTF8 WIN1257
utf8_to_windows_866 UTF8 WIN866
utf8_to_windows_874 UTF8 WIN874
windows_1250_to_iso_8859_2 WIN1250 LATIN2
windows_1250_to_mic WIN1250 MULE_INTERNAL
windows_1250_to_utf8 WIN1250 UTF8
windows_1251_to_iso_8859_5 WIN1251 ISO_8859_5
windows_1251_to_koi8_r WIN1251 KOI8R
windows_1251_to_mic WIN1251 MULE_INTERNAL
windows_1251_to_utf8 WIN1251 UTF8
windows_1251_to_windows_866 WIN1251 WIN866
windows_1252_to_utf8 WIN1252 UTF8
windows_1256_to_utf8 WIN1256 UTF8
windows_866_to_iso_8859_5 WIN866 ISO_8859_5
windows_866_to_koi8_r WIN866 KOI8R
windows_866_to_mic WIN866 MULE_INTERNAL
windows_866_to_utf8 WIN866 UTF8
windows_866_to_windows_1251 WIN866 승리
windows_874_to_utf8 WIN874 UTF8
euc_jis_2004_to_utf8 EUC_JIS_2004 UTF8
utf8_to_euc_jis_2004 UTF8 EUC_JIS_2004
shift_jis_2004_to_utf8 SHIFT_JIS_2004 UTF8
utf8_to_shift_jis_2004 UTF8 SHIFT_JIS_2004
euc_jis_2004_to_shift_jis_2004 EUC_JIS_2004 SHIFT_JIS_2004
shift_jis_2004_to_euc_jis_2004 SHIFT_JIS_2004 EUC_JIS_2004
참고:
a.변환 이름은 표준 명명 체계를 따릅니다. 모두 포함된 소스 인코딩의 공식 이름 영숫자가 아닌 문자는 밑줄로 대체됩니다. 이어서_to_, 그 다음에 유사하게 처리된 대상 인코딩 이름입니다. 그러므로, 이름이 관례적인 인코딩에서 벗어날 수 있습니다. 이름.