정규표현식
: 정규표현식 또는 정규식은 특정한 규칙을 가진 문자열의 집합을 표현하는데 사용하는 형식 언어입니다.
자세한 설명은 아래의 사이트를 참고하시길 바랍니다.
⭐ 사용 예시
import re
pattern = '^[a-zA-Z0-9+-_.]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$'
p = re.compile(pattern)
emails = ['python@mail.example.com', 'python+hi@example.com', # 올바른 형식
'@example.com', 'python@example', 'python@example-com'] # 잘못된 형식
for email in emails:
print(p.match(email) != None, end=' ')
# 출력 : True True False False False
pattern 변수에 다음을 넣고 사용하면 됩니다. 문자열 중에서 찾기 위해서는 ^와 $을 제외하시면 됩니다.
전화번호
02-000-0000, 051.0000.0000
^0\d{1,2}(-|\.)\d{3,4}(-|\.)\d{4}$
이메일
글자수 지정안할 경우 : ab.c1_e-mail@email.com
^[a-zA-Z0-9+-_.]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$
글자수를 지정할 경우(최상위 도메인에만 2~4글자 글자수 지정)
^[a-zA-Z0-9+-_.]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]{2,4}$
날짜
년-월-일, 년.월.일, 년/월/일
^\d{4}(-|\.|/)\d{2}(-|\.|/)\d{2}$
HTML 태그
<a>, </a>
^\<(/?[^\>]+)\>$
jpg, gif 또는 png 확장자를 가진 그림 파일명
happy.jpg
[^\s]+\.(jpg|gif|png)$
URL
^(file|gopher|news|nntp|telnet|https?|ftps?|sftp):\/\/([a-z0-9-]+\.)+[a-z0-9]{2,4}.*$
1~50 사이의 번호
^[1-9]{1}$|^[1-4]{1}[0-9]{1}$|^50$
16진수로 된 색깔 번호
투명값 제외 : #ffffff, #ca0102
^#([A-Fa-f0-9]){6}$
투명값 포함 : #ffffffff, #ffca0102
^#([A-Fa-f0-9]){8}$
문자열 범위
한글 | [ㄱ-ㅎ가-힣] |
한글 자음 | [ㄱ-ㅎ] |
한글 모음 | [ㅏ-ㅣ] |
한글 | [가-힗] |
일본어 | [あ-んァ-ソ] |
히라가나 | [あ-ん] |
카타카나 | [ァ-ソ] |
영어 소문자 | [a-z] |
영어 대문자 | [A-Z] |
영문 | [:word:], [:alpha:] |
영어 모음 | [aeiou] |
영어 자음 | [b-df-hj-np-tv-z] |
숫자 | [0-9], [:digit:] |
'프로그램 개발 > Python' 카테고리의 다른 글
[코딩 인터뷰]자료구조 - 연결리스트 문제(Python) (1) | 2022.12.02 |
---|---|
[코딩 인터뷰]자료구조 - 배열과 문자열 문제(Python) (1) | 2022.11.30 |
[python] 뫼비우스 함수 (0) | 2022.11.26 |
[python] 소인수분해 (0) | 2022.11.25 |
[python] 소수 판별하기 (0) | 2022.11.24 |