본문 바로가기

python

python 정규표현식

정규표현식

# 정규 표현식 : 다량의 데이터에서 원하는 데이터만 선택해서 처리할 때 효과적

import re

ss = "12_1234 abc가나다abc_nbcABC_123555_6한국Python is fun."
print(ss)
print(re.findall(r'123',ss))
print(re.findall(r'가나다',ss))
print(re.findall(r'1',ss))
print(re.findall(r'[1-2]',ss))
print(re.findall(r'[0-9]',ss))
print(re.findall(r'[0-9]+',ss))
print(re.findall(r'[0-9]{2}',ss))
print(re.findall(r'[0-9]{2,3}',ss))
print(re.findall(r'[a-z]+',ss))
print(re.findall(r'[A-Za-z]+',ss))
print(re.findall(r'[가-힣]+',ss))
print(re.findall(r'[^가-힣]+',ss))
print(re.findall(r'12|34',ss))
print(re.findall(r'.bc',ss))
print(re.findall(r'...',ss))
print(re.findall(r'[^1]+',ss))
print(re.findall(r'^1+',ss))
print(re.findall(r'fun.$',ss))

#숫자가 아닌 문자
print(re.findall(r'\d',ss))
print(re.findall(r'\d+',ss))
#공백이나 탭
print(re.findall(r'\s',ss))
#공백이나 탭을 제외한
print(re.findall(r'\S',ss))
print(re.findall(r'\d{1,3}',ss))

12_1234 abc가나다abc_nbcABC_123555_6한국Python is fun.
['123', '123']
['가나다']
['1', '1', '1']
['1', '2', '1', '2', '1', '2']
['1', '2', '1', '2', '3', '4', '1', '2', '3', '5', '5', '5', '6']
['12', '1234', '123555', '6']
['12', '12', '34', '12', '35', '55']
['12', '123', '123', '555']
['abc', 'abc', 'nbc', 'ython', 'is', 'fun']
['abc', 'abc', 'nbcABC', 'Python', 'is', 'fun']
['가나다', '한국']
['12_1234 abc', 'abc_nbcABC_123555_6', 'Python is fun.']
['12', '12', '34', '12']
['abc', 'abc', 'nbc']
['12_', '123', '4 a', 'bc가', '나다a', 'bc_', 'nbc', 'ABC', '_12', '355', '5_6', '한국P', 'yth', 'on ', 'is ', 'fun']
['2_', '234 abc가나다abc_nbcABC_', '23555_6한국Python is fun.']
['1']
['fun.']
['1', '2', '1', '2', '3', '4', '1', '2', '3', '5', '5', '5', '6']
['12', '1234', '123555', '6']
[' ', ' ', ' ']
['1', '2', '_', '1', '2', '3', '4', 'a', 'b', 'c', '가', '나', '다', 'a', 'b', 'c', '_', 'n', 'b', 'c', 'A', 'B', 'C', '_', '1', '2', '3', '5', '5', '5', '_', '6', '한', '국', 'P', 'y', 't', 'h', 'o', 'n', 'i', 's', 'f', 'u', 'n', '.']
['12', '123', '4', '123', '555', '6']

 

 

IGNORECASE, MULTILINE

print()
#대소문자 구문하지 않게 설정
p = re.compile('the', re.IGNORECASE)
print(p)
print(p.findall('The dog the dog'))
print()
ss = '''my name is tom.
I am happy'''
print(ss)
# 줄 구분
p = re.compile('^.+', re.MULTILINE)
print(p.findall(ss))

re.compile('the', re.IGNORECASE)
['The', 'the']

my name is tom.
I am happy
['my name is tom.', 'I am happy']

'python' 카테고리의 다른 글

while 반복문, time.sleep()  (0) 2022.10.04
조건 판단문 if  (0) 2022.10.04
tuple, set, dict  (1) 2022.10.04
문자열 자료형, 리스트 자료형, deepcopy, stack queue  (0) 2022.10.04
출력서식  (0) 2022.10.04