※ 소개
정규표현식은 영문으로 Regular Expressions라고 표기하며 보통 정규식 혹은 Regex(레젝스)라고 부른다.
정규식은 모든 종류의 텍스트를 조작하고 처리하기 위해 만들어졌으며, 거의 모든 언어와 플랫폼에서 지원한다.
막연히 텍스트를 조작하고 처리한다고 하여 감이 잘 안올텐데 일단은 문자열의 검색과 치환을 위한 용도로 쓰이며, 이 작업들을 할때 정규표현식을 이용하면 (상대적으로)간단하게 처리할 수 있다는 것만 알아두자.
정규표현식은 정규 표현 언어를 사용해 만들며 정규 표현 언어에 대해서는 다음 포스팅부터 알아볼것이다.
※ 정규표현식을 사용해야 할 때
- 문자열에서 특정 문자 혹은 특정 문자열을 검색해야 할 때
- 문자열에서 특정 문자 혹은 특정 문자열을 치환해야 할 때
※ 장점
- 문자열에서 검색과 치환을 할 때 정규식을 이용하면 간단하게 작업할 수 있다.
- Modern C++, C#, Java, php, Perl 등등 많은 언어들이 지원한다.
※ 단점
- 문법이 직관적이지 못하고 모르는 상태에서 보면 복잡해보인다.
- 언어마다 정규표현식 문법이 조금씩 다르다.
※ 활용
필자는 보통 아래와 같은 상황때 정규표현식을 활용한다.
- 텍스트 파일이나 각 종 문서에서 특정 패턴을 검색할때
- Modern C++로 개발하다가 문자열 검색 및 조작이 필요할때
- 리눅스 명령어 grep을 사용할때
'라이브러리 > regex' 카테고리의 다른 글
[정규표현식] 문자 집합을 이용한 검색 방법 (4) | 2016.03.04 |
---|---|
[정규표현식] 기본적인 검색 방법 (0) | 2016.02.09 |
[정규표현식] 참조 정보 - 메타 문자, 수량자 등 (0) | 2016.02.08 |
[정규표현식] RegExr - 정규식 온라인 툴 (0) | 2016.02.07 |