※ 소개

정규표현식은 영문으로 Regular Expressions라고 표기하며 보통 정규식 혹은 Regex(레젝스)라고 부른다.

정규식은 모든 종류의 텍스트를 조작하고 처리하기 위해 만들어졌으며, 거의 모든 언어와 플랫폼에서 지원한다.

막연히 텍스트를 조작하고 처리한다고 하여 감이 잘 안올텐데 일단은 문자열의 검색치환을 위한 용도로 쓰이며, 이 작업들을 할때 정규표현식을 이용하면 (상대적으로)간단하게 처리할 수 있다는 것만 알아두자.

정규표현식은 정규 표현 언어를 사용해 만들며 정규 표현 언어에 대해서는 다음 포스팅부터 알아볼것이다.


※ 정규표현식을 사용해야 할 때

- 문자열에서 특정 문자 혹은 특정 문자열을 검색해야 할 때

- 문자열에서 특정 문자 혹은 특정 문자열을 치환해야 할 때


※ 장점
- 문자열에서 검색과 치환을 할 때 정규식을 이용하면 간단하게 작업할 수 있다.

- Modern C++, C#, Java, php, Perl 등등 많은 언어들이 지원한다.


※ 단점
- 문법이 직관적이지 못하고 모르는 상태에서 보면 복잡해보인다.
- 언어마다 정규표현식 문법이 조금씩 다르다.

 

※ 활용
필자는 보통 아래와 같은 상황때 정규표현식을 활용한다.

- 텍스트 파일이나 각 종 문서에서 특정 패턴을 검색할때

- Modern C++로 개발하다가 문자열 검색 및 조작이 필요할때

- 리눅스 명령어 grep을 사용할때

 

 


+ Recent posts