본문 바로가기

IT 인터넷/정규표현식

(6)
[정규표현식] 수량자 이번시간에는 11page에 있는 Quantifiers에 대해서 알아보자. Quantifiers는 우리말로 '수량자'라는 뜻이며, 이는 어떠한 패턴이 얼만큼 등장하는가에 대한 것이다.수량자는 크게 3가지가 있는데, 하나는 * 하나는 + 하나는 ?이며각각 어떤 의미인지 알아보자. 우선 *는 *앞에 등장하는 어떠한 패턴이 몇번 등장하는가에서, 0~여러개, *앞에 문자가 있을수도 있고 없을수도 있다는 뜻이다. 예시를 통해 알아보자. Sourceaabc abc bc Case 1Regular Expression:a*bFirst match:aabc abc bcAll matches:aabc abc bc 정규표현식은 a*b이다. 이는 *앞에 있는 a가 있을수도 있고, 여러개일 수도 있는 패턴이다. 뒤에는 b가 온다. 따..
[정규표현식] 특정 문자와 범위 이번에는 page10 서브패턴이라는 것에 대해서 알아보자. 서브 패턴일 때는 소괄호()를 사용한다. 예시를 바로 살펴보자. SourceMonday Tuesday Friday Case 2Regular Expression:(on|ues|rida)First match:Monday Tuesday FridayAll matches:Monday Tuesday Friday 정규표현식으로 (on|ues|rida)라고 적혀있다. 이건 무슨뜻일까? 괄호 + 알파벳 + | 기호(\에 shift키를 누르면 나오는 키 - 파이프)가 있다. 이는 문자열중에 on이나 ues나 rida라는 문자를 선택하는 패턴이 되는 것이다.따라서 first-match는 on이고 all matches에선 on 또는 ues또는 rida가 선택된 것이다..
[정규표현식] 특정 문자와 범위 이번에는 정규표현식에서 자신이 원하는 문자의 후보군을 지정하는 방법에 대해서 알아보자.여기서는 대괄호 [](Square brackets]가 사용된다. page7을 보면 SourceHow do you do? 소스는 how do you do?이다. 정규표현식으로 [oyu] 라고 입력하면 소스중에 o나 y나 u중에 하나 해당되는 문자를 찾게된다. Case 1Regular Expression:[oyu]First match:How do you do?All matches:How do you do? 이처럼 first-match는 o를 사용되고, all matches는 모든 o,y,u를 찾게된느 것이다. 한가지 알아둘 것은 대괄호 포함 [oyu]는 문자 하나에 해당되는 것이다. 따라서 Case 2Regular Expr..
[정규표현식] 모든 문자 그룹 지금까지 살펴봤던 정규표현식의 패턴은 Hello 같이 정확하게 원하는 대상 문자 표현하는 것들이었다. 하지만 우리가 원하는 것이 정확하지 않다면? 이제 page5를 살펴보자. .(포인트)는 어떤 문자와도 매치된다. 라는 설명이 달려있다.이게 무슨말일까? SourceRegular expressions are powerful!!! 소스는 다음과 같다. 예제를 살펴보면, Case 1Regular Expression:.First match:Regular expressions are powerful!!!All matches:Regular expressions are powerful!!! 예제를 살펴보면 정규표현식으로 .(포인트)를 입력했다. 그랬더니 처음에는 R이 선택되고,all matches로는 모든 문자가 선..
[정규표현식] 위치와 이스케이핑 이번애는 ^ 와 $ 와 \ 라는, 정규표현식에서 특수한 의미를 가진 기호의 사용에 대해서 알아보자. page3을 살펴보자. 정규표현식을 입력할 때 ^(캐럿), $(달러)는 특별한 의미를 가지고 있다.다음과 같은 소스가 있다고 했을 때, 소스: who is who 정규표현식으로 ^who 라고 입력하면 결과는 First match:who is whoAll matches:who is who 이다. who is whoi라는 소스에는 who가 두번나온다.^(캐럿)은 문자가 시작하는 위치를 맨 앞으로 지정하는 것이다. 그렇다면 정규표현식으로 who$라고 입력해보자. 결과는 First match:who is whoAll matches:who is who 이다. $는 문자가 끝나는 위치를 맨 뒤로 지정하는 것이다. [..
[정규표현식] 패턴 기본 정규표현식에 대해서 알아보자. 정규표현식이란 어떤 문자를 처리하기 위한 일종의 언어이다. 예를들어 특정 글에서 '안녕'이라는 문자를 찾고 싶다면, 그리고 그 문자를 '잘가'라고 바꾸고 싶다면 자신이 처리하고자 하는 문자를 정규표현식의 문법에 맞게 찾을 수 있어야 한다. 정규표현식에 관한 사이트는http://zvon.org/comp/r/tut-Regexp.html#Pages~Contents이며, 난이도가 낮은 것부터 높은 것까지 하나하나 배워나갈 수 있는 사이트이다. 이 사이트의 page1부터 살펴보자.정규표현식의 가장 기본적인 문법이라고 할 수 있는 것은내가 찾고자 하는 text가 있다면, 그 text를 그대로 적어주는 것이다. 'Hello, world!' 라는 소스가 있다고 하자.여기서 정규표현식으로 ..