도구 상자에서 정규식을 사용하는 방법
게시 됨: 2022-04-17- 정규 표현식이란 무엇입니까?
- 정규 표현식을 어떻게 만들 수 있습니까?
- 정규 표현식이 포함된 SEO 예제
- 정규 표현식으로 키워드 필터링
- 브랜드 이름 포함 또는 제외
- 브랜드 용어에 오류 포함 또는 제외
- 특정 단어로 끝나는 키워드 용어 포함 또는 제외
- 특정 단어로 시작하는 키워드 용어 포함 또는 제외
- 특정 속성과 관련된 키워드 용어 포함 또는 제외
- United Kindgom의 도시 이름이 포함된 키워드 용어를 포함하거나 제외합니다.
- 정규 표현식으로 URL 필터링
- 하위 도메인 포함 또는 제외
- /로 끝나거나 끝나지 않는 URL 포함 또는 제외
- 숫자가 포함된 URL 포함 또는 제외
- 특정 형식의 URL 포함 또는 제외
- 잘못된 시장과 관련된 URL 포함 또는 제외
- 요약
정규 표현식이란 무엇입니까?
정규식은 패턴을 확인하거나 확인하는 데 사용됩니다. 주요 응용 프로그램은 예를 들어 다음 시나리오에서 요소를 필터링하고 일치 항목을 찾는 것입니다.
- 분석: 정규식을 사용하여 트래픽을 분류할 수 있습니다.
- Htaccess: 더 효율적인 방법으로 URL을 다시 작성할 수 있습니다.
- SISTRIX: URL, 스니펫 또는 키워드가 포함된 보고서를 필터링할 수 있습니다.
정규식(또는 Regex)은 많은 프로그래밍 언어에서 사용할 수 있지만 이 자습서는 이미 사용 가능한 SISTRIX Regex 기능 의 기반이 되는 표준을 사용하기 때문에 Perl을 기반으로 합니다.
정규 표현식을 어떻게 만들 수 있습니까?
표현식을 작성할 수 있는 구문이므로 문자, 그룹화, 수량자 및 클래스를 사용하여 이를 수행할 것입니다.
캐릭터 | 행동 | 예시 |
---|---|---|
? | 앞의 문자를 1번 또는 0번 찾습니다. | https? |
* | 선행 문자를 0회 이상 찾습니다. | 30* |
+ | 선행 문자를 1회 이상 찾습니다. | [0-9]+ |
| | 한 요소 또는 다른 요소를 찾습니다. (또는) | (jpg|jpeg) |
^^ | 패턴의 시작을 나타냅니다. | ^https |
$ | 패턴의 끝을 나타냅니다. | HTML$ |
· | 모든 문자를 찾습니다(와일드 카드). | 4.. |
\ | 특수 문자를 해석하지 않음(문자 건너뛰기) | \/ |
그룹화 | 행동 | 예시 |
---|---|---|
() | 특정 콘텐츠 캡처 | (자매) 자매와 일치 |
[] | 대괄호 안에 있는 문자를 캡처합니다. | [0-9] 모든 숫자와 일치 [아즈] 모든 소문자와 일치 |
{} | 최소 또는 최대 반복 횟수를 나타냅니다. | .{1,3} 1~3회 반복되는 모든 문자와 일치합니다. |
이 튜토리얼에서 우리는 수량자를 사용하지 않을 것이지만, 다른 환경에서 사용할 경우에 익숙해지는 것이 여전히 흥미롭다고 생각합니다.
수량자 | 행동 |
---|---|
\w | 단어, 숫자 또는 _ 유형의 문자를 찾습니다. |
\디 | 숫자 문자를 찾습니다. |
\에스 | 공백 문자를 찾습니다. |
\비 | 단어의 시작 또는 끝을 찾습니다. |
\W | 단어, 숫자 또는 _가 아닌 문자를 찾습니다. |
\디 | 숫자가 아닌 문자를 찾습니다. |
\에스 | 공백이 아닌 문자를 찾습니다. |
정규 표현식이 포함된 SEO 예제
제안된 예를 사용하려면 '키워드' 섹션으로 이동하여 키워드, URL, 제목 또는 설명 필터를 사용해야 합니다.
정규 표현식으로 키워드 필터링
이 기능에 액세스하려면 도메인 1 을 분석하고 키워드 2 로 이동한 다음 필터 선택 3 으로 이동하면 됩니다.

그런 다음 Regex 4 와 함께 키워드 필터를 사용하십시오.

이제 우리는 이러한 표현을 적용하여 프로젝트의 키워드 분석을 최대한 활용할 수 있는 몇 가지 사용 사례를 제안하거나 경쟁자를 분석할 때 제안하고자 합니다.
브랜드 이름 포함 또는 제외
다른 철자를 허용하거나 여러 브랜드 이름으로 알고 있는 브랜드가 있다고 상상해 보십시오. 브랜드 용어로 간주되는 모든 키워드를 그룹화하는 정규식을 만들 수 있습니다. 예를 들어, curses.co.uk에는 다음과 같은 다양한 브랜드 키워드가 있습니다.
카레, 카레, PC의 세계
따라서 다음 표현식을 사용합니다.
(curry|currys|pc world).*

아래에서 얻을 수 있는 결과를 볼 수 있습니다.
다음 표현식을 사용하여 브랜드 키워드를 제외하도록 필터를 설정할 수도 있으며 일반 키워드만 표시합니다.
^(?!.*(curry|currys|pc world).*?)

브랜드 용어에 오류 포함 또는 제외
Ryanair와 같이 철자가 틀리거나 오류가 있는 브랜드를 접할 가능성이 있습니다.
다음은 사용자가 이 항공사를 검색하기 위해 입력하는 용어의 몇 가지 예입니다.
- 라이언에어
- 레이너
- 라이언 아이르
- 라얀 ir
- 라야나 에이르
- 라야 나이르
- 라얀 아리
- 레이야르 에어
단 하나의 정규식을 사용하여 캡처할 수 있는 35개 이상의 브랜드 이름을 식별했습니다.
모든 브랜드 변형을 포함하려면:
(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?
![정규식 필터 ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| 줄| )?(줄|이르)?" 적용된.](/uploads/article/246/J4RlqK5XMR1iRPm6.png)
모든 브랜드 변형을 제외하려면:
^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$
![정규식 필터 "^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)가 있는 ryanair.com용 SISTRIX 도구 상자의 키워드 테이블 ?(e|lines| )?(line|ir)?).)*$"가 적용되었습니다.](/uploads/article/246/x8B4lxmc6Vmja5ch.png)
물론 "포함", "포함하지 않음", "다음으로 끝남" 또는 "다음으로 시작"과 같은 다른 필터를 이 목록에 적용할 수 있습니다.
특정 단어로 끝나는 키워드 용어 포함 또는 제외
고유한 키워드를 검색하려면 간단한 필터로 충분하지만 여러 조건으로 검색을 수행하려는 경우, 예를 들어 "구매"로 시작하여 "온라인"으로 끝나는 모든 키워드를 사용할 수 있습니다.
^buy.*online$
이를 screwfix.com과 같은 온라인 상점에 적용하면 다음 결과가 반환됩니다.

특정 단어로 시작하는 키워드 용어 포함 또는 제외
비교 도구의 관점에서 다양한 브랜드 이름을 포함하는 키워드를 필터링할 수 있다는 것은 흥미로울 수 있습니다.
예를 들어, 원하는 기준에 따라 용어를 그룹화하는 정규식을 만들 수 있습니다. 이 경우 대괄호 안에 포함된 브랜드 이름으로 시작하는 모든 키워드 용어입니다.
^(sony|panasonic|philips|samsung).*
마찬가지로 이를 제외하는 데 사용할 수 있습니다.
^(?!(sony|panasonic|philips|samsung).*)
특정 속성과 관련된 키워드 용어 포함 또는 제외
많은 프로젝트에서 일반적으로 발생하는 속성의 예인 가격으로 이를 시도해 보겠습니다.

"싼", "할인", "아울렛", "쿠폰", "제안", "저가", "예산" 등과 같이 가격을 암시하는 많은 검색어가 있습니다.
결과에서 제외하려면 다음 표현식을 사용할 수 있습니다.
.*(cheap|budget|offer|outlet|price).*

테이블의 동적 열을 사용하여 열 머리글을 클릭하기만 하면 검색량에 따라 데이터를 내림차순으로 구성할 수 있습니다.
다른 경우에는 색상, 모양, 크기, 대상 등과 같은 다른 속성을 사용할 수도 있습니다.
United Kindgom의 도시 이름이 포함된 키워드 용어를 포함하거나 제외합니다.
많은 프로젝트에는 로컬 프레즌스 추적이 필요합니다. 이를 위해 Regex를 사용하여 지방, 지역, 도시, 마을 등을 그룹화할 수 있습니다.
이 예에서는 도시 목록을 사용하여 도시를 포함하는 키워드 용어를 필터링하는 정규식을 작성합니다.
.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*
실제 존재하는 모든 전자 상거래 비즈니스 또는 비교 도구는 이 표현을 사용하여 도시를 제외하고 브랜드 키워드를 추가하거나 다른 매개변수를 제외할 수도 있습니다.
^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))
그러나 아래와 같이 여러 표현식으로 분리할 수도 있습니다.

여기에서 전문가 필터를 추가하여 이 두 표현식이 "or" 유형 대신 "and" 유형임을 나타냅니다.


정규 표현식으로 URL 필터링
URL을 필터링하기 위해 따라야 하는 단계는 키워드에 대해 탐색한 단계와 동일하지만 유일한 차이점은 "URL"을 선택한 다음 정규식을 선택해야 한다는 것입니다.

하위 도메인 포함 또는 제외
정규 표현식을 사용하여 키워드를 필터링하는 방법을 배웠으므로 이제 URL을 필터링해야 하는 몇 가지 일반적인 SEO 사용 사례를 찾아보겠습니다.
다음은 전체 도메인을 분석하고 전략적 하위 도메인별로 URL을 그룹화하기 위한 몇 가지 기본 사용 사례입니다.
(www|support)

예를 들어 제외 필터를 사용하여 순수한 거래 하위 도메인을 분리하고 블로그 또는 FAQ에서 오는 정보 키워드를 제외할 수 있습니다.
^^(?!.*(www|support).*?)

/로 끝나거나 끝나지 않는 URL 포함 또는 제외
홈 페이지의 .com 도메인이 슬래시로 끝나는 경우 정규식은 다음과 일치하도록 조정할 수 있습니다.
^.*.com/$
^(?!(.*.com/$))
/로 끝나는 모든 URL
.*/$
또한 URL에 이 정규식을 사용하여 슬래시(/)로 끝나는 URL에만 집중할 수 있습니다. 그렇게 하려면 검색 창에 도메인을 입력하고(1) 탐색에서 URL을 클릭하고(2) 필터를 추가하고(3) URL 필터를 "정규 표현식"으로 선택합니다(4).

물론 이것은 /로 끝나지 않는 URL에서도 작동합니다.
^(?!(.*/$))

숫자가 포함된 URL 포함 또는 제외
URL 구문을 수정하여 포함하거나 제외할 숫자가 포함된 것을 식별할 수 있습니다.
.*-[0-9].*
^(?!(.*-[0-9].*))
더 구체적인 것을 원하고 특정 숫자로 끝나는 URL이 있다는 것을 알고 있다면 다음과 같이 URL을 포함하거나 제외할 수도 있습니다.
.*-[0-9]+$
^(?!(.*-[0-9]+$))
이 경우 우리의 요청은 8개의 연속된 숫자가 포함된 체인을 필터링하는 것이었습니다.
.*[0-9]{8}.html$
^(?!(.*[0-9]{8}.html$))
특정 형식의 URL 포함 또는 제외
Regex를 사용하여 URL 형식도 필터링할 수 있습니다. 예를 들어, htm 또는 html URL과 pdf URL이 있습니다.
"끝" 또는 "포함" 필터를 사용하여 수행할 수 있으므로 이는 매우 쉽습니다.
.*htm.?$
.*pdf$
원하는 URL 형식을 제외하려면:
^(?!(.*html.?$).)
^(?!(.*pdf.?$).)
동일한 표현식 내에서 여러 형식을 사용할 수 있으며, 이는 더 가치가 있으며 다음을 포함하여 여러 필터를 연결하는 번거로움을 덜어줍니다.
.*(htm|html)$
.*(jpg|jpeg|gif|png)$
또한 제외할 형식을 결합할 수도 있습니다.
^(?!(.*(htm|html)$).)
^(?!(.*htm.?)$).)
^(?!(.*(jpg|jpeg|gif|png)$).)
잘못된 시장과 관련된 URL 포함 또는 제외
특정 시장의 결과에 나타나지 않아야 하는 URL을 모니터링할 수 있습니다. 예를 들어, 스페인어 결과에 나타나는 미국, 멕시코 또는 독일 시장과 관련된 URL입니다.
다음 URL 인스턴스를 기반으로 사용:
스페인 스페인어 /es_es/
영국 영어 /ko_kr/
미국 영어 /en_us/
이탈리아의 이탈리아어 /it_it/
등등.
Regex를 사용하여 스페인 시장에 속하지 않는 URL의 수를 필터링할 수 있습니다.
^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)
![정규식 필터 "^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)"가 적용된 hm.com용 SISTRIX 도구 상자의 키워드 테이블 .](/uploads/article/246/TIPPU8qnSB57ontM.png)
보시다시피 표현식은 언어 선택기가 있는 홈 페이지 URL을 허용합니다.
이 표현식을 더 구체화하고 홈페이지를 생략하려면 아래와 같이 확장할 수 있습니다.
^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)
![정규식 필터 "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)"가 적용됩니다.](/uploads/article/246/vxYA4KacpOcflwYd.png)
요약
이 게시물에 제공된 매개변수를 사용하면 이제 정규식이 유용하고 SEO 분석을 보다 효율적으로 만드는 데 도움이 되는 고유한 사용 사례를 찾을 수 있습니다.
https://www.Regextester.com/과 같은 도구를 사용하거나 SISTRIX의 URL, 키워드 또는 스니펫 필터를 사용하여 직접 테스트하고 연습할 수 있습니다.
Regex에 대한 지원은 제공하지 않지만, 유용한 것으로 판명될 수 있는 새로운 사용 사례 및 SEO 분석으로 이 튜토리얼을 계속 업데이트할 것입니다.