Cara menggunakan Ekspresi Reguler di Kotak Alat
Diterbitkan: 2022-04-17- Apa itu ekspresi reguler?
- Bagaimana kita bisa membangun ekspresi reguler?
- Contoh SEO dengan ekspresi reguler
- Memfilter kata kunci dengan ekspresi reguler
- Sertakan atau kecualikan nama merek
- Menyertakan atau mengecualikan kesalahan dalam istilah bermerek
- Menyertakan atau mengecualikan istilah kata kunci yang diakhiri dengan kata-kata tertentu
- Sertakan atau kecualikan istilah kata kunci yang dimulai dengan kata-kata tertentu
- Sertakan atau kecualikan istilah kata kunci yang terkait dengan atribut tertentu
- Menyertakan atau mengecualikan istilah kata kunci yang berisi nama kota di Inggris Raya
- Memfilter URL dengan ekspresi reguler
- Sertakan atau kecualikan subdomain
- Menyertakan atau mengecualikan URL yang diakhiri atau tidak diakhiri dengan /
- Sertakan atau kecualikan URL yang berisi angka
- Sertakan atau kecualikan URL dalam format tertentu
- Menyertakan atau mengecualikan URL yang berkaitan dengan pasar yang salah
- Ringkasan
Apa itu ekspresi reguler?
Ekspresi reguler digunakan untuk memeriksa atau memverifikasi suatu pola. Aplikasi utama mereka adalah untuk memfilter elemen dan menemukan kecocokan, misalnya, dalam skenario berikut.:
- Analytics: Anda dapat menggunakan Regex untuk mengelompokkan lalu lintas.
- Htaccess: Anda dapat menulis ulang URL dengan cara yang lebih efisien.
- SISTRIX: Anda dapat memfilter laporan kami yang berisi URL, cuplikan, atau kata kunci.
Ekspresi reguler –atau Regex– dapat digunakan dalam banyak bahasa pemrograman, tetapi tutorial ini akan didasarkan pada Perl, karena menggunakan standar yang menjadi dasar fungsionalitas SISTRIX Regex yang sudah tersedia .
Bagaimana kita bisa membangun ekspresi reguler?
Kita akan melakukan ini dengan menggunakan karakter, pengelompokan, quantifier, dan kelas, karena ini adalah sintaks yang akan digunakan untuk membangun ekspresi.
karakter | Perilaku | Contoh |
---|---|---|
? | Mencari karakter sebelumnya 1 atau 0 kali. | https? |
* | Mencari karakter sebelumnya 0 kali atau lebih. | 30* |
+ | Mencari karakter sebelumnya 1 kali atau lebih. | [0-9]+ |
| | Mencari satu elemen atau lainnya. (atau) | (jpg|jpeg) |
^ | Menunjukkan awal dari pola | ^https |
$ | Menunjukkan akhir dari pola | html$ |
· | Mencari karakter apa saja (wild card) | 4.. |
\ | Tidak menafsirkan karakter khusus (melewati karakter) | \/ |
Pengelompokan | Perilaku | Contoh |
---|---|---|
() | Menangkap konten tertentu | (sistrix) Cocok dengan sistrix |
[] | Menangkap karakter dalam tanda kurung | [0-9] Cocok dengan karakter numerik apa pun [az] Cocok dengan huruf kecil apa saja |
{} | Menunjukkan jumlah iterasi, minimum atau maksimum | .{1,3} Cocok dengan karakter apa pun yang diulang antara 1 dan 3 kali. |
Dalam tutorial ini kita tidak akan menggunakan quantifier, tapi menurut kami masih menarik bagi Anda untuk mengenal mereka jika Anda menggunakannya di lingkungan lain.
Kuantifier | Perilaku |
---|---|
\w | Mencari kata, angka, atau _ jenis karakter |
\d | Mencari karakter digit |
\s | Mencari karakter spasi putih |
\b | Mencocokkan awal atau akhir kata |
\W | Mencari karakter yang bukan kata, angka, atau _ |
\D | Mencari karakter yang bukan digit |
\S | Mencari karakter yang bukan spasi. |
Contoh SEO dengan ekspresi reguler
Untuk dapat menggunakan contoh yang disarankan, Anda harus membuka bagian 'Kata Kunci' dan menggunakan filter Kata Kunci, URL, Judul, atau Deskripsi.
Memfilter kata kunci dengan ekspresi reguler
Untuk mengakses fitur ini Anda hanya perlu menganalisis domain 1 dan pergi ke Kata kunci 2 , lalu pergi ke pilihan Filter 3

Dan kemudian, gunakan filter kata kunci dengan Regex 4 .

Sekarang kami ingin mengusulkan beberapa kasus penggunaan di mana Anda dapat menerapkan ekspresi ini untuk memaksimalkan analisis kata kunci proyek Anda, atau saat Anda menganalisis pesaing Anda.
Sertakan atau kecualikan nama merek
Bayangkan Anda memiliki merek yang menerima ejaan berbeda atau dikenal dengan beberapa nama merek berbeda. Kami dapat membuat ekspresi reguler untuk mengelompokkan semua kata kunci yang kami anggap sebagai istilah bermerek. Misalnya, currys.co.uk memiliki berbagai kata kunci bermerek, yaitu:
kari, kari, dunia pc
Jadi, kita akan menggunakan ekspresi berikut:
(curry|currys|pc world).*

Di bawah ini Anda dapat melihat hasil yang akan kami dapatkan:
Anda juga dapat menyetel filter untuk mengecualikan kata kunci bermerek, menggunakan ekspresi berikut, dan filter hanya akan menampilkan kata kunci umum:
^(?!.*(curry|currys|pc world).*?)

Menyertakan atau mengecualikan kesalahan dalam istilah bermerek
Ada kemungkinan bahwa kita akan menemukan merek, yang sering salah eja atau ditulis dengan kesalahan, seperti Ryanair.
Berikut adalah beberapa contoh istilah yang dimasukkan pengguna untuk mencari maskapai ini:
- ryanair
- rayaner
- ryan ir
- rayan ir
- rayana eir
- raya nair
- rayan ari
- rayar udara
Kami telah mengidentifikasi lebih dari 35 nama merek yang dapat kami tangkap hanya dengan menggunakan satu ekspresi reguler:
Untuk menyertakan semua variasi merek:
(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?
![Tabel Kata Kunci di SISTRIX Toolbox untuk ryanair.com dengan filter regex ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| garis| )?(baris|ir)?" terapan.](/uploads/article/246/J4RlqK5XMR1iRPm6.png)
Untuk mengecualikan semua variasi merek:
^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$
![Tabel Kata Kunci di SISTRIX Toolbox untuk ryanair.com dengan filter regex "^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air) ?(e|baris| )?(baris|ir)?).)*$" diterapkan.](/uploads/article/246/x8B4lxmc6Vmja5ch.png)
Tentu saja kami masih dapat menerapkan filter lain ke daftar ini, seperti "berisi", "tidak berisi", "diakhiri dengan", atau "dimulai dengan".
Menyertakan atau mengecualikan istilah kata kunci yang diakhiri dengan kata-kata tertentu
Untuk mencari kata kunci yang unik, filter sederhana sudah cukup, tetapi jika kita ingin melakukan pencarian dengan beberapa kondisi, misalnya: semua kata kunci dimulai dengan “beli” dan diakhiri dengan “online”, kita dapat menggunakan:
^buy.*online$
Ini, diterapkan ke toko online seperti screwfix.com, akan mengembalikan hasil berikut:

Sertakan atau kecualikan istilah kata kunci yang dimulai dengan kata-kata tertentu
Dari sudut pandang alat perbandingan, mungkin menarik untuk dapat memfilter kata kunci yang berisi berbagai nama merek.
Misalnya, kita dapat membuat ekspresi reguler yang akan mengelompokkan istilah berdasarkan kriteria yang kita inginkan, yang dalam hal ini adalah, istilah kata kunci apa pun yang dimulai dengan nama merek apa pun yang disertakan di dalam tanda kurung:
^(sony|panasonic|philips|samsung).*
Demikian pula, kita dapat menggunakannya untuk mengecualikan mereka:

^(?!(sony|panasonic|philips|samsung).*)
Sertakan atau kecualikan istilah kata kunci yang terkait dengan atribut tertentu
Mari kita coba ini dengan contoh atribut yang biasa ditemui di banyak proyek: harga.
Ada banyak permintaan pencarian yang menyinggung harga, seperti: "murah", "diskon", "outlet", "kupon", "penawaran", "biaya rendah", "anggaran", dll.
Jika kita ingin mengecualikan mereka dari hasil, kita dapat menggunakan ekspresi berikut:
.*(cheap|budget|offer|outlet|price).*

Memanfaatkan kolom dinamis tabel, kita dapat mengatur data berdasarkan volume pencarian dalam urutan menurun, hanya dengan mengklik header kolom.
Dalam kasus lain kami juga dapat menggunakan atribut lain seperti warna, bentuk, ukuran, target, dll.
Menyertakan atau mengecualikan istilah kata kunci yang berisi nama kota di Inggris Raya
Banyak proyek memerlukan pelacakan kehadiran lokal. Untuk melakukan ini, kita dapat menggunakan Regex untuk mengelompokkan provinsi, wilayah, kota, kota kecil, dll.
Dalam contoh ini kita akan mengambil daftar kota untuk membuat ekspresi reguler yang akan memfilter istilah kata kunci yang berisi kota.
.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*
Setiap bisnis e-niaga atau alat perbandingan dengan kehadiran fisik dapat menggunakan ekspresi ini untuk mengecualikan kota, dan bahkan menambahkan kata kunci bermerek atau mengecualikan parameter lainnya.
^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))
Namun, kita juga dapat memisahkannya menjadi beberapa ekspresi, seperti yang ditunjukkan di bawah ini:

Dari sini kami menambahkan Filter Pakar untuk menunjukkan bahwa kedua ekspresi ini bertipe “dan”, bukan bertipe “atau”.


Memfilter URL dengan ekspresi reguler
Langkah-langkah yang perlu Anda ikuti untuk memfilter URL sama dengan yang kami jelajahi untuk kata kunci, satu-satunya perbedaan adalah, Anda harus memilih "URL" dan kemudian ekspresi reguler.

Sertakan atau kecualikan subdomain
Sekarang setelah kita mempelajari cara menggunakan ekspresi reguler untuk memfilter kata kunci, mari temukan beberapa kasus penggunaan SEO yang umum di mana kita perlu memfilter URL.
Berikut adalah beberapa kasus penggunaan dasar untuk menganalisis seluruh domain dan mengelompokkan URL menurut subdomain strategis:
(www|support)

Kita dapat menggunakan filter pengecualian untuk, misalnya, memisahkan subdomain murni transaksional, dan mengabaikan kata kunci informasional yang berasal dari blog atau FAQ.
^^(?!.*(www|support).*?)

Menyertakan atau mengecualikan URL yang diakhiri atau tidak diakhiri dengan /
Jika domain .com halaman beranda diakhiri dengan garis miring, ekspresi reguler dapat disesuaikan agar sesuai:
^.*.com/$
^(?!(.*.com/$))
Setiap URL yang diakhiri dengan /
.*/$
Kami juga dapat menggunakan Regex ini untuk URL, untuk fokus secara eksklusif pada URL yang diakhiri dengan garis miring (/). Untuk melakukannya, masukkan domain ke dalam bilah pencarian (1), lalu klik URL di navigasi (2), tambahkan filter (3) dan pilih filter URL sebagai “ekspresi reguler” (4):

Tentu saja, ini juga berfungsi untuk URL yang tidak diakhiri dengan /
^(?!(.*/$))

Sertakan atau kecualikan URL yang berisi angka
Kami dapat mengotak-atik sintaks URL untuk mengidentifikasi mana yang berisi angka untuk disertakan atau dikecualikan:
.*-[0-9].*
^(?!(.*-[0-9].*))
Jika kami menginginkan sesuatu yang lebih spesifik, dan kami tahu ada URL yang diakhiri dengan nomor tertentu, kami juga dapat menyertakan atau mengecualikannya sebagai berikut:
.*-[0-9]+$
^(?!(.*-[0-9]+$))
Dalam hal ini permintaan kami adalah untuk menyaring rantai yang berisi rangkaian 8 angka berurutan.
.*[0-9]{8}.html$
^(?!(.*[0-9]{8}.html$))
Sertakan atau kecualikan URL dalam format tertentu
Kami juga dapat menggunakan Regex untuk memfilter format URL. Misalnya, URL htm atau html, serta yang pdf.
Ini cukup mudah, karena kita dapat mengandalkan filter "berakhir dengan" atau "berisi" untuk melakukannya.
.*htm.?$
.*pdf$
Untuk mengecualikan format URL yang diinginkan:
^(?!(.*html.?$).)
^(?!(.*pdf.?$).)
Kita dapat menggunakan beberapa format dalam ekspresi yang sama, yang akan lebih berharga, dan ini akan menyelamatkan kita dari kerumitan menggabungkan beberapa filter, untuk menyertakan:
.*(htm|html)$
.*(jpg|jpeg|gif|png)$
Dan kami juga dapat menggabungkan format yang akan dikecualikan:
^(?!(.*(htm|html)$).)
^(?!(.*htm.?)$).)
^(?!(.*(jpg|jpeg|gif|png)$).)
Menyertakan atau mengecualikan URL yang berkaitan dengan pasar yang salah
Kami dapat memantau URL yang seharusnya tidak muncul di hasil pasar tertentu. Misalnya, URL yang berkaitan dengan pasar AS, Meksiko, atau Jerman yang muncul di hasil pasar Spanyol.
Mengambil contoh URL berikut sebagai dasar kami:
Spanyol Spanyol /es_es/
Inggris Inggris /en_gb/
Bahasa Inggris AS /en_us/
Italia Italia /it_it/
Dan seterusnya.
Kita dapat menggunakan Regex untuk memfilter jumlah URL yang bukan milik pasar Spanyol.
^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)
![Tabel Kata Kunci di SISTRIX Toolbox untuk hm.com dengan filter ekspresi reguler "^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)" diterapkan .](/uploads/article/246/TIPPU8qnSB57ontM.png)
Seperti yang Anda lihat, ekspresi mengizinkan URL beranda, tempat pemilih bahasa berada.
Untuk lebih menyempurnakan ekspresi ini dan untuk meninggalkan halaman beranda, kami dapat memperluasnya seperti yang ditunjukkan di bawah ini:
^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)
![Tabel Kata Kunci di SISTRIX Toolbox untuk hm.com dengan filter ekspresi reguler "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)" diterapkan.](/uploads/article/246/vxYA4KacpOcflwYd.png)
Ringkasan
Dengan parameter yang disediakan dalam posting ini, Anda sekarang dapat menemukan kasus penggunaan Anda sendiri di mana ekspresi reguler dapat berguna dan membantu Anda membuat analisis SEO Anda lebih efisien.
Anda dapat terus menguji dan berlatih dengan alat seperti https://www.Regextester.com/, atau langsung dengan filter URL, kata kunci, atau cuplikan SISTRIX.
Meskipun kami tidak memberikan dukungan untuk Regex, kami akan terus memperbarui tutorial ini dengan kasus penggunaan baru dan analisis SEO yang mungkin berguna untuk Anda.