วิธีใช้นิพจน์ทั่วไปในกล่องเครื่องมือ

เผยแพร่แล้ว: 2022-04-17

สารบัญ

นิพจน์ทั่วไปคืออะไร?
เราจะสร้างนิพจน์ทั่วไปได้อย่างไร
ตัวอย่าง SEO พร้อมนิพจน์ทั่วไป
การกรองคำหลักด้วยนิพจน์ทั่วไป
รวมหรือยกเว้นชื่อแบรนด์
รวมหรือยกเว้นข้อผิดพลาดในเงื่อนไขของแบรนด์
รวมหรือยกเว้นคำสำคัญที่ลงท้ายด้วยคำเฉพาะ
รวมหรือยกเว้นคำสำคัญที่ขึ้นต้นด้วยคำเฉพาะ
รวมหรือยกเว้นคำสำคัญที่เกี่ยวข้องกับคุณลักษณะเฉพาะ
รวมหรือยกเว้นคำสำคัญที่มีชื่อของเมืองใน United Kindgom
การกรอง URL ด้วยนิพจน์ทั่วไป
รวมหรือยกเว้นโดเมนย่อย
รวมหรือยกเว้น URL ที่ลงท้ายหรือไม่ลงท้ายด้วย /
รวมหรือยกเว้น URL ที่มีตัวเลข
รวมหรือยกเว้น URL ในรูปแบบเฉพาะ
รวมหรือยกเว้น URL ที่เกี่ยวข้องกับตลาดที่ไม่ถูกต้อง
สรุป

นิพจน์ทั่วไปคืออะไร?

นิพจน์ทั่วไปใช้เพื่อตรวจสอบหรือตรวจสอบรูปแบบ แอปพลิเคชันหลักของพวกเขาใช้สำหรับกรององค์ประกอบและค้นหารายการที่ตรงกัน ตัวอย่างเช่น ในสถานการณ์ต่อไปนี้:

Analytics: คุณสามารถใช้ Regex เพื่อแบ่งกลุ่มการเข้าชม
Htaccess: คุณสามารถเขียน URL ใหม่ได้อย่างมีประสิทธิภาพมากขึ้น
SISTRIX: คุณสามารถกรองรายงานของเราที่มี URL ตัวอย่างหรือคำหลัก

นิพจน์ทั่วไป –หรือ Regex– สามารถใช้ได้ในภาษาการเขียนโปรแกรมหลายภาษา แต่บทช่วยสอนนี้จะใช้ Perl เนื่องจากใช้มาตรฐานที่ ใช้ฟังก์ชัน SISTRIX Regex ที่มีอยู่แล้ว

เราจะสร้างนิพจน์ทั่วไปได้อย่างไร

เราจะทำสิ่งนี้โดยใช้อักขระ การจัดกลุ่ม ปริมาณ และคลาส เนื่องจากเป็นไวยากรณ์ที่เราจะสามารถสร้างนิพจน์ได้

ไวยากรณ์สำหรับการสร้างนิพจน์ทั่วไป

ตัวละคร	พฤติกรรม	ตัวอย่าง
?	ค้นหาอักขระนำหน้า 1 หรือ 0 ครั้ง	https?
*	ค้นหาอักขระนำหน้า 0 ครั้งขึ้นไป	30*
+	ค้นหาอักขระนำหน้า 1 ครั้งขึ้นไป	[0-9]+
\|	ค้นหาองค์ประกอบอย่างใดอย่างหนึ่ง (หรือ)	(jpg\|jpeg)
^	ระบุจุดเริ่มต้นของรูปแบบ	^https
$	ระบุจุดสิ้นสุดของรูปแบบ	html$
·	ค้นหาตัวละครใด ๆ (ไวด์การ์ด)	4..
\	ไม่ตีความอักขระพิเศษ (ข้ามอักขระ)	\/

การจัดกลุ่มตัวเลือกสำหรับนิพจน์ทั่วไป

การจัดกลุ่ม	พฤติกรรม	ตัวอย่าง
()	จับเนื้อหาเฉพาะ	(ซิสทริกซ์) ตรงกับ sistrix
[]	จับตัวอักษรภายในวงเล็บ	[0-9] ตรงกับอักขระตัวเลขใด ๆ [az] ตรงกับอักษรตัวพิมพ์เล็ก
{}	ระบุจำนวนการวนซ้ำ ต่ำสุดหรือสูงสุด	.{1,3} จับคู่กับอักขระใดๆ ที่ทำซ้ำระหว่าง 1 ถึง 3 ครั้ง

ในบทช่วยสอนนี้ เราจะไม่ใช้ตัวระบุปริมาณ แต่เราคิดว่ายังคงน่าสนใจสำหรับคุณที่จะทำความคุ้นเคยกับตัววัดเหล่านี้ ในกรณีที่คุณใช้ในสภาพแวดล้อมอื่นๆ

ปริมาณในนิพจน์ทั่วไป

ปริมาณ	พฤติกรรม
\w	ค้นหาคำ ตัวเลข หรือ _ ประเภทอักขระ
\d	มองหาตัวอักษร
\s	มองหาอักขระช่องว่าง
\b	จับคู่จุดเริ่มต้นหรือจุดสิ้นสุดของคำ
\W	ค้นหาอักขระที่ไม่ใช่คำ ตัวเลข หรือ _
\D	มองหาอักขระที่ไม่ใช่ตัวเลข
\S	มองหาตัวละครที่ไม่ใช่ช่องว่าง

ตัวอย่าง SEO พร้อมนิพจน์ทั่วไป

เพื่อให้สามารถใช้ตัวอย่างที่แนะนำได้ คุณต้องไปที่ส่วน 'คำหลัก' และใช้ตัวกรองคำหลัก, URL, ชื่อหรือคำอธิบาย

การกรองคำหลักด้วยนิพจน์ทั่วไป

ในการเข้าถึงคุณลักษณะนี้ คุณจะต้องวิเคราะห์โดเมน 1 และไปที่คำหลัก 2 จากนั้นไปที่การเลือกตัวกรอง 3

จากนั้น ใช้ตัวกรองคำหลักกับ Regex 4

ตอนนี้ เราอยากจะเสนอกรณีการใช้งานหลายๆ กรณีที่คุณสามารถนำนิพจน์เหล่านี้ไปใช้ให้เกิดประโยชน์สูงสุดจากการวิเคราะห์คำหลักของโครงการของคุณ หรือเมื่อคุณกำลังวิเคราะห์คู่แข่งของคุณ

รวมหรือยกเว้นชื่อแบรนด์

ลองนึกภาพว่าคุณมีแบรนด์ที่ยอมรับการสะกดคำต่างๆ หรือเป็นที่รู้จักจากชื่อแบรนด์ต่างๆ มากมาย เราสามารถสร้างนิพจน์ทั่วไปเพื่อจัดกลุ่มคำหลักทั้งหมดที่เราพิจารณาว่าเป็นคำที่มีตราสินค้า ตัวอย่างเช่น currys.co.uk มีคำหลักของแบรนด์ต่างๆ ได้แก่:

แกง, แกง, pc world

ดังนั้น เราจะใช้นิพจน์ต่อไปนี้:

 (curry|currys|pc world).*

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ currys.co.uk โดยใช้ตัวกรอง regex ".*(curry|currys|pc world).*"

ด้านล่างนี้คุณจะเห็นผลลัพธ์ที่เราจะได้รับ:

นอกจากนี้ยังสามารถตั้งค่าตัวกรองเพื่อยกเว้นคำหลักที่มีตราสินค้า โดยใช้นิพจน์ต่อไปนี้ และจะแสดงเฉพาะคำหลักทั่วไปเท่านั้น:

 ^(?!.*(curry|currys|pc world).*?)

รวมหรือยกเว้นข้อผิดพลาดในเงื่อนไขของแบรนด์

มีโอกาสที่เราอาจพบแบรนด์ต่างๆ ซึ่งมักสะกดผิดหรือเขียนโดยมีข้อผิดพลาด เช่น Ryanair

ต่อไปนี้คือตัวอย่างคำศัพท์บางส่วนที่ผู้ใช้ป้อนเพื่อค้นหาสายการบินนี้:

ไรอันแอร์
rayaner
ไรอัน ir
rayan ir
rayana eir
รายาแนร์
รายัน อารีย์
รายาร์แอร์

เราได้ระบุชื่อแบรนด์มากกว่า 35 ชื่อที่เราสามารถจับภาพได้โดยใช้นิพจน์ทั่วไปเพียงรายการเดียว:

เพื่อรวมรูปแบบแบรนด์ทั้งหมด:

 (r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ ryanair.com พร้อมตัวกรอง regex ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| บรรทัด| )?(line|ir)?" สมัครแล้ว.

หากต้องการยกเว้นรูปแบบแบรนด์ทั้งหมด:

 ^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ ryanair.com พร้อมตัวกรอง regex "^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air) ?(e|lines| )?(line|ir)?).)*$" ใช้แล้ว

แน่นอน เรายังคงใช้ตัวกรองอื่นๆ กับรายการนี้ได้ เช่น "มี" "ไม่มี" "ลงท้ายด้วย" หรือ "เริ่มต้นด้วย"

รวมหรือยกเว้นคำสำคัญที่ลงท้ายด้วยคำเฉพาะ

ในการค้นหาคีย์เวิร์ดที่ไม่ซ้ำ ตัวกรองง่ายๆ ก็เพียงพอแล้ว แต่ถ้าเราต้องการค้นหาด้วยเงื่อนไขหลายประการ เช่น คีย์เวิร์ดทั้งหมดที่ขึ้นต้นด้วย "ซื้อ" และลงท้ายด้วย "ออนไลน์" เราสามารถใช้:

 ^buy.*online$

ซึ่งใช้กับร้านค้าออนไลน์เช่น screwfix.com จะส่งคืนผลลัพธ์ต่อไปนี้:

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ currys.co.uk โดยใช้ตัวกรอง regex "^buy.*online$"

รวมหรือยกเว้นคำสำคัญที่ขึ้นต้นด้วยคำเฉพาะ

จากมุมมองของเครื่องมือเปรียบเทียบ การกรองคำหลักที่มีชื่อตราสินค้าต่างๆ

ตัวอย่างเช่น เราสามารถสร้างนิพจน์ทั่วไปที่จะจัดกลุ่มคำตามเกณฑ์ที่เราต้องการ ซึ่งในกรณีนี้คือคำสำคัญใดๆ ที่ขึ้นต้นด้วยชื่อแบรนด์ที่รวมอยู่ในวงเล็บ:

 ^(sony|panasonic|philips|samsung).*

ในทำนองเดียวกัน เราสามารถใช้เพื่อยกเว้น:

 ^(?!(sony|panasonic|philips|samsung).*)

รวมหรือยกเว้นคำสำคัญที่เกี่ยวข้องกับคุณลักษณะเฉพาะ

มาลองใช้ตัวอย่างแอตทริบิวต์ที่พบบ่อยในหลายโครงการ: ราคา

มีคำค้นหามากมายที่พาดพิงถึงราคา เช่น "ถูก" "ลดราคา" "เอาท์เล็ต" "คูปอง" "เสนอ" "ต้นทุนต่ำ" "งบประมาณ" เป็นต้น

หากเราต้องการแยกออกจากผลลัพธ์ เราสามารถใช้นิพจน์ต่อไปนี้:

 .*(cheap|budget|offer|outlet|price).*

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ skinflint.co.uk โดยใช้ตัวกรอง regex ".*(cheap|budget|offer|outlet|price).*"

เมื่อใช้คอลัมน์ไดนามิกของตาราง เราสามารถจัดระเบียบข้อมูลตามปริมาณการค้นหาในลำดับจากมากไปน้อย เพียงคลิกที่ส่วนหัวของคอลัมน์

ในกรณีอื่นๆ เรายังสามารถใช้คุณลักษณะอื่นๆ เช่น สี รูปร่าง ขนาด เป้าหมาย เป็นต้น

รวมหรือยกเว้นคำสำคัญที่มีชื่อของเมืองใน United Kindgom

หลายโครงการต้องการการติดตามสถานะในพื้นที่ ในการทำเช่นนี้ เราสามารถใช้ Regex เพื่อจัดกลุ่มจังหวัด ภูมิภาค เมือง เมือง ฯลฯ

ในตัวอย่างนี้ เราจะใช้รายชื่อเมืองเพื่อสร้างนิพจน์ทั่วไปที่จะกรองคำสำคัญที่มีเมือง

 .*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*

ธุรกิจอีคอมเมิร์ซหรือเครื่องมือเปรียบเทียบใดๆ ที่มีสถานะทางกายภาพสามารถใช้นิพจน์นี้เพื่อยกเว้นเมือง หรือแม้แต่เพิ่มคำหลักที่มีตราสินค้าหรือยกเว้นพารามิเตอร์อื่นๆ

 ^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))

อย่างไรก็ตาม เราสามารถแยกออกเป็นหลายนิพจน์ได้ ดังที่แสดงด้านล่าง:

กล่องกรองผลลัพธ์สำหรับตารางคีย์เวิร์ด SISTRIX Toolbox ตัวกรองถูกตั้งค่าเป็น "คำหลัก" แล้วตามด้วย "นิพจน์ทั่วไป" regex ที่ป้อนคือ "^(?!.*(nike|jordan|air|niketown).*?)"

จากนี้ไป เราเพิ่มตัวกรองผู้เชี่ยวชาญเพื่อระบุว่านิพจน์ทั้งสองนี้เป็นประเภท "และ" แทนที่จะเป็นประเภท "หรือ"

ตัวเลือกตารางสำหรับตารางคีย์เวิร์ด สามารถพบได้ในการนำทางด้านบนนอกเหนือจาก "วันที่" เลือกตัวเลือก "ตัวกรองผู้เชี่ยวชาญ" แล้ว

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ nike.com ที่เปิดใช้งานตัวกรองผู้เชี่ยวชาญ ต่อไปนี้คือตัวกรอง regex สองตัวที่รวมกันโดยบูลีน AND

การกรอง URL ด้วยนิพจน์ทั่วไป

ขั้นตอนที่คุณต้องปฏิบัติตามเพื่อกรอง URL จะเหมือนกับขั้นตอนที่เราสำรวจสำหรับคำหลัก ความแตกต่างเพียงอย่างเดียวคือ คุณจะต้องเลือก "URL" แล้วเลือกนิพจน์ทั่วไป

กล่องกรองผลลัพธ์สำหรับตารางคีย์เวิร์ด SISTRIX Toolbox ตัวกรองถูกตั้งค่าเป็น "URL" แล้วตามด้วย "นิพจน์ทั่วไป"

รวมหรือยกเว้นโดเมนย่อย

ตอนนี้เราได้เรียนรู้วิธีใช้นิพจน์ทั่วไปในการกรองคำหลักแล้ว มาดูกรณีการใช้งาน SEO ทั่วไปที่เราจำเป็นต้องกรอง URL

ต่อไปนี้คือกรณีการใช้งานพื้นฐานสำหรับการวิเคราะห์ทั้งโดเมนและการจัดกลุ่ม URL ตามโดเมนย่อยเชิงกลยุทธ์:

 (www|support)

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ apple.com โดยใช้ตัวกรอง regex "(www|support)"

เราสามารถใช้ตัวกรองการยกเว้นเพื่อแยกโดเมนย่อยของธุรกรรมเพียงอย่างเดียว และละเว้นคำหลักที่ให้ข้อมูลที่มาจากบล็อกหรือคำถามที่พบบ่อย

 ^^(?!.*(www|support).*?)

รวมหรือยกเว้น URL ที่ลงท้ายหรือไม่ลงท้ายด้วย /

หากโดเมน .com ของหน้าแรกลงท้ายด้วยเครื่องหมายทับ regex สามารถปรับให้ตรงกันได้:

 ^.*.com/$

 ^(?!(.*.com/$))

URL ใดๆ ที่ลงท้ายด้วย /

 .*/$

นอกจากนี้เรายังสามารถใช้ Regex นี้สำหรับ URL เพื่อเน้นเฉพาะ URL ที่ลงท้ายด้วยเครื่องหมายทับ (/) ในการดำเนินการดังกล่าว ให้ป้อนโดเมนลงในแถบค้นหา (1) จากนั้นคลิก URL ในการนำทาง (2) เพิ่มตัวกรอง (3) และเลือกตัวกรอง URL เป็น “นิพจน์ทั่วไป” (4):

แน่นอนว่าสิ่งนี้ใช้ได้กับ URL ที่ไม่ได้ลงท้ายด้วย /

 ^(?!(.*/$))

ตาราง URL ในกล่องเครื่องมือ SISTRIX สำหรับ apple.com โดยใช้ตัวกรอง URL regex "^(?!(.*/$))"

รวมหรือยกเว้น URL ที่มีตัวเลข

เราสามารถแก้ไขไวยากรณ์ URL เพื่อระบุว่ามีตัวเลขใดบ้างที่จะรวมหรือแยกออก:

 .*-[0-9].*

 ^(?!(.*-[0-9].*))

หากเราต้องการสิ่งที่เจาะจงมากกว่านี้ และเรารู้ว่ามี URL ที่ลงท้ายด้วยตัวเลขเฉพาะ เราสามารถรวมหรือยกเว้น URL ได้ดังนี้:

 .*-[0-9]+$

 ^(?!(.*-[0-9]+$))

ในกรณีนี้ คำขอของเราคือกรองสายโซ่ที่มีตัวเลขต่อเนื่องกัน 8 ตัว

 .*[0-9]{8}.html$

 ^(?!(.*[0-9]{8}.html$))

รวมหรือยกเว้น URL ในรูปแบบเฉพาะ

เราสามารถใช้ Regex เพื่อกรองรูปแบบ URL ได้เช่นกัน ตัวอย่างเช่น URL htm หรือ html รวมถึง pdf

มันค่อนข้างง่ายเพราะเราสามารถวางใจได้ว่าจะใช้ตัวกรอง "ลงท้ายด้วย" หรือ "มี"

 .*htm.?$

 .*pdf$

หากต้องการยกเว้นรูปแบบ URL ที่ต้องการ:

 ^(?!(.*html.?$).)

 ^(?!(.*pdf.?$).)

เราสามารถใช้รูปแบบได้หลายรูปแบบภายในนิพจน์เดียวกัน ซึ่งจะมีค่ามากกว่า และจะช่วยเราไม่ต้องยุ่งยากในการรวมตัวกรองหลายตัวเข้าด้วยกัน ซึ่งรวมถึง:

 .*(htm|html)$

 .*(jpg|jpeg|gif|png)$

และเรายังสามารถรวมรูปแบบที่จะยกเว้นได้:

 ^(?!(.*(htm|html)$).)

 ^(?!(.*htm.?)$).)

 ^(?!(.*(jpg|jpeg|gif|png)$).)

รวมหรือยกเว้น URL ที่เกี่ยวข้องกับตลาดที่ไม่ถูกต้อง

เราสามารถตรวจสอบ URL ที่ไม่ควรปรากฏในผลลัพธ์ของตลาดเฉพาะ ตัวอย่างเช่น URL ที่เกี่ยวข้องกับตลาดสหรัฐอเมริกา เม็กซิโก หรือเยอรมันที่ปรากฏในผลลัพธ์ของตลาดสเปน

ใช้อินสแตนซ์ URL ต่อไปนี้เป็นพื้นฐานของเรา:

สเปนของสเปน /es_es/

อังกฤษแบบอังกฤษ /en_gb/

ภาษาอังกฤษแบบสหรัฐอเมริกา /en_us/

อิตาเลี่ยนของอิตาลี /it_it/

และอื่นๆ.

เราสามารถใช้ Regex เพื่อกรองจำนวน URL ที่ไม่ได้เป็นของตลาดสเปน

 ^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ hm.com ที่มีตัวกรอง regex "^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)" ถูกนำไปใช้ .

ดังที่คุณเห็น นิพจน์อนุญาตให้ใช้ URL ของโฮมเพจ ซึ่งเป็นที่ตั้งของตัวเลือกภาษา

เพื่อปรับแต่งนิพจน์นี้เพิ่มเติมและออกจากหน้าแรก เราสามารถขยายได้ดังที่แสดงด้านล่าง:

 ^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)

ตารางคำหลักในกล่องเครื่องมือ SISTRIX สำหรับ hm.com ที่มีตัวกรอง regex "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)" ใช้

สรุป

ด้วยพารามิเตอร์ที่ให้ไว้ในโพสต์นี้ คุณจะสามารถค้นหากรณีการใช้งานของคุณเองได้ ซึ่งนิพจน์ทั่วไปอาจมีประโยชน์ และช่วยให้คุณวิเคราะห์ SEO ได้อย่างมีประสิทธิภาพมากขึ้น

คุณสามารถทำการทดสอบและฝึกฝนต่อไปด้วยเครื่องมือต่างๆ เช่น https://www.Regextester.com/ หรือโดยตรงกับตัวกรอง URL คำหลักหรือตัวอย่างข้อมูลของ SISTRIX

แม้ว่าเราจะไม่ได้ให้การสนับสนุน Regex แต่เราจะอัปเดตบทช่วยสอนนี้ต่อไปด้วยกรณีการใช้งานใหม่และการวิเคราะห์ SEO ที่อาจเป็นประโยชน์สำหรับคุณ