วิธีใช้การเรียนรู้ของเครื่องในการวิเคราะห์ข้อมูลขนาดใหญ่

เผยแพร่แล้ว: 2022-11-25

แมชชีนเลิร์นนิงช่วยให้องค์กรเปลี่ยนข้อมูลขนาดใหญ่ให้เป็นข้อมูลเชิงลึกที่ช่วยเพิ่มผลกำไรได้ เรียนรู้ว่าบิ๊กดาต้าและแมชชีนเลิร์นนิงเกี่ยวข้องกันอย่างไรและใช้งานอย่างไร

หลายปีก่อน เจ้าของธุรกิจต้องใช้ความจำในการปรับแต่งวิธีการให้บริการลูกค้า เมื่อคุณโจนส์เดินเข้ามา เจ้าของร้านต้องนึกถึงสิ่งที่เธอซื้อครั้งล่าสุด ไม่ว่าสุดท้ายแล้วเธอจะนำมาคืนหรือไม่ก็ตาม และไม่ว่าเธอจะบ่นเกี่ยวกับสิ่งนั้นระหว่างการเยี่ยมชมครั้งล่าสุดของเธอหรือไม่

ตอนนี้ ต้องขอบคุณบิ๊กดาต้า ข้อมูลลูกค้าและข้อมูลธุรกิจมากมายอยู่ที่ปลายนิ้วของคุณ คุณรู้ว่าคุณโจนส์อาศัยอยู่ที่ไหน สิ่งที่เธอซื้อในช่วง 10 ปีที่ผ่านมา เธอใช้ไปเท่าไร เธอคืนสินค้าบ่อยเพียงใด และเมตริกอื่นๆ อีกมากมาย เมื่อใช้แมชชีนเลิร์นนิง คุณจะเปลี่ยนข้อมูลนี้และข้อมูลอื่นๆ ให้เป็นข้อมูลเชิงลึกที่ส่งเสริมธุรกิจได้ ต่อไปนี้คือรายละเอียดของข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่อง และวิธีที่คุณสามารถใช้ประโยชน์จากข้อมูลเหล่านั้นเพื่อขับเคลื่อนธุรกิจของคุณ

ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องคืออะไร?

ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องนั้นแตกต่างกันแต่เชื่อมโยงอย่างใกล้ชิด

ข้อมูลขนาดใหญ่คืออะไร?

ข้อมูลขนาดใหญ่หมายถึงชุดข้อมูลขนาดใหญ่หรือซับซ้อนอย่างไม่น่าเชื่อซึ่งอาจไม่สามารถใช้ประโยชน์ได้หากไม่มีเครื่องมือพิเศษ บางธุรกิจไม่ต้องจัดการกับข้อมูลขนาดใหญ่ ตัวอย่างเช่น หากคุณมีร้านอาหารที่มีสถานที่ตั้งสามแห่งซึ่งมีข้อมูลการขายและสินค้าคงคลัง นั่นไม่ใช่ "ข้อมูลขนาดใหญ่"

ในทางกลับกัน หากร้านอาหารแห่งเดียวกันนั้นเพิ่มสถานที่อีก 10 แห่งและแอพมือถือที่ช่วยให้ลูกค้าสามารถสั่งซื้อออนไลน์ ใช้ประโยชน์จากรางวัลความภักดี และแชทกับตัวแทนฝ่ายบริการลูกค้าผ่านข้อความ ตอนนี้คุณก็พบกับสถานการณ์ข้อมูลขนาดใหญ่ แอปเพียงอย่างเดียวอาจสร้างข้อมูลเกี่ยวกับ:

  • อาหารที่ลูกค้าสั่งบ่อยที่สุด

  • ช่วงเวลาของวันที่ลูกค้าสั่งซื้อ

  • ที่ลูกค้าสั่งอาหารจากข้อมูลตำแหน่งทางภูมิศาสตร์

  • ที่ที่ลูกค้าอาศัยอยู่และสถิติการซื้อที่เกี่ยวข้องกับแต่ละเมือง

  • ข้อมูลการขายจากแต่ละสถานที่

  • ลูกค้าใช้คะแนนสะสมอย่างไร

  • ข้อมูลการซื้อในช่วงเวลาเร่งด่วนและวันหยุด

ตัวอย่างเหล่านี้เป็นเพียงรอยขีดข่วนบนพื้นผิวเท่านั้น แอพประเภทนี้สามารถสร้างชุดข้อมูลได้มากมาย นอกจากนี้ ข้อมูลจะถูกสตรีมเข้ามาอย่างสม่ำเสมอ นั่นคือข้อมูลขนาดใหญ่

แมชชีนเลิร์นนิงคืออะไร

การเรียนรู้ของเครื่อง (ML) หมายถึงการใช้คอมพิวเตอร์เพื่อจดจำรูปแบบในข้อมูล แมชชีนเลิร์นนิงทำสิ่งนี้โดยใช้อัลกอริทึมซึ่งเป็นชุดคำสั่งที่วางทีละขั้นตอน โมเดลแมชชีนเลิร์นนิงใช้ขั้นตอนในอัลกอริทึมเพื่อเรียนรู้รูปแบบ นอกจากนี้ยังรวมถึงการตระหนักว่าเมื่อใดที่รูปแบบต่างๆ ถูกทำลาย และเรียนรู้วิธีเปรียบเทียบรูปแบบต่างๆ กัน

ยกตัวอย่างง่ายๆ สมมติว่าคุณต้องการสร้างอัลกอริทึมการเรียนรู้ของเครื่องเพื่อวิเคราะห์ข้อมูลการขาย คุณมียอดขายห้าปี เป้าหมายของคุณคือเพิ่มผลกำไรในช่วงฤดูร้อนให้สูงสุดโดยการค้นหาว่าผลิตภัณฑ์ใดที่คุณควรเสนอขายระหว่างเดือนมิถุนายนถึงสิงหาคม

คุณสามารถตั้งโปรแกรมระบบแมชชีนเลิร์นนิงของคุณเพื่อ:

  • รวบรวมข้อมูลการขายสำหรับแต่ละผลิตภัณฑ์ของคุณแบบเดือนต่อเดือน

  • ระบุสินค้าที่มียอดขายสูงสุดระหว่างเดือนมิถุนายน-สิงหาคม

  • คาดการณ์ยอดขายที่เกี่ยวข้องกับการเสนอผลิตภัณฑ์แต่ละรายการ

  • บอกคุณว่าผลิตภัณฑ์ใดที่จะนำเสนอและคุณควรนำเสนอในเดือนมิถุนายน กรกฎาคม สิงหาคม หรือในช่วงทั้งสามเดือน

แน่นอน คุณสามารถพัฒนา ML ไปอีกขั้นและรวมต้นทุนขาย (COGS) ของคุณสำหรับแต่ละผลิตภัณฑ์ รวมถึงค่าขนส่ง แรงงาน การจัดเก็บ และข้อมูลอื่นๆ จากนั้นโมเดล ML ของคุณไม่เพียงแต่แนะนำผลิตภัณฑ์ที่มียอดขายในช่วงฤดูร้อนสูงสุดเท่านั้น แต่ยังสามารถบอกคุณได้ว่าผลิตภัณฑ์ใดมีกำไรสุทธิมากที่สุด

จากนั้นคุณสามารถใช้โมเดลเดียวกันเพื่อส่งข้อมูลเชิงลึกด้านการขายสำหรับ:

  • ผลิตภัณฑ์แต่ละรายการในช่วงเวลาหนึ่งปี

  • ผลิตภัณฑ์ใหม่ที่มุ่งเป้าไปที่ตลาดเป้าหมายที่คล้ายคลึงกัน

  • ทุกเดือนเว้นปี

แมชชีนเลิร์นนิงในข้อมูลขนาดใหญ่คืออะไร

ในบริบทของข้อมูลขนาดใหญ่ เมื่อใดก็ตามที่อาจมีรูปแบบในข้อมูล คุณสามารถใช้แมชชีนเลิร์นนิงเพื่อค้นหาและให้ข้อมูลเชิงลึกที่เป็นประโยชน์ นอกจากนี้ คุณสามารถใช้ ML เพื่อให้คำแนะนำตามรูปแบบที่อัลกอริทึมวิเคราะห์

แมชชีนเลิร์นนิงทำงานร่วมกับข้อมูลขนาดใหญ่อย่างไร

หนึ่งในแอปพลิเคชันการเรียนรู้ของเครื่องที่ได้รับความนิยมมากที่สุดคือยานพาหนะที่ขับเคลื่อนด้วยตนเอง รถใช้แมชชีนเลิร์นนิงเพื่อตัดสินใจว่าจะทำอย่างไรกับข้อมูลที่รวบรวมจากสภาพแวดล้อมและยานพาหนะอื่นๆ

ตัวอย่างเช่น เมื่อกล้องภายในรถยนต์ที่ขับเคลื่อนด้วยตัวเอง "เห็น" ป้ายหยุด พวกมันสามารถจดจำได้และทำการเบรกโดยอัตโนมัติ กระบวนการที่อยู่เบื้องหลังการตัดสินใจนี้น่าจะเริ่มจากการที่นักวิทยาศาสตร์ข้อมูลกลุ่มหนึ่งทำการทดสอบอัลกอริทึมการเรียนรู้ของเครื่องหลายตัว ในระดับสูง การดำเนินการนี้มีสามขั้นตอน:

1. การฝึกอบรม

ในการวิเคราะห์ข้อมูลขนาดใหญ่ นักวิทยาศาสตร์ข้อมูลจะใช้ชุดการฝึกอบรมเพื่อสอนอัลกอริทึมอย่างน้อยหนึ่งรายการในสิ่งที่พวกเขาควรมองหา

เช่น ป้ายหยุด ชุดฝึกจะเป็นภาพป้ายหยุดหลายพันภาพ วิศวกรข้อมูลจะนำเสนอภาพป้ายหยุดรถจากมุมต่างๆ ในสภาพแสงที่แตกต่างกัน และแม้แต่ต้นไม้หรือวัตถุอื่นๆ ที่ขวางกั้นอยู่บางส่วน

ในตอนท้ายของขั้นตอนการฝึกอบรม หวังว่าอัลกอริทึมจะระบุรูปแบบในรูปร่างและสีของป้ายหยุด กล่าวอีกนัยหนึ่ง มันรู้ว่าป้ายหยุด "มีลักษณะอย่างไร"—และในแสงที่แตกต่างกันและจากมุมต่างๆ

2. การตรวจสอบ

ชุดการตรวจสอบจะใช้เพื่อหาความแม่นยำของโมเดล ML โดยใช้ชุดข้อมูลขนาดใหญ่ที่แตกต่างกันโดยสิ้นเชิง จุดประสงค์ของขั้นตอนการตรวจสอบคือเพื่อค้นหาวิธีปรับแต่งโมเดล ML โดยละเอียด

ตัวอย่างเช่น สมมติว่าโมเดล ML ที่ออกแบบมาเพื่อระบุป้ายหยุดมีความแม่นยำ 95% และภาพทั้งหมดที่ผิดพลาดนั้นมืดมาก จากนั้นนักพัฒนาสามารถใช้สูตรอื่นที่เพิ่มคอนทราสต์ของแต่ละภาพ ทำให้โมเดล ML ดูลักษณะสำคัญได้ง่ายขึ้น

3. การทดสอบ

ขั้นตอนการทดสอบเกี่ยวข้องกับการป้อนข้อมูลขนาดใหญ่ให้กับแบบจำลอง ML ซึ่งแตกต่างจากที่เห็นในระหว่างขั้นตอนการฝึกอบรมและการตรวจสอบความถูกต้องอย่างสิ้นเชิง

ตัวอย่างเช่น ในการทดสอบโมเดลป้ายหยุด โปรแกรมเมอร์สามารถแสดงรูปภาพของป้ายประเภทต่างๆ ในโมเดล ML จำนวน 250,000 รูป ซึ่งบางรูปเป็นป้ายหยุด จากนั้นพวกเขาจะวิเคราะห์ผลลัพธ์เพื่อดูว่าแบบจำลองสามารถแยกแยะป้ายหยุดได้อย่างแม่นยำเพียงใด รวมทั้งหลีกเลี่ยงการระบุป้ายประเภทอื่นๆ ผิด

ความท้าทายกับแมชชีนเลิร์นนิงและข้อมูลขนาดใหญ่

ความท้าทายที่น่ากลัวที่สุดสองประการที่นักวิทยาศาสตร์ข้อมูลต้องเผชิญโดยใช้ ML เพื่อศึกษาข้อมูลขนาดใหญ่คือความไม่ถูกต้องและปัญหาขัดแย้งทางจริยธรรม

1. ความไม่ถูกต้อง

โดยปกติแล้ว แม้จะมีกระบวนการคำนวณขั้นสูงเข้ามาเกี่ยวข้อง คุณก็ยังต้องผ่านการลองผิดลองถูกทุกครั้งที่ใช้แมชชีนเลิร์นนิงในการวิเคราะห์ข้อมูลขนาดใหญ่ นี่เป็นเพราะคุณไม่มีทางรู้ว่าปัจจัยใดที่อาจบิดเบือนผลลัพธ์ของคุณในขณะที่คุณฝึกฝน ตรวจสอบ และทดสอบโมเดลของคุณ

ตัวอย่างเช่น เมื่อระบุรูปภาพ เช่น ป้ายหยุดหรือใบหน้ามนุษย์ ปัจจัยหลายอย่างอาจทำให้โมเดล ML ของคุณมีประสิทธิภาพต่ำ ตัวอย่างเช่น สมมติว่าคุณกำลังพัฒนาโมเดลแมชชีนเลิร์นนิงเพื่อปรับปรุงระบบรักษาความปลอดภัยของบริษัทของคุณ โดยเฉพาะอย่างยิ่ง คุณต้องการแบบจำลองที่สามารถระบุใบหน้าของผู้บริหารและบุคคลระดับสูงอื่นๆ เพื่อให้พวกเขาสามารถเข้าถึงพื้นที่ที่ละเอียดอ่อนของอาคารได้ ในระหว่างขั้นตอนการตรวจสอบ ระบบมีความแม่นยำประมาณ 65% เท่านั้น แต่อาจเป็นเพราะตัวแปรหลายอย่างเช่น:

  • ภาพพิกเซลของใบหน้า

  • ภาพที่หลุดโฟกัส

  • คนที่มองออกไประหว่างการสแกนใบหน้า

  • บุคคลที่ตัดสินใจสวมแว่นกันแดด หน้ากาก ผ้าพันคอ หรืออย่างอื่นที่อาจบิดเบือนผลการระบุตัวตน

2. ประเด็นขัดแย้งทางจริยธรรม

นอกจากนี้ยังมีความท้าทายทางจริยธรรม ตัวอย่างเช่น สมมติว่าแผนกทรัพยากรบุคคลใช้แมชชีนเลิร์นนิงเพื่อระบุผู้สมัครที่มีคุณสมบัติเหมาะสมที่สุด โดยดึงพวกเขาออกจากเรซูเม่แบบดิจิทัลจำนวน 1,500 รายการ

หากแบบจำลอง ML ได้รับการฝึกอบรมโดยใช้บริษัทและแผนกว่าจ้างที่ดำเนินการโดยผู้ชายเท่านั้น ข้อมูลอาจมีอคติ ผู้ชายบางคนอาจมีแนวโน้มที่จะจ้างผู้ชายคนอื่นมากกว่าด้วยเหตุผลอื่นนอกเหนือจากข้อดีหรือคุณสมบัติของพวกเขา ดังนั้นผู้สมัครที่ "ประสบความสำเร็จ" ที่วิศวกรฝึกฝนโมเดล ML เพื่อค้นหา ในกรณีส่วนใหญ่อาจเป็นผู้ชาย ด้วยเหตุนี้ แบบจำลองจึงแนะนำผู้ชายแทนผู้หญิงที่อาจมีคุณสมบัติเหมาะสมกว่า

ในบริบททางธุรกิจ ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องเกี่ยวข้องกันอย่างไร

ในบริบททางธุรกิจ แมชชีนเลิร์นนิงใช้ข้อมูลขนาดใหญ่ที่องค์กรของคุณสร้างขึ้นเพื่อปรับปรุงหรือทำให้กระบวนการที่สำคัญทางธุรกิจเป็นไปโดยอัตโนมัติ และเพิ่มความปลอดภัยและความปลอดภัย แอปพลิเคชันที่มีศักยภาพนั้นไม่มีที่สิ้นสุดอย่างแท้จริง—และมีความหลากหลายตามประเภทข้อมูลต่างๆ ที่คุณสร้างขึ้น

ตัวอย่างเช่น โรงงานหรือโรงงานผลิตสามารถใช้แมชชีนเลิร์นนิงเพื่อปรับอุณหภูมิและความชื้นให้เหมาะสมสำหรับพื้นโรงงาน ตัวอย่างเช่น โมเดลแมชชีนเลิร์นนิงสามารถหา:

  • ระดับอุณหภูมิและความชื้นที่เพิ่มประสิทธิภาพการทำงานของพนักงานในขณะที่ลดจำนวนการพักโดยไม่ได้วางแผนที่พวกเขาต้องทำ

  • ระดับอุณหภูมิและความชื้นในอุดมคติสำหรับอุปกรณ์ที่มีความละเอียดอ่อนซึ่งอาจเสื่อมสภาพเร็วขึ้นหากใช้งานในสภาวะที่ไม่ถูกต้อง

  • สภาวะอุณหภูมิและความชื้นที่คุ้มค่าที่สุด โดยคำนึงถึงค่าใช้จ่ายในการเดินระบบ HVAC และเครื่องลดความชื้น

ระบบสามารถใช้เพื่อควบคุมระบบบรรยากาศของคุณโดยอัตโนมัติเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

แมชชีนเลิร์นนิงและการวิเคราะห์ข้อมูลขนาดใหญ่ใช้ในการตลาดอย่างไร

การตลาดนำเสนอแอปพลิเคชันการเรียนรู้ของเครื่องและการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีแนวโน้มมากที่สุด พิจารณาตัวอย่างในชีวิตจริงต่อไปนี้

Albert ของ Harley Davidson ช่วยเพิ่มความเป็นผู้นำได้ถึง 2,930%

Harley Davidson สร้างหุ่นยนต์ชื่อ Albert ที่ใช้การเรียนรู้ของเครื่องเพื่อทำการตัดสินใจทางการตลาด [ 1 ] นี่คือวิธีที่อัลเบิร์ตช่วยผู้บริหารของ Harley Davidson ขี่ออกไปในพระอาทิตย์ตกที่สว่างกว่า

Harley Davidson ต้องการใช้ประโยชน์จากความสัมพันธ์ที่มีอยู่กับลูกค้าเดิม พวกเขาใช้อัลเบิร์ตเพื่อวิเคราะห์:

  • ผู้คนซื้อสินค้าบ่อยเพียงใด

  • ลูกค้าเหล่านี้ใช้จ่ายไปเท่าไร

  • ระยะเวลาที่ลูกค้าใช้ในการเรียกดูเว็บไซต์ของ Harley Davidson

อัลเบิร์ตใช้ข้อมูลนี้เพื่อแยกลูกค้าออกเป็นส่วนต่างๆ จากนั้นทีมการตลาดได้สร้างแคมเปญทดสอบสำหรับลูกค้าแต่ละประเภท หลังจากทดสอบความสำเร็จของแคมเปญแล้ว ทีมงานก็ขยายขนาดให้ครอบคลุมกลุ่มลูกค้าเดิมจำนวนมาก

เป็นผลให้ Harley Davidson เพิ่มยอดขายได้ถึง 40% พวกเขายังสร้างโอกาสในการขายเพิ่มขึ้น 2,930% ครึ่งหนึ่งของผู้ที่นำไปสู่การระบุตัวตนโดยตรงคืออัลเบิร์ต เขา [มัน?] Albert ศึกษาโปรไฟล์ของลีดที่มีแนวโน้มสูงที่จะเปลี่ยนมาเป็นลูกค้าที่ชำระเงิน จากนั้นจึงศึกษาโปรไฟล์ข้อมูลของผู้ใช้รายอื่นและระบุ "คนที่คล้ายกัน" หรือผู้ที่มีความเหมือนกันอย่างมากกับลูกค้าที่มี Conversion สูง

ไม่ว่าคุณกำลังพยายามหาสิ่งที่ Ms. Jones จะซื้อต่อไป หรือเพิ่มประสิทธิภาพของโรงงานผลิตที่ซับซ้อน การเรียนรู้ของเครื่องสามารถเปลี่ยนข้อมูลขนาดใหญ่ที่ดูเหมือนสุ่มให้เป็นข้อมูลเชิงลึกในการเปลี่ยนแปลงได้ ด้วยการระดมสมองและความคิดสร้างสรรค์เพียงเล็กน้อย คุณจะพบวิธีใช้ ML และข้อมูลขนาดใหญ่เพื่อแซงหน้าคู่แข่งและนำองค์กรของคุณไปสู่อีกระดับ

คุณสามารถจ้างเอเจนซี่เพื่อขอความช่วยเหลือเกี่ยวกับการวิเคราะห์ข้อมูล ทั้งนี้ขึ้นอยู่กับความต้องการของคุณ ดูคู่มือการจ้างงานของเราสำหรับการวิเคราะห์ข้อมูลและการเรียนรู้ของเครื่องเพื่อพิจารณาว่าเหมาะสมที่สุดสำหรับคุณ