Cara Menggunakan Machine Learning di Big Data Analytics
Diterbitkan: 2022-11-25Pembelajaran mesin memungkinkan organisasi untuk mengubah data besar menjadi wawasan yang meningkatkan laba. Pelajari bagaimana big data dan machine learning terkait dan cara menggunakannya.
Bertahun-tahun yang lalu, pemilik bisnis harus mengandalkan ingatan mereka untuk menyesuaikan cara mereka melayani pelanggan. Ketika Nona Jones masuk, seorang pemilik toko harus mengingat apa yang dia beli terakhir kali, apakah dia akhirnya mengembalikannya atau tidak, dan apakah dia mengeluh tentang hal itu selama kunjungan terakhirnya.
Sekarang, berkat big data, banyak data pelanggan dan bisnis ada di ujung jari Anda. Anda tahu di mana Nona Jones tinggal, apa yang dia beli selama 10 tahun terakhir, berapa banyak yang dia habiskan, seberapa sering dia mengembalikan barang, dan lusinan metrik lainnya. Dengan menggunakan pembelajaran mesin, Anda dapat mengubah ini dan data lainnya menjadi wawasan yang meningkatkan bisnis. Berikut ini rincian big data dan machine learning dan bagaimana Anda dapat memanfaatkannya untuk mendukung bisnis Anda.
Apa itu big data dan pembelajaran mesin?
Data besar dan pembelajaran mesin berbeda namun terhubung erat.
Apa itu data besar?
Data besar mengacu pada kumpulan data yang sangat besar atau sangat kompleks yang mungkin tidak dapat dimanfaatkan tanpa alat khusus. Beberapa bisnis tidak pernah harus berurusan dengan data besar. Misalnya, jika Anda memiliki restoran dengan tiga lokasi yang menghasilkan data penjualan dan inventaris, itu bukan "data besar".
Di sisi lain, jika restoran yang sama menambahkan 10 lokasi lagi dan aplikasi seluler yang memungkinkan pelanggan memesan secara online, memanfaatkan hadiah loyalitas, dan mengobrol dengan perwakilan layanan pelanggan melalui teks, Anda sekarang memiliki situasi data yang besar. Aplikasi itu sendiri dapat menghasilkan data mengenai:
Makanan yang paling sering dipesan pelanggan
Waktu dalam sehari pelanggan melakukan pemesanan
Tempat pelanggan memesan makanan berdasarkan data geo-location
Tempat tinggal pelanggan dan statistik pembelian yang terkait dengan setiap kota
Data penjualan dari setiap lokasi
Bagaimana pelanggan menggunakan poin reward mereka
Membeli data selama waktu puncak dan liburan
Contoh-contoh ini hanya menggores permukaan. Aplikasi semacam ini dapat menghasilkan lusinan kumpulan data. Selain itu, informasi akan mengalir masuk hampir secara konstan. Itu data besar.
Apa itu pembelajaran mesin?
Pembelajaran mesin (ML) mengacu pada penggunaan komputer untuk mengenali pola dalam data. Pembelajaran mesin melakukan ini menggunakan algoritme, yang merupakan rangkaian instruksi yang disusun langkah demi langkah. Model pembelajaran mesin menggunakan langkah-langkah dalam suatu algoritme untuk mempelajari pola. Ini juga termasuk mengenali kapan pola dipatahkan dan belajar bagaimana membandingkan pola satu sama lain.
Sebagai contoh sederhana, misalkan Anda ingin membangun algoritma pembelajaran mesin untuk menganalisis data penjualan. Anda memiliki angka penjualan selama lima tahun. Sasaran Anda adalah memaksimalkan keuntungan musim panas dengan mencari tahu produk mana yang harus Anda tawarkan untuk dijual antara bulan Juni dan Agustus.
Anda dapat memprogram sistem pembelajaran mesin Anda untuk:
Kumpulkan data penjualan untuk setiap produk Anda, bulan demi bulan.
Identifikasi produk yang memiliki volume penjualan tertinggi antara bulan Juni dan Agustus.
Memprediksi penjualan yang terkait dengan penawaran setiap produk.
Memberi tahu Anda produk mana yang akan ditawarkan dan apakah Anda harus menawarkannya pada bulan Juni, Juli, Agustus, atau selama tiga bulan.
Tentu saja, Anda dapat membawa ML selangkah lebih maju dan memasukkan harga pokok penjualan (COGS) untuk setiap produk, termasuk pengiriman, tenaga kerja, penyimpanan, dan data lainnya. Maka model ML Anda tidak hanya dapat merekomendasikan produk yang memiliki volume penjualan musim panas tertinggi, tetapi juga dapat memberi tahu Anda mana yang menghasilkan laba bersih paling banyak.
Anda kemudian dapat menggunakan model yang sama untuk menyampaikan wawasan penjualan untuk:
Produk individu selama setahun
Produk baru yang ditujukan untuk target pasar yang serupa
Setiap bulan lainnya dalam setahun
Apa itu pembelajaran mesin dalam data besar?
Dalam konteks data besar, kapan saja ada pola dalam data, Anda dapat menggunakan pembelajaran mesin untuk menemukannya dan memberikan wawasan yang bermanfaat. Selain itu, Anda dapat menggunakan ML untuk membuat rekomendasi berdasarkan pola yang dianalisis algoritme.
Bagaimana pembelajaran mesin bekerja dengan data besar
Salah satu aplikasi pembelajaran mesin yang paling populer adalah kendaraan yang dapat mengemudi sendiri. Mobil menggunakan pembelajaran mesin untuk memutuskan apa yang harus dilakukan sehubungan dengan data yang dikumpulkannya dari lingkungan sekitar dan kendaraan lain.
Misalnya, ketika kamera di dalam kendaraan self-driving "melihat" tanda berhenti, mereka dapat mengenalinya dan secara otomatis mengerem. Proses di balik keputusan ini kemungkinan besar dimulai dengan sekelompok ilmuwan data yang menguji beberapa algoritme pembelajaran mesin. Pada tingkat tinggi, ini membutuhkan tiga langkah:
1. Pelatihan
Untuk menganalisis data besar, ilmuwan data terlebih dahulu menggunakan set pelatihan untuk mengajarkan satu atau lebih algoritme apa yang harus mereka cari.
Misalnya, dengan tanda berhenti, set pelatihan akan berupa ribuan gambar tanda berhenti. Insinyur data akan menyajikan gambar tanda berhenti dari sudut yang berbeda, dalam pencahayaan yang berbeda, dan bahkan dengan pohon atau objek lain yang menghalangi sebagian.
Di akhir fase pelatihan, harapannya adalah algoritme telah mengidentifikasi pola dalam bentuk dan warna tanda berhenti. Dengan kata lain, ia tahu seperti apa tanda berhenti “tampak”—dan dalam pencahayaan yang berbeda dan dari berbagai sudut.
2. Memvalidasi
Kumpulan validasi digunakan untuk mengetahui seberapa akurat model ML menggunakan kumpulan data besar yang sama sekali berbeda. Tujuan fase validasi adalah untuk menemukan cara menyempurnakan model ML.

Misalnya, model ML yang dirancang untuk mengidentifikasi rambu berhenti memiliki akurasi 95%, dan semua gambar yang salah ternyata sangat gelap. Pengembang kemudian dapat menggunakan formula lain yang meningkatkan kontras setiap gambar, membuat karakteristik penting lebih mudah dilihat oleh model ML.
3. Pengujian
Fase pengujian melibatkan pengumpanan model ML lebih banyak data besar yang benar-benar berbeda dari apa yang dilihatnya selama fase pelatihan dan validasi.
Misalnya, untuk menguji model tanda berhenti, pemrogram dapat menampilkan 250.000 gambar model ML dari berbagai jenis tanda, beberapa di antaranya adalah tanda berhenti. Mereka kemudian akan menganalisis hasilnya untuk melihat seberapa akurat model tersebut dapat membedakan tanda berhenti—serta menghindari kesalahan identifikasi jenis tanda lain.
Tantangan dengan pembelajaran mesin dan data besar
Dua tantangan paling menakutkan yang dihadapi ilmuwan data yang menggunakan ML untuk mempelajari data besar adalah ketidakakuratan dan dilema etika.
1. Ketidaktepatan
Secara alami, bahkan dengan proses komputasi tingkat lanjut yang terlibat, Anda masih akan mengalami elemen coba-coba setiap kali Anda menggunakan pembelajaran mesin dalam analitik data besar. Ini karena Anda tidak pernah tahu faktor mana yang dapat membelokkan hasil saat Anda melatih, memvalidasi, dan menguji model Anda.
Misalnya, saat mengidentifikasi gambar—seperti tanda berhenti atau wajah manusia—beberapa faktor dapat menyebabkan performa yang buruk pada model ML Anda. Misalnya, Anda sedang mengembangkan model pembelajaran mesin untuk meningkatkan sistem keamanan perusahaan Anda. Secara khusus, Anda menginginkan model yang dapat mengidentifikasi wajah para eksekutif dan orang berpangkat tinggi lainnya sehingga mereka dapat diberi akses ke area sensitif gedung. Selama fase validasi, akurasi sistem hanya sekitar 65%. Namun hal ini bisa disebabkan oleh beberapa variabel, seperti:
Gambar wajah yang dipikselkan
Gambar yang tidak fokus
Orang yang memalingkan muka selama pemindaian wajah
Individu yang memutuskan untuk memakai kacamata hitam, masker wajah, syal, atau hal lain yang dapat mendistorsi hasil identifikasi
2. Dilema etika
Ada juga tantangan etis. Misalnya, departemen SDM menggunakan pembelajaran mesin untuk mengidentifikasi kandidat yang paling memenuhi syarat, mengeluarkannya dari tumpukan digital 1.500 resume.
Jika model ML dilatih menggunakan perusahaan dan departemen perekrutan hanya dijalankan oleh laki-laki, datanya mungkin termasuk bias. Beberapa pria mungkin lebih cenderung mempekerjakan pria lain—untuk alasan selain prestasi atau kualifikasi mereka. Oleh karena itu, kandidat yang "berhasil" yang dilatih oleh para insinyur untuk mencari model ML mungkin, dalam banyak kasus, adalah laki-laki. Akibatnya, model tersebut merekomendasikan pria daripada wanita yang mungkin lebih berkualitas.
Dalam konteks bisnis, bagaimana big data dan machine learning terkait?
Dalam konteks bisnis, pembelajaran mesin menggunakan data besar yang dihasilkan organisasi Anda untuk meningkatkan atau mengotomatiskan proses penting bisnis serta meningkatkan keamanan dan keselamatan. Aplikasi potensial benar-benar tidak ada habisnya—dan beragam seperti berbagai jenis data yang Anda hasilkan.
Misalnya, pabrik atau fasilitas produksi dapat menggunakan pembelajaran mesin untuk mengoptimalkan tingkat suhu dan kelembapan di lantai pabriknya. Misalnya, model pembelajaran mesin dapat mengetahui:
Tingkat suhu dan kelembapan yang memaksimalkan produktivitas karyawan sambil meminimalkan jumlah istirahat tak terencana yang harus mereka ambil
Tingkat suhu dan kelembapan yang ideal untuk peralatan sensitif yang dapat rusak lebih cepat karena kondisi yang salah
Kondisi suhu dan kelembapan yang paling hemat biaya, mengingat biaya pengoperasian sistem HVAC dan penurun kelembapan
Sistem kemudian dapat digunakan untuk secara otomatis mengontrol sistem atmosfer Anda untuk mencapai hasil yang optimal.
Bagaimana pembelajaran mesin dan analitik data besar digunakan dalam pemasaran?
Marketing menawarkan beberapa aplikasi pembelajaran mesin dan analitik data besar yang paling menjanjikan. Perhatikan contoh kehidupan nyata berikut.
Albert dari Harley Davidson meningkatkan prospek sebesar 2.930%
Harley Davidson membuat robot bernama Albert yang menggunakan pembelajaran mesin untuk membuat keputusan pemasaran [ 1 ] . Beginilah cara Albert membantu para eksekutif Harley Davidson menuju matahari terbenam yang lebih cerah.
Harley Davidson ingin memanfaatkan hubungan mereka yang sudah ada dengan pelanggan sebelumnya. Mereka menggunakan Albert untuk menganalisis:
Seberapa sering orang melakukan pembelian
Berapa banyak pelanggan ini menghabiskan
Berapa banyak waktu yang dihabiskan pelanggan untuk menjelajahi situs web Harley Davidson
Albert kemudian menggunakan data ini untuk memisahkan pelanggan ke dalam segmen yang berbeda. Tim pemasaran kemudian membuat kampanye percobaan untuk setiap kategori pelanggan. Setelah menguji keberhasilan kampanye, tim meningkatkannya untuk melibatkan banyak pelanggan sebelumnya.
Hasilnya, Harley Davidson meningkatkan penjualannya sebesar 40%. Mereka juga menghasilkan 2.930% lebih banyak prospek. Separuh dari lead tersebut langsung diidentifikasi oleh Albert sendiri. Albert mempelajari profil prospek yang kemungkinan besar akan dikonversi menjadi pelanggan yang membayar, lalu mempelajari profil data pengguna lain dan menunjukkan "mirip", atau orang yang memiliki banyak kesamaan dengan pelanggan yang berkonversi tinggi.
Apakah Anda mencoba mencari tahu apa yang akan dibeli Ms. Jones selanjutnya atau mengoptimalkan efisiensi fasilitas produksi yang kompleks, pembelajaran mesin dapat mengubah data besar yang tampak acak menjadi wawasan transformasional. Dengan sedikit curah pendapat dan pemikiran kreatif, Anda dapat menemukan cara untuk menggunakan ML dan data besar untuk mengungguli persaingan dan membawa organisasi Anda ke level berikutnya.
Bergantung pada kebutuhan Anda, Anda dapat menyewa agen untuk membantu analisis data. Lihat panduan perekrutan kami untuk analitik data dan pembelajaran mesin untuk menentukan yang paling cocok untuk Anda.