Cara menambahkan solusi Machine Learning ke bisnis Anda menggunakan AWS
Diterbitkan: 2020-05-13Pembelajaran mesin terus berkembang dan memainkan peran besar dalam ekonomi global, karena memungkinkan analisis sebagian besar data secara cepat dan otomatis.
Untuk membawa teknologi pembelajaran mesin lebih dekat ke pemrogram, Amazon saat ini menawarkan lebih dari 10 pembelajaran mesin dan layanan kecerdasan buatan pada platform AWS-nya. Dengan layanan ini, Anda dapat mulai membangun model dengan cara sederhana, yang dapat meningkatkan bisnis Anda ke tingkat berikutnya.
Sebagian besar layanan ini dikelola sepenuhnya, yang berarti bahwa untuk menggunakannya, Anda tidak memerlukan pengalaman pembelajaran mesin apa pun karena alat ini memanfaatkan model yang telah dilatih sebelumnya untuk bekerja dengan data. Bergantung pada masalah bisnis Anda, Anda dapat memilih dari layanan ML yang telah dilatih sebelumnya di area seperti visi komputer, pemrosesan bahasa alami, rekomendasi, dan perkiraan. Grafik di bawah ini menunjukkan alur kerja solusi Machine Learning, bersama dengan alat AWS yang dapat Anda gunakan di setiap tahapan.

Cara menerapkan Pembelajaran Mesin ke bisnis dengan AWS
Pertama: Mengumpulkan Data
Elemen terpenting dalam membuat solusi ML adalah data. Ada 3 jenis data: terstruktur, semi terstruktur, dan tidak terstruktur.
- Elemen data terstruktur dapat dialamatkan dan dapat disimpan dalam database relasional. Jenis data ini memiliki skema yang telah ditentukan sebelumnya. Contoh data terstruktur adalah database relasional dengan data numerik dan string (teks).
- Dataset semi-terstruktur tidak berada di database relasional, tetapi mereka tetap memiliki beberapa elemen (skema) yang telah ditentukan sebelumnya yang membuatnya lebih mudah untuk dianalisis. Contoh tipe file data semi terstruktur adalah XML, HTML, RDF atau JSON.
- Data tidak terstruktur adalah segalanya. Tipe data ini tidak memiliki struktur standar dan biasanya disimpan sebagai kumpulan file. Contoh data tidak terstruktur yang paling populer adalah dokumen teks, foto, video, dan file audio serta log aplikasi.
Pemuatan Data – apa itu Kinesis?
Layanan AWS Kinesis menyerap data yang dapat dihasilkan secara terus-menerus dari berbagai sumber, misalnya aplikasi web dan seluler. Ini adalah layanan streaming data real-time yang dapat dengan cepat menangkap gigabyte data. Kinesis menawarkan alat-alat berikut:
- Kinesis Video Streaming – alat yang dapat membantu Anda melakukan streaming video dari perangkat ke AWS
- Kinesis Data Streaming – alat yang dapat membantu Anda mengumpulkan data seperti log TI, klik situs web, atau transaksi keuangan
- Kinesis Data Firehose – alat untuk memuat data yang dialirkan ke penyimpanan data (misalnya S3, Redshift) atau alat analitik
- Kinesis Data Analytics – alat yang memproses data yang dialirkan secara real-time dengan SQL atau Java
Pemuatan data – apa itu Lem?
Layanan AWS lain yang dapat membantu pemuatan data adalah Glue yang dikelola oleh Apache Spark . Ini adalah alat ekstrak, transformasi, dan muat (ETL) yang dapat digunakan untuk menyiapkan data sebelum digunakan untuk analitik. Lem dapat bekerja dengan data terstruktur dan semi terstruktur.
Elemen Glue adalah Data Catalog, ETL engine, dan scheduler. Katalog Data Lem adalah bagian terpenting dari alat ini. Ini menyimpan metadata tentang data yang diberikan, secara otomatis ditemukan oleh perayap yang menelusuri sumber data dan mendeteksi skema mereka.
Mesin ETL dapat menghasilkan kode Python dan Scala untuk digunakan dalam proses ETL untuk pengguna non-pemrograman. Itu juga dapat memproses data dengan kode yang diberikan oleh pengguna. Penjadwal dapat memantau pekerjaan, menjalankan tugas, dan memicunya berdasarkan beberapa peristiwa (misalnya pada waktu tertentu setiap hari Senin, atau saat tugas lain selesai atau gagal).
Kedua: Memilih Alat Pembelajaran Mesin yang Tepat
Setelah kami mengumpulkan data yang kami butuhkan, kami dapat mulai membangun solusi ML kami. AWS menawarkan beberapa Alat Pembelajaran Mesin yang dapat memproses data dari berbagai jenis.
Sekarang mari kita lihat masing-masing alat ini, dan mempresentasikan area aplikasi utama mereka dalam bisnis .
Apa itu SageMaker?
SageMaker paling berguna untuk pengembang pembelajaran mesin dan ilmuwan data. Layanan ini adalah solusi lengkap yang membantu mengambil model pembelajaran mesin dari konsep hingga produksi dengan sedikit usaha. Amazon SageMaker memiliki seperangkat alat yang kaya (Ground Truth, Notebook, Eksperimen, Debugger, Model Monitor, Neo) yang dapat membantu dalam melabeli data, membangun, mengoptimalkan, melatih, menguji, dan menerapkan model.
Menemukan algoritme yang tepat secara manual untuk masalah tertentu seringkali membutuhkan pelatihan dan pengujian selama berjam-jam. SageMaker memiliki opsi AutoPilot, yang menggunakan 50 model ML pra-latihan yang berbeda untuk secara otomatis menemukan model ML terbaik untuk kasing yang ada. Pengembang dapat menggunakan solusi ini untuk menemukan model dasar dengan cepat.
Apa itu Personalisasi?
Personalisasi adalah layanan pembelajaran mesin yang membantu membangun sistem rekomendasi. Personalisasi dapat memproses aliran aktivitas dari aplikasi, misalnya klik, tampilan halaman, pembelian, dan menggunakannya untuk membuat rekomendasi yang dipersonalisasi. Anda juga dapat menggunakan informasi tambahan tentang pengguna Anda, seperti usia, atau lokasi geografis. Menampilkan hasil rekomendasi dalam aplikasi Anda dapat disederhanakan dengan panggilan API singkat. Teknologi pembelajaran mesin di Personalisasi telah ditingkatkan selama bertahun-tahun digunakan oleh Amazon.com.

Apa itu Memahami?
Comprehend adalah layanan Natural Language Processing (NLP) yang menggunakan pembelajaran mesin untuk mengekstrak wawasan berharga dari data tekstual tidak terstruktur. Layanan ini menerapkan analisis sentimen, ekstraksi part-of-speech, dan tokenisasi untuk mendeteksi fitur utama teks. Pemahaman dapat membantu dalam memahami seberapa positif atau negatif suatu teks tertentu.
Comprehend memiliki alat tambahan: Amazon Comprehend Medical, khusus untuk industri medis. Amazon Comprehend Medical dapat menganalisis dokumentasi medis (seperti catatan medis pasien, catatan klinis) dan mengekstrak informasi tentang obat-obatan, dosis, dan frekuensi. Comprehend adalah layanan yang terkelola sepenuhnya.
Apa itu Prakiraan?
Forecast menggunakan pembelajaran mesin untuk membuat model prediksi deret waktu. Ini dapat menggabungkan data deret waktu historis dengan variabel tambahan (yang Anda yakini dapat memengaruhi perkiraan) untuk membangun model prediktif. Solusi Amazon ini berlaku untuk memprediksi nilai seperti harga saham atau permintaan produk pelanggan. Prakiraan juga merupakan layanan yang dikelola sepenuhnya dan dapat disesuaikan dengan kebutuhan bisnis.
Apa itu Lex?
Lex menggunakan pengenalan ucapan otomatis (ASR) untuk mengubah ucapan menjadi teks, dan Pemahaman Bahasa Alami (NLU) untuk mengenali maksud teks. Solusi ini memungkinkan pengguna untuk membangun bot percakapan.
Misalnya, Anda dapat menggunakan Lex sebagai pengganti dukungan pelanggan manual yang secara otomatis akan menjawab pertanyaan pelanggan. Amazon Lex menggunakan teknologi pembelajaran mendalam yang sama dengan Amazon Alexa (asisten virtual Amazon AI).
Apa itu Polly?
Polly adalah layanan cloud yang menggunakan algoritme pembelajaran mendalam untuk mengonversi teks menjadi ucapan yang nyata. Saat ini mendukung 60 suara pria dan wanita dalam 29 bahasa, termasuk Jepang, Cina, Korea, dan Arab. Polly juga dapat menangani waktu, tanggal, satuan, pecahan, dan singkatan. Solusi ini memungkinkan pengguna untuk membuat aplikasi yang dapat berbicara.
Apa itu Detektor Penipuan?
Pendeteksi Penipuan adalah layanan AWS yang dapat membantu mengidentifikasi aktivitas online penipuan, seperti penipuan pembayaran atau akun palsu. Layanan ini dikelola sepenuhnya sehingga model pendeteksian penipuan dapat dibuat hanya dengan beberapa klik.
Apa itu Textract?
Textract adalah layanan yang secara otomatis dapat membaca data dari dokumen yang dipindai. Textract dapat memproses jutaan halaman dalam hitungan jam dan dapat membantu dalam mengotomatisasi alur kerja dokumen. Layanan ini berguna dalam memproses dokumen seperti aplikasi pinjaman atau dokumentasi medis.
Apa itu Terjemahkan?
Terjemahan adalah pembelajaran mesin AWS yang dapat digunakan untuk melakukan terjemahan teks bahasa ke bahasa. Ini menggunakan model pembelajaran mendalam untuk memberikan terjemahan yang terdengar lebih akurat dan lebih alami, dibandingkan dengan algoritme statistik tradisional. Terjemahan mendukung 54 bahasa (termasuk misalnya Afrikaans, Bulgaria, Estonia), dan 2.804 pasangan bahasa.
Apa itu Pengakuan?
Rekognition adalah layanan computer vision yang dapat mengenali objek, orang, dan teks dari gambar dan film. Rekognition mampu mengidentifikasi dan membandingkan wajah, menganalisisnya dan mengidentifikasi beberapa fitur wajah, seperti mulut, hidung, atau mata.
Rekognition memiliki modul untuk secara otomatis mendeteksi emosi seperti kebahagiaan, kesedihan atau kejutan pada gambar wajah. Itu juga dapat melakukan verifikasi wajah pengguna, yang akan mengkonfirmasi identitas pengguna dengan membandingkan gambar waktu nyata dengan gambar referensi yang disimpan.
Ketiga: Menerapkan Solusi Pembelajaran Mesin
Metode penerapan model yang paling banyak digunakan adalah Layanan SageMaker, yang dapat Anda gunakan dengan salah satu dari dua cara berikut:
- Menggunakan Layanan Hosting SageMaker untuk menyiapkan titik akhir HTTPS. Dalam solusi ini, aplikasi klien mengirim permintaan ke titik akhir HTTPS untuk mendapatkan prediksi dari model yang diterapkan. Untuk menggunakan solusi ini, Anda harus menyediakannya dengan gambar Docker Anda. Jika Anda perlu menerapkan beberapa model, Anda juga dapat menggunakan titik akhir multi-model.
- Menggunakan SageMaker Batch Transform , yang membantu Anda mendapatkan prediksi untuk seluruh kumpulan data. Untuk men-deploy model menggunakan Batch Transform, Anda memerlukan bucket S3 untuk menyimpan model, set data, dan prediksi.
Alternatif penerapan menggunakan AWS IoT Greengrass . Layanan ini memperluas AWS ke perangkat internet of things (IoT). Dengan menggunakan layanan ini, perangkat dapat mengumpulkan, memfilter, memproses data, dan juga dapat menjalankan fungsi Lambda, wadah Docker, dan menjalankan prediksi berdasarkan model ML bahkan tanpa koneksi cloud. Saat terhubung ke internet, Greengrass menyinkronkan semua data dengan layanan cloud.
Ringkasan
Seperti yang Anda lihat, Amazon Web Service menawarkan seperangkat alat yang kaya yang dapat membantu Anda menciptakan solusi pembelajaran mesin yang berdampak bagi bisnis Anda. Dengan alat ML AWS, Anda dapat menambahkan fitur baru ke aplikasi Anda, seperti deteksi wajah, chatbot, pengenalan ucapan, analisis sentimen konten media sosial. AWS menambahkan layanan ML baru, berdasarkan kasus penggunaan baru, setiap beberapa bulan, yang menjadikannya salah satu platform dengan pertumbuhan tercepat untuk membuat solusi AI.
Kembangkan solusi pembelajaran mesin masa depan dengan Miquido!