6 cara Anda dapat menggunakan Deep Learning untuk meningkatkan kegunaan perangkat seluler

Diterbitkan: 2020-01-23

Dengan meningkatnya permintaan global untuk pengalaman seluler yang lebih baik dan lebih personal, AI yang tersebar luas dan adaptasi pembelajaran mendalam di industri pengembangan aplikasi seluler tidak dapat dihindari. Lupakan masalah latensi yang membuat frustrasi yang muncul dengan penginderaan seluler dan komputasi awan. Latensi mendekati nol sudah dekat, dengan kecepatan pemrosesan data waktu nyata untuk memberikan hasil yang optimal.

Chip smartphone Bionic canggih Apple dengan unit pemrosesan saraf bawaan telah membantu jaringan saraf berjalan langsung di perangkat dengan kecepatan luar biasa. Dengan menggunakan platform Core ML Apple dan ML Kit Google serta library pembelajaran mendalam seperti TensorFlow Lite dan Keras, developer seluler dapat membuat aplikasi dengan latensi lebih rendah, lebih sedikit error, dan pemrosesan data lebih cepat.

Keuntungan utama pembelajaran mesin di perangkat adalah menawarkan pengalaman pengguna yang mulus dan akurat kepada pengguna. Karena tidak ada pertanyaan tentang pengiriman data ke server eksternal untuk diproses, Anda mendapatkan perlindungan data yang lebih baik serta keamanan dan privasi pengguna. Selain itu, dengan jaringan saraf di perangkat seluler, Anda tidak perlu terhubung ke internet untuk mengakses setiap fitur aplikasi Anda. Anda tentu saja masih membutuhkan internet untuk sebagian besar fitur standar.

6 cara untuk menerapkan pembelajaran mendalam ke perangkat seluler

Memanfaatkan kemampuan komputasi perangkat seluler untuk menerapkan algoritme pembelajaran mendalam tidak diragukan lagi telah meningkatkan kegunaan perangkat seluler. Berikut caranya:

1. Pengenalan ucapan di perangkat

Pengenalan ucapan melibatkan transformasi atau transduksi urutan input menjadi urutan output menggunakan jaringan saraf berulang (RNN), jaringan saraf convolutional (CNN), jaringan saraf dalam (DNN), dan arsitektur lainnya. Pengembang berjuang dengan masalah latensi — yang menciptakan penundaan antara permintaan Anda dan respons asisten otomatis — tetapi sekarang kami dapat mengatasinya dengan menggunakan teknologi transduser jaringan saraf berulang (RNN-T) yang ringkas di perangkat seluler.

RNN-Ts adalah model urutan-ke-urutan. Alih-alih mengikuti metode yang biasa memproses seluruh urutan input sebelum menghasilkan output, bagaimanapun, mereka mempertahankan kontinuitas yang stabil dalam pemrosesan input dan streaming output mereka. Ini memfasilitasi pengenalan dan pemrosesan ucapan waktu nyata. Anda melihat ini dengan Asisten Google, yang dapat memproses perintah suara berturut-turut tanpa goyah dan tanpa mengharuskan Anda untuk memanggil 'Hai, Google' setelah setiap permintaan.

Itu membuat percakapan dua arah lebih alami, dan Asisten akan mengikuti instruksi Anda ke T. Ingin itu mengatur subjek email, menemukan foto di salah satu folder Anda, dan memandu Anda ke tempat saudara perempuan Anda? Selesai.

Ke depan dengan Pixel 4 baru Google, fitur Live Caption-nya dapat memberikan subtitle ke catatan audio, podcast, dan video secara real time dan — karena pemrosesannya ada di perangkat — juga dalam mode pesawat. Jadi, misalnya, jika sebuah video muncul di umpan Twitter Anda, Anda dapat mengetahui tentang apa itu dari keterangannya, tanpa perlu mengaktifkan audio. Teks Otomatis belum berfungsi dengan musik atau dengan panggilan telepon dan video.

2. Peningkatan efisiensi dengan pengenalan gerakan

Dengan model saluran pembelajaran mesin di perangkat, Anda dapat melatih perangkat seluler Anda untuk mendeteksi, melacak, dan mengenali gerakan tangan dan tubuh. Kamera perangkat Anda merekam dan menyimpan gerakan dan gerakan Anda sebagai data gambar 3D. Algoritme pembelajaran mendalam jaringan saraf kemudian menggunakan pustaka gerakan ini untuk mengidentifikasi dan menguraikan gerakan statis dan dinamis tertentu. Mereka kemudian mencocokkannya secara real time dengan maksud Anda dan menjalankan perintah yang Anda inginkan.

Ponsel cerdas Google Pixel 4 hadir dengan chip Soli yang memfasilitasi interaksi kompleks dan nonverbal dengan ponsel Anda. Sensor radar mini di bagian atas ponsel ini mendukung teknologi Motion Sense yang dapat mendeteksi keberadaan Anda serta gerakan tangan dan tubuh untuk memungkinkan interaksi ponsel Anda. Dengan lambaian tangan, bahkan tanpa menyentuh ponsel, Anda dapat memerintahkannya untuk menunda, mengheningkan alarm, atau menavigasi ke lagu berikutnya di daftar putar Anda.

3. Kemampuan mendalam dari Augmented Reality

Menggunakan platform ARCore Google dan ARKit Apple, pengembang dapat membangun aplikasi augmented reality yang dapat menyandingkan objek dan lingkungan digital dengan pengaturan kehidupan nyata . Kemampuan imersif augmented reality berbasis telepon memiliki dampak signifikan pada ritel, hiburan, perjalanan, dan industri lainnya. Merek seperti Lacoste dan Sephora sekarang memungkinkan pelanggan mereka untuk mencoba atau melihat pratinjau produk dengan aplikasi augmented reality, dan semakin banyak pembeli yang lebih memilih untuk memeriksa produk di ponsel mereka sebelum membuat keputusan untuk membelinya.

Game augmented reality interaktif seperti Pokemon, Ingress, dan Ghostbusters World telah menerima banyak pers dan pengikut khusus. Jika Anda ingin menemukan jalan di sekitar kota, Google Maps Live View akan memberi Anda navigasi waktu nyata.

4. Foto berkualitas lebih tinggi

Kualitas foto yang tinggi merupakan kriteria penting bagi pembeli saat memilih smartphone, yang bisa mereka dapatkan dengan banyak model terbaru. Ini dilengkapi dengan komponen perangkat keras — unit pemrosesan pusat (CPU), pemroses sinyal gambar, algoritme gambar pembelajaran mendalam, dan unit pemrosesan saraf — yang telah melontarkan ponsel cerdas ke ranah yang sama sekali berbeda dari kamera tradisional dalam hal mengambil foto. Dengan ini, smartphone dapat menunjukkan lebih banyak kesadaran pada tingkat klasifikasi piksel dari apa yang mereka lihat untuk memotret foto definisi tinggi.

Ponsel Google Pixel dan Apple iPhone menggunakan beberapa kamera dan algoritme pembelajaran mesin yang kompleks untuk mengenali orang dan objek, membuat peta kedalaman, menggabungkan eksposur panjang dengan mulus, dan menghitung keseimbangan warna yang akurat .

Dengan melatih jaringan saraf pada kumpulan data gambar, algoritme mempelajari cara merespons kebutuhan gambar individual dan memperbaiki foto secara real time. Dikembangkan oleh peneliti dari MIT dan Google, sistem retouching otomatis memungkinkan fotografer untuk menerapkan gaya yang berbeda pada gambar bahkan sebelum mereka mengambil gambar.

Setelah jaringan konvolusi melakukan pemrosesan gambar pada resolusi rendah, metode pemetaan yang dikenal sebagai transformasi warna affine memodifikasi warna piksel gambar. Jaringan menyimpan rumus transformasi ini dalam kisi 3D yang kemudian memungkinkan keluaran gambar beresolusi tinggi. Semuanya terjadi dalam milidetik.

Smartphone sekarang juga melampaui DSLR dalam cahaya rendah dan fotografi malam. Dengan menggabungkan jaringan saraf dan sensor yang dalam, kamera smartphone dapat menangkap gambar yang lebih tajam dengan lebih banyak warna daripada yang dapat dilihat oleh mata manusia.

Huawei, yang memperkenalkan bidikan cahaya rendah yang dapat diterapkan dengan P20 Pro-nya, menggunakan filter RYYB, sensor besar, dan pemrosesan gambar AI dalam seri Mate 30 untuk menawarkan fotografi cahaya rendah berkualitas tinggi serta videografi cahaya rendah. Google Pixel 4 hadir dengan mode Night Sight yang dapat mengambil foto dalam kisaran 0,3-3 lux, dan astrofotografinya dapat menangkap langit gelap berbintang. Seiring dengan mode malam yang aktif secara otomatis dalam gelap, sistem Deep Fusion baru Apple akan menyesuaikan dengan tingkat cahaya dan membawa fotografi iPhone ke tingkat yang lebih mengesankan.

Bahkan jika Anda tidak memiliki pemahaman tentang fotografi, Anda akan dapat mengambil foto yang bagus dengan smartphone ini.

5. Peningkatan keamanan dan privasi

Mematuhi Peraturan Perlindungan Data Umum (GDPR) dan California Consumer Privacy Act (CCPA) menjadi lebih mudah dengan pembelajaran mesin di perangkat. Ini menjamin keamanan data, karena Anda tidak perlu mengunggah data untuk biometrik, enkripsi, atau teks langsung ke server atau cloud untuk diproses.

Enkripsi otomatis pada perangkat adalah fitur ponsel cerdas lain yang berguna yang melindungi konten Anda dengan PIN, kata sandi, atau pola dan memungkinkan akses ke data Anda hanya saat Anda membuka kunci ponsel. Jadi, jika Anda kehilangan perangkat atau dicuri, kemungkinan siapa pun mendapatkan data Anda dapat diabaikan.

Fitur ID Wajah iPhone adalah salah satu contoh pengalaman smartphone yang lebih aman. Jaringan saraf pada perangkat dalam chip smartphone Apple memproses dan menyimpan data wajah pengguna dengan aman. Identifikasi terjadi pada perangkat Anda, sehingga privasi dan keamanan Anda tetap tidak terhalang.

Teknologi Face Unlock Google Pixel 4, yang difasilitasi oleh chip Soli, menggunakan pemetaan kedalaman 3D IR untuk membuat model wajah Anda untuk pengenalan wajah dan menyimpannya di chip keamanan Titan M6 di perangkat. Face Unlock bekerja dengan baik dengan aplikasi 1Password untuk menawarkan keamanan biometrik kepada pengguna dengan menghilangkan kemungkinan penipuan identitas. Untuk menyiapkan aplikasi 1Password di Pixel 4, Anda hanya perlu memasukkan detail Anda di IsiOtomatis dan menggunakan Face Unlock untuk masuk alih-alih fungsi Fingerprint Unlock.

6. Lebih akurat dalam pengenalan gambar

Dengan memasangkan pembelajaran mesin di perangkat dengan teknologi klasifikasi gambar, Anda dapat mengidentifikasi dan mendapatkan informasi mendetail secara real time tentang hampir semua hal yang Anda temui. Ingin membaca teks bahasa asing? Pindai dengan ponsel Anda untuk mendapatkan terjemahan yang instan dan akurat. Apakah pakaian atau perabot menarik minat Anda? Pindai untuk mendapatkan informasi tentang harga dan di mana Anda dapat membelinya. Apakah ada sajian baru yang menggiurkan di menu restoran? Anda dapat menggunakan ponsel Anda untuk mengetahui bahan dan informasi nutrisinya.

Dengan memfasilitasi pengenalan gambar secara real time, aplikasi seperti Google Lens, Calorie Mama, dan Leafsnap meningkatkan kegunaan dan kemampuan belajar perangkat seluler serta meningkatkan pengalaman pengguna.

Pembelajaran mendalam di perangkat seluler: pemikiran terakhir

Kemungkinan pembelajaran mesin di perangkat sangat besar. Dengan algoritme cerdas yang semakin efisien, jaringan saraf yang lebih dalam, dan chip AI yang lebih kuat, aplikasi seluler pembelajaran mendalam akan menjadi standar di perbankan, ritel, perawatan kesehatan, analitik data, teknologi informasi, telekomunikasi, aerospace, dan berbagai industri lainnya.

Menurut Verified Market Research, pasar pembelajaran mendalam global kemungkinan akan menyentuh $26,64 miliar pada tahun 2026, dengan pasar teknologi chipset pembelajaran mendalam mencapai $2,9 miliar. Seiring dengan peningkatan kemampuan pembelajaran mendalam, fitur kegunaan perangkat seluler akan berkembang bersama dan mendorong inovasi lebih lanjut.

Siap untuk proyek perangkat lunak Anda berikutnya? Hubungi kami!