6 วิธีที่คุณสามารถใช้ Deep Learning เพื่อปรับปรุงความสามารถในการใช้งานของอุปกรณ์พกพา
เผยแพร่แล้ว: 2020-01-23ด้วยความต้องการทั่วโลกที่เพิ่มขึ้นสำหรับประสบการณ์มือถือที่ได้รับการปรับปรุงและเป็นส่วนตัวมากขึ้น AI ที่แพร่หลายและการปรับตัวเชิงลึกในอุตสาหกรรมการพัฒนาแอพมือถือเป็นสิ่งที่หลีกเลี่ยงไม่ได้ ลืมปัญหาเวลาแฝงที่น่าผิดหวังที่เกิดจากการตรวจจับอุปกรณ์เคลื่อนที่และการประมวลผลแบบคลาวด์ เวลาแฝงใกล้ศูนย์อยู่ใกล้แค่เอื้อม พร้อมความเร็วในการประมวลผลข้อมูลแบบเรียลไทม์เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
ชิปสมาร์ทโฟน Bionic ขั้นสูงของ Apple ที่มีหน่วยประมวลผลประสาทในตัวช่วยให้เครือข่ายประสาททำงานบนอุปกรณ์โดยตรงด้วยความเร็วที่เหลือเชื่อ การใช้แพลตฟอร์ม Core ML ของ Apple และ ML Kit ของ Google และไลบรารีการเรียนรู้เชิงลึก เช่น TensorFlow Lite และ Keras นักพัฒนามือถือสามารถสร้างแอปพลิเคชันที่มีเวลาแฝงที่ต่ำกว่า ข้อผิดพลาดน้อยลง และการประมวลผลข้อมูลเร็วขึ้น
ข้อได้เปรียบหลักของการเรียนรู้ของเครื่องในอุปกรณ์คือมอบประสบการณ์การใช้งานที่แม่นยำและราบรื่นแก่ผู้ใช้ เนื่องจากไม่มีปัญหาในการส่งข้อมูลไปยังเซิร์ฟเวอร์ภายนอกสำหรับการประมวลผล คุณจะได้รับการปกป้องข้อมูลที่ดีขึ้น ความปลอดภัยและความเป็นส่วนตัวของผู้ใช้ นอกจากนี้ ด้วยโครงข่ายประสาทเทียมบนอุปกรณ์มือถือ คุณไม่จำเป็นต้องเชื่อมต่ออินเทอร์เน็ตเพื่อเข้าถึงทุกคุณสมบัติในแอปพลิเคชันของคุณ แน่นอนว่าคุณยังต้องการอินเทอร์เน็ตสำหรับคุณสมบัติมาตรฐานส่วนใหญ่
6 วิธีในการปรับใช้ Deep Learning บนอุปกรณ์พกพา
การใช้ความสามารถในการประมวลผลของอุปกรณ์เคลื่อนที่เพื่อนำอัลกอริธึมการเรียนรู้เชิงลึกมาใช้ทำให้ความสามารถในการใช้งานของอุปกรณ์เคลื่อนที่ดีขึ้นอย่างไม่ต้องสงสัย นี่คือวิธี:
1. การรู้จำคำพูดบนอุปกรณ์
การรู้จำเสียงเกี่ยวข้องกับการแปลงหรือแปลงลำดับอินพุตเป็นลำดับเอาต์พุตโดยใช้โครงข่ายประสาทเทียมแบบเกิดซ้ำ (RNN) โครงข่ายประสาทเทียมแบบโค้ง (CNN) โครงข่ายประสาทลึก (DNN) และสถาปัตยกรรมอื่นๆ นักพัฒนาต้องดิ้นรนกับปัญหาเวลาแฝง ซึ่งสร้างความล่าช้าระหว่างคำขอของคุณกับการตอบสนองของผู้ช่วยอัตโนมัติ แต่ตอนนี้เราสามารถแก้ไขได้โดยใช้เทคโนโลยีทรานสดิวเซอร์เครือข่ายนิวรัล (RNN-T) ขนาดกะทัดรัดในอุปกรณ์มือถือ
RNN-Ts เป็นโมเดลแบบเรียงต่อกัน อย่างไรก็ตาม แทนที่จะปฏิบัติตามวิธีปกติในการประมวลผลลำดับอินพุตทั้งหมดก่อนที่จะสร้างเอาต์พุต พวกเขายังคงรักษาความต่อเนื่องในการประมวลผลอินพุตและการสตรีมเอาต์พุต สิ่งนี้อำนวยความสะดวกในการรู้จำและประมวลผลคำพูดแบบเรียลไทม์ คุณเห็นสิ่งนี้ด้วย Google Assistant ซึ่งสามารถประมวลผลคำสั่งเสียงต่อเนื่องได้โดยไม่สะดุดและโดยที่คุณไม่ต้องเรียกใช้ 'Ok Google' หลังจากแต่ละคำขอ
ทำให้การสนทนาแบบสองทางเป็นธรรมชาติมากขึ้น และ Assistant จะทำตามคำแนะนำของคุณกับ T ต้องการให้ตั้งหัวเรื่องอีเมล ค้นหารูปภาพในโฟลเดอร์ใดโฟลเดอร์หนึ่งของคุณ และนำทางคุณไปยังที่ของพี่สาว มันจบแล้ว.
ฟีเจอร์ Live Caption ของ Google Pixel 4 สามารถให้คำบรรยายสำหรับบันทึกเสียง พอดแคสต์ และวิดีโอแบบเรียลไทม์ได้ และเนื่องจากการประมวลผลอยู่ในอุปกรณ์ในโหมดบนเครื่องบินด้วย ตัวอย่างเช่น หากวิดีโอปรากฏในฟีด Twitter ของคุณ คุณสามารถค้นหาเนื้อหาเกี่ยวกับคำอธิบายภาพได้โดยไม่จำเป็นต้องเปิดเสียง คำบรรยายสดยังใช้งานไม่ได้กับเพลงหรือการโทรและแฮงเอาท์วิดีโอ
2. เพิ่มประสิทธิภาพด้วยการจดจำท่าทาง
ด้วยโมเดลไปป์ไลน์แมชชีนเลิร์นนิงในอุปกรณ์ คุณสามารถฝึกอุปกรณ์มือถือของคุณเพื่อตรวจจับ ติดตาม และจดจำท่าทางของมือและร่างกาย กล้องของอุปกรณ์บันทึกและจัดเก็บท่าทางสัมผัสและการเคลื่อนไหวของคุณเป็นข้อมูลภาพ 3 มิติ อัลกอริธึมการเรียนรู้เชิงลึกของเครือข่ายประสาทใช้ไลบรารีท่าทางสัมผัสนี้เพื่อระบุและถอดรหัสท่าทางคงที่และไดนามิกที่เฉพาะเจาะจง จากนั้นจับคู่ตามเวลาจริงกับความตั้งใจของคุณและดำเนินการคำสั่งที่คุณต้องการ
สมาร์ทโฟน Google Pixel 4 มาพร้อมกับชิป Soli ที่อำนวยความสะดวกในการโต้ตอบที่ซับซ้อนและไม่ใช้คำพูดกับโทรศัพท์ของคุณ เซ็นเซอร์เรดาร์ขนาดเล็กที่ด้านบนของโทรศัพท์นี้ให้พลังงานแก่ เทคโนโลยี Motion Sense ที่สามารถตรวจจับการมีอยู่ของคุณและท่าทางของมือและร่างกายเพื่อให้สามารถโต้ตอบกับโทรศัพท์ของคุณได้ ด้วยการโบกมือโดยไม่ต้องแตะโทรศัพท์ คุณสามารถบอกให้เครื่องปิดเสียงเตือนชั่วคราว ปิดเสียงปลุก หรือนำทางไปยังเพลงถัดไปในเพลย์ลิสต์ของคุณ
3. ความสามารถที่ล้ำลึกของ Augmented Reality
ด้วยการใช้แพลตฟอร์ม ARCore ของ Google และแพลตฟอร์ม ARKit ของ Apple นักพัฒนาสามารถสร้างแอป Augmented Reality ที่สามารถ วางวัตถุดิจิทัลและสภาพแวดล้อมด้วยการตั้งค่าในชีวิตจริง ความสามารถในการดื่มด่ำของเทคโนโลยีความจริงเสริมที่ใช้โทรศัพท์ส่งผลกระทบอย่างมากต่อธุรกิจค้าปลีก ความบันเทิง การเดินทาง และอุตสาหกรรมอื่นๆ ขณะนี้แบรนด์ต่างๆ เช่น Lacoste และ Sephora อนุญาตให้ลูกค้าทดลองใช้หรือดูตัวอย่างผลิตภัณฑ์ด้วยแอป Augmented Reality และผู้ซื้อจำนวนมากขึ้นต้องการตรวจสอบผลิตภัณฑ์บนโทรศัพท์ก่อนตัดสินใจซื้อ
เกมความเป็นจริงเสริมแบบอินเทอร์แอคทีฟ เช่น Pokemon, Ingress และ Ghostbusters World ได้รับการเผยแพร่อย่างกว้างขวางและมีผู้ติดตามจำนวนมาก หากคุณต้องการค้นหาเส้นทางรอบเมือง Google Maps Live View จะให้การนำทางแบบเรียลไทม์แก่คุณ
4. ภาพถ่ายคุณภาพสูงกว่า
คุณภาพของภาพถ่ายที่สูงเป็นเกณฑ์สำคัญสำหรับผู้ซื้อเมื่อเลือกสมาร์ทโฟน ซึ่งพวกเขาสามารถใช้ได้กับรุ่นล่าสุดหลายรุ่น สิ่งเหล่านี้มาพร้อมกับส่วนประกอบฮาร์ดแวร์ — หน่วยประมวลผลกลาง (CPU) โปรเซสเซอร์สัญญาณภาพ อัลกอริธึมภาพการเรียนรู้เชิงลึก และหน่วยประมวลผลประสาท — ที่ทำให้สมาร์ทโฟนอยู่ในขอบเขตที่แตกต่างจากกล้องทั่วไปอย่างสิ้นเชิงเมื่อต้องการถ่ายภาพ ด้วยสิ่งเหล่านี้ สมาร์ทโฟนสามารถแสดงความตระหนักมากขึ้นในระดับการจัดประเภทพิกเซลของสิ่งที่พวกเขาเห็นเพื่อถ่ายภาพความละเอียดสูง

โทรศัพท์ Google Pixel และ Apple iPhone ใช้กล้องหลายตัวและอัลกอริธึมแมชชีนเลิร์นนิงที่ซับซ้อนเพื่อ จดจำผู้คนและวัตถุ สร้างแผนที่ความลึก รวมการเปิดรับแสงนานอย่างราบรื่น และคำนวณความสมดุลของสีที่แม่นยำ
โดยการฝึกโครงข่ายประสาทเทียมในชุดข้อมูลของภาพ อัลกอริธึมจะเรียนรู้วิธีตอบสนองต่อข้อกำหนดของภาพแต่ละภาพและรีทัชภาพถ่ายแบบเรียลไทม์ ระบบรีทัชอัตโนมัติที่พัฒนาโดยนักวิจัยจาก MIT และ Google ช่วยให้ช่างภาพสามารถนำสไตล์ต่างๆ ไปใช้กับรูปภาพได้ก่อนที่จะถ่ายภาพด้วยซ้ำ
หลังจากที่เครือข่าย convolutional ดำเนินการประมวลผลภาพที่ความละเอียดต่ำ วิธีการทำแผนที่ที่เรียกว่า affine color transformation จะปรับเปลี่ยนสีพิกเซลของภาพ เครือข่ายเก็บสูตรการเปลี่ยนแปลงเหล่านี้ไว้ในตาราง 3 มิติ ซึ่งจะทำให้สามารถส่งออกภาพที่มีความละเอียดสูงได้ ทุกอย่างเกิดขึ้นภายในเสี้ยววินาที
สมาร์ทโฟนยังแซงหน้า DSLR ในการถ่ายภาพในที่แสงน้อยและกลางคืนด้วย กล้องสมาร์ทโฟนสามารถจับภาพที่คมชัดและมีสีสันมากกว่าที่ตามนุษย์จะรับรู้ได้ ด้วยการผสานเครือข่ายประสาทเทียมและเซ็นเซอร์ระดับลึก
Huawei ซึ่งเปิดตัวภาพถ่ายในที่แสงน้อยที่ใช้งานได้กับ P20 Pro ใช้ฟิลเตอร์ RYYB เซ็นเซอร์ขนาดใหญ่ และการประมวลผลภาพ AI ใน Mate 30 Series เพื่อนำเสนอภาพถ่ายคุณภาพสูงในที่แสงน้อยรวมถึงการถ่ายวิดีโอในที่แสงน้อย Google Pixel 4 มาพร้อมกับโหมด Night Sight ที่สามารถถ่ายภาพได้ในช่วง 0.3-3 ลักซ์ และการถ่ายภาพดาราศาสตร์ก็สามารถจับภาพท้องฟ้าที่มืดมิดและเต็มไปด้วยดวงดาวได้ นอกจากโหมดกลางคืนที่เปิดใช้งานโดยอัตโนมัติในที่มืดแล้ว ระบบ Deep Fusion ใหม่ของ Apple จะปรับระดับแสงและยกระดับการถ่ายภาพด้วย iPhone ให้น่าประทับใจยิ่งขึ้น
แม้ว่าคุณจะไม่มีความเข้าใจในการถ่ายภาพ คุณก็จะสามารถถ่ายภาพสวยๆ ด้วยสมาร์ทโฟนเหล่านี้ได้
5. เพิ่มความปลอดภัยและความเป็นส่วนตัว
การปฏิบัติตามกฎระเบียบให้ความคุ้มครองข้อมูลส่วนบุคคลของผู้บริโภค (GDPR) และ California Consumer Privacy Act (CCPA) ได้ง่ายขึ้นด้วยการเรียนรู้ของเครื่องในอุปกรณ์ รับประกันความปลอดภัยของข้อมูล เนื่องจากคุณไม่จำเป็นต้องอัปโหลดข้อมูลสำหรับไบโอเมตริก การเข้ารหัส หรือคำบรรยายสดไปยังเซิร์ฟเวอร์หรือระบบคลาวด์สำหรับการประมวลผล
การเข้ารหัสอัตโนมัติในอุปกรณ์เป็นคุณสมบัติที่มีประโยชน์อีกอย่างของสมาร์ทโฟน ซึ่งจะปกป้องเนื้อหาของคุณด้วย PIN, รหัสผ่าน หรือรูปแบบ และอนุญาตให้เข้าถึงข้อมูลของคุณเมื่อคุณปลดล็อกโทรศัพท์เท่านั้น ดังนั้น หากคุณทำอุปกรณ์หายหรือถูกขโมย โอกาสที่ทุกคนจะได้รับข้อมูลของคุณนั้นน้อยมาก
ฟีเจอร์ Face ID ของ iPhone เป็นตัวอย่างหนึ่งของประสบการณ์การใช้สมาร์ทโฟนที่ปลอดภัยยิ่งขึ้น โครงข่ายประสาทในอุปกรณ์ในชิปสมาร์ทโฟนของ Apple และจัดเก็บข้อมูลใบหน้าของผู้ใช้อย่างปลอดภัย การระบุตัวตนเกิดขึ้นบนอุปกรณ์ของคุณ ดังนั้นความเป็นส่วนตัวและความปลอดภัยของคุณจึงไม่มีอุปสรรค
เทคโนโลยี Face Unlock ของ Google Pixel 4 ซึ่งอำนวยความสะดวกโดยชิป Soli ใช้การแมปความลึก 3D IR เพื่อสร้างแบบจำลองใบหน้าของคุณสำหรับการจดจำใบหน้าและจัดเก็บไว้ในชิปรักษาความปลอดภัย Titan M6 บนอุปกรณ์ Face Unlock ทำงานได้ดีกับแอป 1Password เพื่อให้ผู้ใช้มีความปลอดภัยแบบไบโอเมตริกโดยขจัดโอกาสในการฉ้อโกงข้อมูลประจำตัว ในการตั้งค่าแอป 1Password บน Pixel 4 คุณเพียงแค่ป้อนรายละเอียดในการป้อนอัตโนมัติและใช้การปลดล็อกด้วยใบหน้าเพื่อลงชื่อเข้าใช้แทนฟังก์ชันปลดล็อกด้วยลายนิ้วมือ
6. ความแม่นยำในการจดจำภาพมากขึ้น
การจับคู่แมชชีนเลิร์นนิงในอุปกรณ์กับเทคโนโลยีการจัดหมวดหมู่รูปภาพ ช่วยให้คุณระบุและรับข้อมูลโดยละเอียดในแบบเรียลไทม์เกี่ยวกับเกือบทุกอย่างที่คุณพบ ต้องการอ่านข้อความภาษาต่างประเทศหรือไม่? สแกนด้วยโทรศัพท์ของคุณเพื่อรับการแปลที่รวดเร็วและแม่นยำ เสื้อผ้าหรือเฟอร์นิเจอร์ชิ้นไหนโดนใจคุณไหม? สแกนเพื่อรับข้อมูลเกี่ยวกับราคาและสถานที่ที่คุณสามารถซื้อได้ มีอาหารจานใหม่ที่น่าดึงดูดใจในเมนูร้านอาหารหรือไม่? คุณสามารถใช้โทรศัพท์เพื่อค้นหาส่วนผสมและข้อมูลทางโภชนาการของโทรศัพท์ได้
ด้วยการอำนวยความสะดวกในการจดจำภาพในแบบเรียลไทม์ แอปอย่าง Google Lens, Calorie Mama และ Leafsnap จะเพิ่มความสามารถในการใช้งานและการเรียนรู้ของอุปกรณ์มือถือ และปรับปรุงประสบการณ์ผู้ใช้
การเรียนรู้อย่างลึกซึ้งบนอุปกรณ์พกพา: ความคิดสุดท้าย
ความเป็นไปได้ของการเรียนรู้ของเครื่องบนอุปกรณ์นั้นมีมากมาย ด้วยอัลกอริธึมที่ชาญฉลาดมากขึ้น เครือข่ายประสาทเทียมที่ลึกกว่า และชิป AI ที่ทรงพลังยิ่งขึ้น แอปพลิเคชันมือถือที่มีการเรียนรู้เชิงลึกจะเป็นมาตรฐานในการธนาคาร การค้าปลีก การดูแลสุขภาพ การวิเคราะห์ข้อมูล เทคโนโลยีสารสนเทศ โทรคมนาคม การบินและอวกาศ และอุตสาหกรรมอื่นๆ
จากการวิจัยตลาดที่ได้รับการยืนยัน ตลาดการเรียนรู้เชิงลึกทั่วโลกมีแนวโน้มที่จะแตะ 26.64 พันล้านดอลลาร์ในปี 2569 โดยตลาดเทคโนโลยีชิปเซ็ตการเรียนรู้เชิงลึกจะสูงถึง 2.9 พันล้านดอลลาร์ ในขณะที่ความสามารถในการเรียนรู้เชิงลึกมีการปรับปรุงอย่างต่อเนื่อง ฟีเจอร์การใช้งานของอุปกรณ์พกพาจะพัฒนาควบคู่กันไปและขับเคลื่อนนวัตกรรมต่อไป
พร้อมสำหรับโครงการซอฟต์แวร์ครั้งต่อไปของคุณหรือยัง ติดต่อกับพวกเรา!