Cum să adăugați soluții de învățare automată în afacerea dvs. folosind AWS

Publicat: 2020-05-13

Învățarea automată evoluează constant și joacă un rol important în economia globală, deoarece permite analiza rapidă și automată a unor porțiuni mari de date.

Pentru a aduce tehnologia de învățare automată și mai aproape de programatori, Amazon oferă în prezent peste 10 servicii de învățare automată și inteligență artificială pe platforma sa AWS. Cu aceste servicii, puteți începe să construiți modele într-un mod simplu, care vă pot ridica afacerea la următorul nivel.

Cele mai multe dintre aceste servicii sunt complet gestionate, ceea ce înseamnă că pentru a le utiliza, nu aveți nevoie de nicio experiență de învățare automată, deoarece aceste instrumente folosesc modele pre-instruite pentru lucrul cu date. În funcție de problema dvs. de afaceri, puteți alege dintre servicii ML pre-instruite în domenii precum viziunea computerizată, procesarea limbajului natural, recomandări și prognoză. Graficul de mai jos arată un flux de lucru pentru soluția de învățare automată, împreună cu instrumente AWS pe care le puteți utiliza în fiecare dintre etape.

Etapele creării soluțiilor de învățare automată

Cum să aplicați Machine Learning în afaceri cu AWS

În primul rând: Colectarea datelor

Cel mai important element în crearea soluțiilor ML sunt datele. Există 3 tipuri de date: structurate, semi-structurate și nestructurate.

  • Elementele de date structurate sunt adresabile și pot fi stocate într-o bază de date relațională. Acest tip de date are o schemă predefinită. Un exemplu de date structurate este o bază de date relațională cu date numerice și șir (text).
  • Seturile de date semi-structurate nu se află în baze de date relaționale, dar au totuși unele elemente predefinite (schemă) care le fac mai ușor de analizat. Exemple de tipuri de fișiere de date semi-structurate sunt XML, HTML, RDF sau JSON.
  • Datele nestructurate sunt orice altceva. Acest tip de date nu are o structură predefinită și sunt de obicei stocate ca un set de fișiere. Cele mai populare exemple de date nestructurate sunt documentele text, fotografiile, fișierele video și audio și jurnalele de aplicații.

Încărcarea datelor – ce este Kinesis?

Serviciul AWS Kinesis ingerează date care pot fi generate continuu din diverse surse, de exemplu aplicații web și mobile. Este un serviciu de streaming de date în timp real care poate captura foarte rapid gigaocteți de date. Kinesis oferă următoarele instrumente:

  • Kinesis Video Streaming – un instrument care vă poate ajuta să transmiteți în flux video de pe dispozitive către AWS
  • Kinesis Data Streaming – un instrument care vă poate ajuta să colectați date cum ar fi jurnalele IT, clicurile pe site sau tranzacțiile financiare
  • Kinesis Data Firehose – un instrument pentru a încărca datele transmise în flux în depozite de date (de exemplu, S3, Redshift) sau instrumente de analiză
  • Kinesis Data Analytics – un instrument care procesează datele transmise în flux în timp real cu SQL sau Java

Încărcarea datelor – ce este Glue?

Un alt serviciu AWS care poate ajuta la încărcarea datelor este Glue , care este gestionat de Apache Spark . Este un instrument de extragere, transformare și încărcare (ETL) care poate fi utilizat pentru a pregăti date înainte de a fi utilizat pentru analiză. Glue poate funcționa atât cu date structurate, cât și cu date semi-structurate.

Elementele Glue sunt Data Catalog, motorul ETL și un planificator. Catalogul de date Glue este cea mai importantă parte a instrumentului. Salvează metadatele despre datele date, descoperite automat de crawlerele care parcurg sursele de date și le detectează schema.

Motoarele ETL pot genera cod Python și Scala pentru a fi utilizat în procesul ETL pentru utilizatorii care nu sunt programatori. De asemenea, poate prelucra date cu un cod furnizat de utilizator. Planificatorul poate monitoriza joburi, executa sarcini și le poate declanșa pe baza unor evenimente (de exemplu, la o anumită oră în fiecare luni, sau când o altă sarcină se finalizează sau eșuează).

În al doilea rând: Alegerea instrumentelor potrivite de învățare automată

După ce am colectat datele de care avem nevoie, putem începe să construim soluțiile noastre ML. AWS oferă câteva instrumente de învățare automată care pot procesa date de diferite tipuri.

Să aruncăm acum o privire la fiecare dintre aceste instrumente și să prezentăm principalele lor domenii posibile de aplicare în afaceri .

Ce este SageMaker?

SageMaker este cel mai util pentru dezvoltatorii de învățare automată și pentru oamenii de știință ai datelor. Acest serviciu este o soluție completă care ajută la preluarea modelelor de învățare automată de la concept la producție cu efort minim. Amazon SageMaker are un set bogat de instrumente (Ground Truth, Notebook-uri, Experiments, Debugger, Model Monitor, Neo) care pot ajuta la etichetarea datelor, construirea, optimizarea, instruirea, testarea și implementarea modelelor.

Găsirea manuală a algoritmului potrivit pentru o anumită problemă necesită adesea ore de instruire și testare. SageMaker are o opțiune AutoPilot, care utilizează 50 de modele ML diferite pre-antrenate pentru a găsi automat cel mai bun model ML pentru cazul în cauză. Dezvoltatorii pot folosi această soluție pentru a găsi rapid un model de bază.

Ce este Personalize?

Personalize este un serviciu de învățare automată care ajută la construirea sistemelor de recomandare. Personalize poate procesa fluxuri de activitate din aplicații, de exemplu clicuri, vizualizări de pagină, achiziții și le poate folosi pentru a crea recomandări personalizate. De asemenea, puteți utiliza informații suplimentare despre utilizatorii dvs., cum ar fi vârsta sau locația geografică. Afișarea rezultatelor recomandărilor în aplicația dvs. poate fi simplificată cu apeluri API scurte. Tehnologia de învățare automată din Personalize a fost îmbunătățită de ani de zile de utilizare de către Amazon.com.

Ce este Comprehend?

Comprehend este un serviciu de procesare a limbajului natural (NLP) care utilizează învățarea automată pentru a extrage informații valoroase din date textuale nestructurate. Acest serviciu aplică analiza sentimentelor, extragerea unei părți din vorbire și tokenizarea pentru a detecta caracteristicile cheie ale textului. Înțelegerea poate fi utilă pentru a înțelege cât de pozitiv sau negativ este un anumit text.

Comprehend are un instrument suplimentar: Amazon Comprehend Medical, special pentru industria medicală. Amazon Comprehend Medical poate analiza documentația medicală (cum ar fi fișele medicale ale pacienților, note clinice) și poate extrage informații despre medicamente, doze și frecvențe. Comprehend este un serviciu complet gestionat.

Ce este Prognoza?

Forecast folosește învățarea automată pentru a construi modele de predicție în serie de timp. Poate combina datele istorice ale seriei cronologice cu variabile suplimentare (care credeți că pot avea impact asupra prognozelor) pentru a construi modele predictive. Această soluție Amazon se aplică pentru prezicerea unor valori precum prețurile acțiunilor sau cererea de produse ale clienților. Forecast este, de asemenea, un serviciu complet gestionat și poate fi adaptat la nevoile afacerii.

Ce este Lex?

Lex folosește recunoașterea automată a vorbirii (ASR) pentru a converti vorbirea în text și Natural Language Understanding (NLU) pentru a recunoaște intenția textului. Această soluție permite utilizatorului să construiască roboți conversaționali.

De exemplu, puteți utiliza Lex ca înlocuitor pentru asistența manuală pentru clienți, care va răspunde automat la întrebările clienților. Amazon Lex folosește aceeași tehnologie de învățare profundă ca și Amazon Alexa (asistentul virtual AI al Amazon).

Ce este Polly?

Polly este un serviciu cloud care folosește algoritmi de învățare profundă pentru a converti textul în vorbire reală. În prezent, acceptă 60 de voci masculine și feminine în 29 de limbi, inclusiv japoneză, chineză, coreeană și arabă. Polly poate gestiona, de asemenea, ora, datele, unitățile, fracțiile și abrevierile. Această soluție permite utilizatorului să creeze aplicații care pot vorbi.

Ce este Fraud Detector?

Fraud Detector este un serviciu AWS care poate ajuta la identificarea activităților online frauduloase, cum ar fi fraudele de plată sau conturile false. Acest serviciu este gestionat integral, astfel încât un model de detectare a fraudei poate fi creat cu doar câteva clicuri.

Ce este Text?

Texttract este un serviciu care poate citi automat date din documentele scanate. Texttract poate procesa milioane de pagini în câteva ore și poate ajuta la automatizarea fluxurilor de lucru ale documentelor. Acest serviciu este util în procesarea documentelor precum cererile de împrumut sau documentația medicală.

Ce este Translate?

Translate este o aplicație de învățare automată AWS care poate efectua traduceri de text dintr-o limbă în altă limbă. Utilizează modele de învățare profundă pentru a oferi o traducere mai precisă și mai naturală, în comparație cu algoritmii statistici tradiționali. Translate acceptă 54 de limbi (inclusiv, de exemplu, afrikaans, bulgară, estonă) și 2.804 perechi de limbi.

Ce este recunoașterea?

Rekognition este un serviciu de viziune computerizată care poate recunoaște obiecte, oameni și text din imagini și filme. Rekognition este capabil să identifice și să compare fețe, să le analizeze și să identifice unele trăsături faciale, cum ar fi gura, nasul sau ochii.

Rekognition are un modul pentru a detecta automat emoții precum fericirea, tristețea sau surpriza în imaginile faciale. De asemenea, poate efectua verificarea feței utilizatorului, care va confirma identitatea utilizatorului prin compararea imaginii în timp real cu imaginea de referință stocată.

În al treilea rând: implementarea soluțiilor de învățare automată

Cea mai utilizată metodă de implementare a modelelor este SageMaker Service, pe care îl puteți utiliza în unul dintre două moduri:

  • Utilizarea serviciului de găzduire SageMaker pentru a configura punctele finale HTTPS. În această soluție, aplicațiile clienților trimit cereri către punctele terminale HTTPS pentru a obține predicții de la modelele implementate. Pentru a utiliza această soluție, trebuie să îi furnizați imaginea Docker. Dacă trebuie să implementați mai multe modele, puteți utiliza și puncte finale cu mai multe modele.
  • Folosind SageMaker Batch Transform , care vă ajută să obțineți predicții pentru un întreg set de date. Pentru a implementa un model folosind Batch Transform, aveți nevoie de un bucket S3 pentru a stoca modelul, seturile de date și predicțiile.

Alternativa de implementare este utilizarea AWS IoT Greengrass . Acest serviciu extinde AWS la dispozitivele Internet of Things (IoT). Folosind acest serviciu, dispozitivele pot colecta, filtra, procesa date și, de asemenea, pot rula funcții Lambda, containere Docker și pot executa predicții bazate pe modele ML chiar și fără conexiune la cloud. Când este conectat la internet, Greengrass sincronizează toate datele cu serviciile cloud.

rezumat

După cum puteți vedea, Amazon Web Service oferă un set bogat de instrumente care vă pot ajuta să creați soluții de învățare automată de impact pentru afacerea dvs. Cu instrumentele ML AWS puteți adăuga noi funcții la aplicațiile dvs., cum ar fi detectarea feței, chatbots, recunoașterea vorbirii, analiza sentimentelor conținutului din rețelele sociale. AWS adaugă noi servicii ML, bazate pe noi cazuri de utilizare, la fiecare câteva luni, ceea ce o face una dintre platformele cu cea mai rapidă creștere pentru crearea de soluții AI.

Dezvoltați o soluție de învățare automată pe viitor cu Miquido!