Como adicionar soluções de Machine Learning ao seu negócio usando a AWS

Publicados: 2020-05-13

O aprendizado de máquina está em constante evolução e desempenha um grande papel na economia global, pois permite a análise rápida e automática de grandes porções de dados.

Para aproximar ainda mais a tecnologia de machine learning dos programadores, a Amazon oferece atualmente mais de 10 serviços de machine learning e inteligência artificial em sua plataforma AWS. Com esses serviços, você pode começar a construir modelos de forma simples, o que pode elevar seu negócio para o próximo nível.

A maioria desses serviços é totalmente gerenciada, o que significa que, para usá-los, você não precisa de nenhuma experiência de aprendizado de máquina, pois essas ferramentas aproveitam modelos pré-treinados para trabalhar com dados. Dependendo do seu problema de negócios, você pode escolher entre serviços de ML pré-treinados em áreas como visão computacional, processamento de linguagem natural, recomendações e previsão. O gráfico abaixo mostra um fluxo de trabalho da solução de Machine Learning, juntamente com as ferramentas da AWS que você pode usar em cada um dos estágios.

Etapas da criação de soluções de Machine Learning

Como aplicar o Machine Learning aos negócios com a AWS

Primeiro: Coletando os Dados

O elemento mais importante na criação de soluções de ML são os dados. Existem 3 tipos de dados: estruturados, semiestruturados e não estruturados.

  • Os elementos de dados estruturados são endereçáveis ​​e podem ser armazenados em um banco de dados relacional. Este tipo de dados tem um esquema predefinido. Um exemplo de dados estruturados é um banco de dados relacional com dados numéricos e de string (texto).
  • Os conjuntos de dados semiestruturados não residem em bancos de dados relacionais, mas, no entanto, possuem alguns elementos predefinidos (esquema) que os tornam mais fáceis de analisar. Exemplos de tipos de arquivos de dados semiestruturados são XML, HTML, RDF ou JSON.
  • Dados não estruturados são todo o resto. Esse tipo de dados não possui uma estrutura predefinida e geralmente são armazenados como um conjunto de arquivos. Os exemplos de dados não estruturados mais populares são documentos de texto, fotos, arquivos de vídeo e áudio e logs de aplicativos.

Carregamento de dados – o que é Kinesis?

O serviço AWS Kinesis ingere dados que podem ser gerados continuamente de várias fontes, por exemplo, aplicativos da Web e móveis. É um serviço de streaming de dados em tempo real que pode capturar gigabytes de dados muito rapidamente. O Kinesis oferece as seguintes ferramentas:

  • Kinesis Video Streaming – uma ferramenta que pode ajudar você a fazer streaming de vídeo de dispositivos para a AWS
  • Kinesis Data Streaming – uma ferramenta que pode ajudá-lo a coletar dados como logs de TI, cliques em sites ou transações financeiras
  • Kinesis Data Firehose – uma ferramenta para carregar dados transmitidos em armazenamentos de dados (por exemplo, S3, Redshift) ou ferramentas de análise
  • Kinesis Data Analytics – uma ferramenta que processa dados transmitidos em tempo real com SQL ou Java

Carregamento de dados – o que é Glue?

Outro serviço da AWS que pode ajudar no carregamento de dados é o Glue , que é gerenciado pelo Apache Spark . É uma ferramenta de extração, transformação e carregamento (ETL) que pode ser usada para preparar dados antes de serem usados ​​para análise. O Glue pode trabalhar com dados estruturados e semiestruturados.

Os elementos do Glue são Catálogo de Dados, mecanismo ETL e um agendador. O Catálogo de Dados do Glue é a parte mais importante da ferramenta. Ele salva os metadados sobre os dados fornecidos, descobertos automaticamente pelos rastreadores que percorrem as fontes de dados e detectam seu esquema.

Os mecanismos ETL podem gerar código Python e Scala para uso no processo ETL para usuários não programadores. Também pode processar dados com um código fornecido pelo usuário. O agendador pode monitorar trabalhos, executar tarefas e acioná-los com base em alguns eventos (por exemplo, em um horário específico toda segunda-feira ou quando outra tarefa é concluída ou falha).

Em segundo lugar: escolhendo as ferramentas certas de aprendizado de máquina

Depois de coletarmos os dados de que precisamos, podemos começar a construir nossas soluções de ML. A AWS oferece algumas ferramentas de aprendizado de máquina que podem processar dados de vários tipos.

Vamos agora dar uma olhada em cada uma dessas ferramentas, e apresentar suas principais possíveis áreas de aplicação nos negócios .

O que é o Sage Maker?

O SageMaker é mais útil para desenvolvedores de aprendizado de máquina e cientistas de dados. Este serviço é uma solução completa que ajuda a levar os modelos de machine learning do conceito à produção com o mínimo de esforço. O Amazon SageMaker possui um rico conjunto de ferramentas (Ground Truth, Notebooks, Experiments, Debugger, Model Monitor, Neo) que podem ajudar na rotulagem de dados, construção, otimização, treinamento, teste e implantação de modelos.

Encontrar o algoritmo certo manualmente para um determinado problema geralmente requer horas de treinamento e teste. O SageMaker tem uma opção AutoPilot, que usa 50 modelos de ML pré-treinados diferentes para encontrar automaticamente o melhor modelo de ML para o caso em questão. Os desenvolvedores podem usar essa solução para encontrar rapidamente um modelo de linha de base.

O que é Personalizar?

Personalize é um serviço de aprendizado de máquina que ajuda a construir sistemas de recomendação. O Personalize pode processar fluxos de atividades de aplicativos, por exemplo, cliques, visualizações de página, compras e usá-los para criar recomendações personalizadas. Você também pode usar informações adicionais sobre seus usuários, como idade ou localização geográfica. A exibição de resultados de recomendações em seu aplicativo pode ser simplificada com chamadas de API curtas. A tecnologia de aprendizado de máquina no Personalize foi aprimorada por anos de uso pela Amazon.com.

O que é Compreender?

Comprehend é um serviço de processamento de linguagem natural (NLP) que usa aprendizado de máquina para extrair informações valiosas de dados textuais não estruturados. Esse serviço aplica análise de sentimento, extração de parte da fala e tokenização para detectar os principais recursos do texto. Compreender pode ser útil para entender o quão positivo ou negativo é um determinado texto.

O Comprehend possui uma ferramenta adicional: o Amazon Comprehend Medical, especificamente para o setor médico. O Amazon Comprehend Medical pode analisar a documentação médica (como registros médicos de pacientes, notas clínicas) e extrair informações sobre medicamentos, doses e frequências. Compreender é um serviço totalmente gerenciado.

O que é Previsão?

A previsão usa aprendizado de máquina para criar modelos de previsão de séries temporais. Ele pode combinar dados históricos de séries temporais com variáveis ​​adicionais (que você acredita que podem afetar as previsões) para construir modelos preditivos. Essa solução da Amazon se aplica à previsão de valores como preços de ações ou demanda de produtos do cliente. A previsão também é um serviço totalmente gerenciado e pode ser dimensionado de acordo com as necessidades de negócios.

O que é Lex?

Lex usa reconhecimento automático de fala (ASR) para converter fala em texto e compreensão de linguagem natural (NLU) para reconhecer a intenção do texto. Essa solução permite que o usuário crie bots de conversação.

Por exemplo, você pode usar o Lex como um substituto para o suporte manual ao cliente que responderá automaticamente às consultas dos clientes. O Amazon Lex usa a mesma tecnologia de aprendizado profundo que o Amazon Alexa (assistente virtual de IA da Amazon).

O que é Polly?

Polly é um serviço de nuvem que usa algoritmos de aprendizado profundo para converter texto em fala realista. Atualmente, ele suporta 60 vozes masculinas e femininas em 29 idiomas, incluindo japonês, chinês, coreano e árabe. Polly também pode lidar com horas, datas, unidades, frações e abreviações. Esta solução permite ao usuário criar aplicativos que podem falar.

O que é Detector de Fraude?

Fraud Detector é um serviço da AWS que pode ajudar a identificar atividades online fraudulentas, como fraudes de pagamento ou contas falsas. Este serviço é totalmente gerenciado para que um modelo de detecção de fraude possa ser criado com apenas alguns cliques.

O que é Textract?

Textract é um serviço que pode ler automaticamente dados de documentos digitalizados. O Textract pode processar milhões de páginas em questão de horas e pode ajudar a automatizar fluxos de trabalho de documentos. Este serviço é útil no processamento de documentos como pedidos de empréstimo ou documentação médica.

O que é Traduzir?

O Translate é um machine learning da AWS que pode ser reparado para realizar a tradução de texto de idioma para idioma. Ele usa modelos de aprendizado profundo para fornecer uma tradução de som mais precisa e natural, em comparação com algoritmos estatísticos tradicionais. O Translate suporta 54 idiomas (incluindo, por exemplo, africâner, búlgaro, estoniano) e 2.804 pares de idiomas.

O que é Reconhecimento?

O Rekognition é um serviço de visão computacional que pode reconhecer objetos, pessoas e texto de imagens e filmes. O Rekognition é capaz de identificar e comparar rostos, analisá-los e identificar algumas características faciais, como boca, nariz ou olhos.

O Rekognition possui um módulo para detectar automaticamente emoções como felicidade, tristeza ou surpresa em imagens faciais. Ele também pode realizar a verificação facial do usuário, que confirmará a identidade do usuário comparando a imagem em tempo real com a imagem de referência armazenada.

Terceiro: implantação de soluções de aprendizado de máquina

O método mais usado de implantação de modelos é o SageMaker Service, que pode ser usado de duas maneiras:

  • Usando o SageMaker Hosting Service para configurar endpoints HTTPS. Nesta solução, os aplicativos clientes enviam solicitações para endpoints HTTPS para obter previsões de modelos implantados. Para usar essa solução, você deve fornecer sua imagem do Docker. Se você precisar implantar vários modelos, também poderá usar endpoints de vários modelos.
  • Usando o SageMaker Batch Transform , que ajuda você a obter previsões para um conjunto de dados inteiro. Para implantar um modelo usando o Batch Transform, você precisa de um bucket do S3 para armazenar o modelo, os conjuntos de dados e as previsões.

A alternativa de implantação é usar o AWS IoT Greengrass . Este serviço estende a AWS aos dispositivos da Internet das Coisas (IoT). Usando esse serviço, os dispositivos podem coletar, filtrar, processar dados e também podem executar funções Lambda, contêineres Docker e executar previsões com base em modelos de ML mesmo sem conexão com a nuvem. Quando conectado à internet, o Greengrass sincroniza todos os dados com os serviços em nuvem.

Resumo

Como você pode ver, o Amazon Web Service oferece um rico conjunto de ferramentas que podem ajudá-lo a criar soluções de aprendizado de máquina impactantes para seus negócios. Com as ferramentas ML AWS, você pode adicionar novos recursos aos seus aplicativos, como detecção de rosto, chatbots, reconhecimento de fala, análise de sentimentos de conteúdo de mídia social. A AWS adiciona novos serviços de ML, com base em novos casos de uso, a cada poucos meses, o que a torna uma das plataformas de crescimento mais rápido para a criação de soluções de IA.

Desenvolva uma solução de aprendizado de máquina à prova de futuro com a Miquido!