機械学習の基本:知っておくべきこと
公開: 2022-04-17気づかないかもしれませんが、機械学習は、携帯電話やその他のデバイスの仮想アシスタントの音声認識機能から、Netflixで視聴する番組や、YouTubeで推奨される動画まで、私たちの日常生活に存在しています。
ビッグデータが成長し、ますます多くのデータサイエンティストがこれらのアルゴリズムに取り組むにつれて、マーケティングもこれを広範に利用しています。 ギリシャ語のように聞こえるかもしれませんが、心配しないでください。機械学習の基本について説明します。
機械学習の定義
機械学習は、人工知能(AI)とコンピューターサイエンスの分野であり、機械がデータから「学習」できるようにします。 この文脈で学ぶということは、何百万ものデータポイントの複雑なパターンを特定し、それらを比較し、人間が知識を獲得して問題を解決する方法を再現しようとすることを意味します。 このプロセスは、データを確認し、将来の動作を予測できるアルゴリズムによって実行されます。 時間の経過とともに、これらのアルゴリズムとシステムは自律的に学習し、改善します。
機械学習アルゴリズムの仕組みは次のとおりです。最初のデータ入力後、アルゴリズムは情報を分類し、データ内の可能なパターンに関する推定値を生成します。 これらの予測は、モデルの精度をチェックする誤差関数を介してアルゴリズムによって評価されます。 これを行うために、アルゴリズムはさまざまなサンプルを比較し、プロセスの評価と最適化に取り組み、予測の精度を向上させます。
機械学習とAI
機械学習とAIは非常に強いつながりがありますが、責任も異なります。 AIは、人間の行動をシミュレートして複雑な問題を解決するインテリジェントなコンピューターシステムを作成することを目的としていますが、機械学習は実際にはAIのブランチであり、機械がデータ処理から学習して正確な結果を提供できるようにします。 AIは、さまざまな複雑なタスクを実行できるインテリジェントシステムの作成に取り組んでいます。 一方、機械学習は、トレーニングを受けた特定のタスクのみを実行できるマシンを作成しようとします。
ディープラーニングとニューラルネットワークは機械学習の2つの重要な側面であるため、ここで考慮することも重要です。 基本的に、深層学習はニューラルネットワークのサブカテゴリであり、機械学習のサブカテゴリです。 ディープラーニングは、プロセスからのデータ抽出の多くを自動化しますが、ニューラルネットワークは、人間の推論を模倣することを目的とした、人間の脳をモデルにした一連のアルゴリズムです。 つまり、ニューラルネットワークは、コンピューターがディープラーニングを通じてAIを作成するのに役立ちます。
AIと機械学習の機能は数多くありますが、私たちの日常生活に関連するものに焦点を当てましょう。
- トレンドやパターンを予測し、人の検索、いいね、インタラクションに応じて商品を推奨したり、広告を表示したりします。
- デバイスに音楽の再生や電話をかけるときのように、音声認識と言語理解。
- ビデオおよび画像処理。 たとえば、Facebookが写真内の顔を自動的に識別し、タグ付けするように人々に提案する場合です。
- 感情分析。これは、製品に対する人々の意見を分析し、プロバイダーに洞察を与えることを指します。

3種類の機械学習
機械学習は、教師あり学習、教師なし学習、強化学習の3つのカテゴリに分類できます。
教師あり学習
これは、機械学習の最も一般的なアプリケーションです。 教師あり学習アルゴリズムは、以前にラベル付けされたトレーニングデータセットに基づいて学習します。 ここでのラベル付けは、トレーニングデータセットの各ポイントについて、そのターゲット属性の値がわかっていることを意味します。 これにより、アルゴリズムは、新しいデータセットのターゲット属性を予測できる関数を「学習」できます。
ラベル付けされた例は、一度に1つずつアルゴリズムに提示され、アルゴリズムは予測を行う必要があります。 次に、人間の監督者は、アルゴリズムによって行われた各予測をチェックし、それが正しいかどうかを判断します。 このプロセスは、アルゴリズムが例とそのラベルの間の関係を独自に予測できるようになるまで、何度も繰り返されます。 これが行われると、アルゴリズムは新しい例を処理し、それらのラベルを予測できるようになります。
この最も簡単な例は、電子メールのスパム/非スパムの分類です。 まず、マシンには、迷惑メールとは何か、そうでないものと、ユーザーのためにそれらを区別する方法の一連の例が示されます。 最終的には、2つのフォルダー内の電子メールを自律的にソートできるようになります。
教師なし学習
教師なし学習は、教師あり学習の反対です。 ここで、アルゴリズムは、事前に定義されたラベルのないデータセットに基づいてトレーニングプロセスを実行します。 教師なし学習は、クラスタリングとも呼ばれるグループ化タスクに基づいており、目的はデータセット内の類似したグループを見つけることです。 言い換えれば、一連のデータとツールがアルゴリズムに与えられ、それによって情報プロパティがそれ自体で識別され、人間や他のマシンが理解できる方法でそれらがソートされます。
例として、HBO、Amazon、Netflixなどのプラットフォームで推奨されるリストがあります。 番組や映画を見ると、プラットフォームはそのデータと特性を収集して、興味のある他の同様の番組や映画を見つけます。
強化学習
この方法は大きく異なります。 ラベルはまったく使用されません。代わりに、アルゴリズムは開発中に試行錯誤によって学習します。 ソフトウェアは、実行する各アクションの誤りから学習するため、メソッドの品質が向上します。 強化学習には、エージェント(トレーニング対象のプログラム)、アンビエント(エコシステム)、アクション(エージェントによる一連のアクション)、および報酬(アクションの評価、ポジティブまたはネガティブ)の4つの重要な要素があります。 ビデオゲームはこの試行錯誤システムを多く使用しており、強化学習の優れた例です。
この機械学習の簡単な紹介が、基本を説明し、このトピックをより明確に理解するのに役立つことを願っています。 複雑になることもありますが、マーケティングの世界で大きな役割を果たしている今日でも欠かせません。 信じられない場合は、Alexaに聞いてください。