ーTech for Human Evolutionー

AGIの登場を間近に控え、さらっと機械学習をおさらいしてみる

AI（人工知能）ニュース

Headline News

野村貴之

[公開]

2025年2月13日14:31

[更新]2025年7月10日

本日、Altman氏のXにてChat-GPT 5の近日中の公開が発表されました。また、OpenAI社は今回標準的な知能設定のモデルについては無料ユーザーについても無制限で使用できる新サービス体制を発表しました。現在世界中でAIを活用するナレッジワーカーの生産性の向上や、AIを導入した職種についてその従業員の能力の向上について盛んな研究が行われ、その成果が論文として世に発表されつつあります。

スタンフォード大学とMIT共同研究：生成AIがカスタマーサポート業務の生産性を15%向上、新人の離職率40%減 – 世界初の大規模実証研究

Microsoft研究｜AI活用で従業員の64%が批判的思考を軽視 – 自己効力感が鍵に

OpenAI GPT-5発表：o3モデルを統合、AIサービスを大幅簡素化へ

主に注目されているのは「生成AI」ですが、私たちの生活のあらゆるサービスにとって、もはや機械学習を用いたアルゴリズムは浸透しておりあらゆる人間にとって全く接点を持たず暮らすことは難しいといっていいでしょう。今回はAI技術の基礎について学び、それらが私たちのサービスにどのように結びついているのかを読者の皆様とともに学んでいきたいと思います。

機械学習は、データを基にして学習し、予測や分類、異常検知などを行う技術です。現代社会で幅広く活用されており、画像認識やスパムメールのフィルタリング、不正取引の検出など、さまざまな分野でその力を発揮しています。本記事では、機械学習の基本概念、主要な手法、応用例について大学1年生にもわかりやすく解説します。

機械学習で解決できる問題の種類

機械学習が扱える問題は、大きく以下の3つに分類されます。

1. 回帰

回帰は、過去のデータを基に未知の数値を予測する手法です。例えば、線形回帰ではデータ点と直線との距離が最小になるようなモデルを構築します。

応用例: 売上予測、気温予測、不動産価格の推定。
注意点: 特徴量間の相関が強い場合、多重共線性が発生し精度が低下します。また、高次元モデルは過学習（後述）のリスクがあります。

2. 分類

分類は、データを特定のカテゴリに振り分ける手法です。スパムメールのフィルタリングや画像認識などで使用されます。

応用例: メールがスパムかどうか判定する、画像に写っている物体を特定する。
代表的手法: k-means法（教師なし学習によるクラスタリング）。

3. 異常検知

異常検知は、通常データから大きく外れたデータ（異常値）を検出する手法です。例えば、CPU使用率や金融取引データなどで異常値を見つける際に使われます。

アルゴリズム例:
- k近傍法 (k-NN): データ間の距離を計算し、閾値を超えたものを異常と判定。
- 自己符号化器 (AutoEncoder): 正常データで学習したモデルが異常データを復元できないことを利用。
応用例: 製造業での不良品検知、金融取引での不正検出。
実例: Amazon Fraud Detectorでは、不正取引検出に異常検知アルゴリズムが使用されています。

機械学習の主要な学習手法

機械学習にはいくつかの学習手法があります。それぞれ適用場面が異なるため、特徴を理解して使い分けることが重要です。

1. 教師あり学習

教師あり学習は、「特徴量」と「正解ラベル」が与えられたデータでモデルを訓練し、新しいデータに対して予測を行う方法です。

代表アルゴリズム: 線形回帰、ロジスティック回帰。
応用例: 病気診断（症状から病名を予測）、画像認識（画像からカテゴリを判別）。

2. 教師なし学習

教師なし学習は、「正解ラベル」がないデータからパターンや構造を発見する方法です。

代表アルゴリズム: k-means法（クラスタリング）、主成分分析 (PCA)。
応用例: レコメンデーションシステム（ユーザーの嗜好に基づいた商品提案）。

3. 半教師あり学習

半教師あり学習は、「少量のラベル付きデータ」と「大量のラベルなしデータ」を組み合わせてモデルを訓練する方法です。以下に具体的なアプローチを示します：

自己訓練 (Self-Training)
- ラベル付きデータでまずモデルを構築。
- そのモデルでラベルなしデータに仮ラベルを付与。
- 仮ラベル付きデータも含めて再度モデルを訓練。
共訓練 (Co-Training)
- 特徴量を複数視点に分け、それぞれ独立したモデルを構築。
- 各モデルが互いに予測結果を共有して再訓練。
グラフベース学習
- データ間の類似性をグラフ構造として表現し、ラベル付きデータからラベルなしデータへ情報伝播。

応用例: 医療画像解析（少数の診断済み画像と大量の未診断画像）。

4. 強化学習

強化学習は、「試行錯誤」を通じて最適な行動戦略を見つける方法です。エージェント（AI）が環境との相互作用から報酬（成功/失敗）を得て、その報酬を最大化するように行動します。

応用例: ゲームAI、自動運転車。

過学習とその対策

過学習とは？

過学習とは、モデルが訓練データに過剰適合し、新しいデータへの汎化性能が低下する現象です。以下の場合に発生しやすいです：

特徴量が多すぎる。
相関が強い変数が多い。
モデルが複雑すぎる（高次元関数や過剰なパラメーター）。

過学習への対策：正則化

正則化はモデルの複雑さを抑えることで過学習を防ぐ手法です。代表的な正則化にはL1正則化とL2正則化があります。

L1正則化 (Lasso)
- モデル内の一部パラメーター（重み）をゼロにすることで不要な特徴量を削除します。
- 特徴選択にも役立ちます。
- 利点: モデルがシンプルになり解釈性が向上。
L2正則化 (Ridge)
- モデル全体の重み（パラメーター）値そのものを小さく抑えます。
- 極端な重み付けが抑制されるため安定性が向上します。
- 利点: 全ての特徴量情報を活かしつつ過剰適合を防ぐ。