AI機械学習ディープラーニング階層と3種の学習エンジン

5分33秒 | AI基礎FE

基本情報技術者試験の頻出テーマを解説した音声コンテンツです。

トランスクリプト（字幕テキスト）

こんにちは。あなたからお預かりした資料、拝見しました。AI、機械学習、ディープラーニング、最近よく聞く言葉ですけど、この関係性って意外とごちゃごちゃになりがちですよね。そうなんですよね。今回はこの資料を元に、いわばAIの設計図を、えーっと一緒に読み解いていけたらなと。面白い構成の資料ですよね。先輩と後輩の対話形式になっていて。はい、分かりやすいです。ええ、ただ一方で、ちょっと言葉の定義が混ざりやすい部分もあるかなと。なので、今日はその辺りもはっきりさせながら進めていきましょうか。頼もしいです。では早速、まず骨格から。資料の冒頭にありましたAI、機械学習、ディープラーニングというこの入れ子構造、これが全ての基本っていうことですよね。まさにその通りです。大事なのはこれらが全く別々の技術じゃないっていうことなんです。ああ、なるほど。 AIというまあ壮大なゴールがあって、そのための具体的なアプローチの一つが機械学習。で、さらにその中でも人間の脳を真似た特にパワフルな手法がディープラーニング。この階層さえ分かればニュースの見出しに惑わされなくなりますよ。なるほど。AIという目標があって、その手段が機械学習なんですね。だとしたら、その手段、つまり心臓部とも言える学習エンジンにはどんな種類があるんでしょうか？いい質問ですね。まさにそこが肝心で。資料では大きく3つに分類されてましたね。はい。一つ目は教師あり学習。これは言わばAI界の優等生です。優等生ですか？ええ。これは猫、これは犬、みたいな正解ラベル付きのデータをもう膨大に読み込ませてパターンを徹底的に覚えさせるんです。スマホの顔認証とか、迷惑メールフィルターとか。ああ、じゃあもう日常にあふれてるんですね。そうなんです。ではその正解データがない場合はどうなるんですか？そこで登場するのが二つ目、教師なし学習。こちらは探検家タイプですね。探検家？はい。ラベルのないごちゃっとしたデータの山から、「お、このグループとこのグループは似てるな」っていうふうに、自力でパターンを見つけ出す。ECサイトのレコメンド機能なんかはこの探検家が裏で活躍してます。面白い。優等生と探検家。そして三つ目は？三つ目は強化学習。AI界の天才ゲーマーです。天才ゲーマー。ええ、正解は教えないんですが、「こうすればスコアが上がるよ」っていう報酬ルールだけ与える。あとはAI自身がもう何度も試行錯誤して最高得点を出すための戦略を編み出していくんです。囲碁のAIが人間に勝ったのもこのタイプですね。なるほど。資料にあったポータルサイトで解説するなら、この三つを可愛いイラストで比較すると良いっていうアドバイス、すごく納得です。ええ、優等生、探検家、天才ゲーマーのキャラを作ったら誰でも直感的に理解できそうです。まさに、視覚的に訴えるのはとても大事ですからね。で、最近話題のChatGPTみたいな生成AIは、これらの学習方法が非常に複雑に絡み合って動いてるんです。ああ、そうなんですね。一つだけじゃないんだ。はい。ディープラーニングを応用した大規模言語モデルがベースなんですが、その訓練過程には三つの要素全てが使われています。だからあんな不思議な動きが生まれるんですね。そうなると、資料の後半にあった2026年のトレンド、マルチモーダルAI。これはさらに複雑になりそうですね。テキストだけじゃなくて、画像や音声も同時に扱うってなると。素晴らしい。まさにそこが現代AIの最前線でして。そして複雑さが増すということは、その癖、つまりリスクも大きくなるということです。リスクですか？そこで出てくるのが重要単語、ハルシネーション。AIが事実じゃないのにもっともらしい嘘を生成してしまう現象です。AIの幻覚？ええ。これが本当に厄介でして。私も一度AIにある歴史上の人物について聞いたら、すごく説得力のある架空の逸話を語られて危うく信じそうになったことがありました。へー、怖いですね。ええ、AIは分かりませんと言えずに、それっぽい答えを作り出してしまうことがある。これがAIの出力を鵜呑みにしちゃいけないと言われる一番の理由です。ということは、今回の話をまとめると、まずAIの設計図の骨格はAI、機械学習、ディープラーニングという階層構造。はい。そして心臓部には、優等生、探検家、天才ゲーマーっていう3種類の学習エンジンがある。ええ、そうです。でも最新モデルにはハルシネーションっていう厄介な癖があるから、使う人間がちゃんと手綱を握る必要があると。完璧な要約です。その知識はあなたがこれからAIのニュースに触れる時のすごく強力な地図になりますよ。ありがとうございます。とてもクリアになりました。最後に一つ、あなたに考えてみてほしい問いがあります。はい、何でしょう？資料ではテキストのハルシネーションと人間側の確認の必要性が指摘されていました。では、AIが画像や音声も同時に扱うマルチモーダルになった時、私たちはどんな新しい幻覚に直面する可能性があるんでしょうか？そしてその幻覚を見破るために、私たちはどんなスキルを身につける必要があるんでしょうね。

このコンテンツは Web society で視聴・学習できます。