AIに「嘘」をつかせない技術：RAG

Name: AIに「嘘」をつかせない技術：RAG
Duration: 7 min 35 s

7分35秒 | AI基礎FE

基本情報技術者試験の頻出テーマを解説した動画コンテンツです。

トランスクリプト（字幕テキスト）

こんにちは。今回はですね、今話題の生成AIがもっともっと信頼できるようになるためのある、ものすごく重要な技術についてみなさんと一緒に深掘りしていきたいと思います。 AIがさも本当かのように平気で嘘をついちゃう問題ってありますよね。実はこれを解決する鍵が今回ご紹介するRAGっていう技術なんです。さあ、一体どんなものなのか、一緒に見ていきましょう。AIに何か質問してみて、あれ？って思ったことみなさんありませんか？最新のニュースについて聞いたはずなのに、AIがね、全然存在しないような大事件をさも見てきたかのように自信満々に語り始めるみたいな。このAIがもっともらしい嘘をついちゃう現象をハルシネーションって呼ばれてるんですけど、これが今、多くの開発者を悩ませている本当に大きな課題になってるんですよね。でもここで素朴な疑問が湧いてきませんか？あれだけ賢いように見えるAIがどうしてこんなにも堂々と間違った情報を語っちゃうんでしょうか。うん、今回の解説ではこのAIのちょっと不思議な振る舞いの謎にグッと迫っていきたいと思います。それではまず、この問題の根本的な原因、つまりAIがそもそもなぜ嘘をついてしまうのか、その頭の中をちょっと覗いてみることにしましょう。実はですね、チャットGPTみたいな大規模言語モデル、いわゆるLLMの知識には言ってみれば賞味期限があるんです。これはナレッジカットオフなんて呼ばれてるんですけど、要は学習データが作られたその時点で知識が全部止まっちゃってるんですね。うーん、例えるなら、数年前の教科書を丸暗記しただけで、その後の最新ニュースは全く知らない学生みたいな状態なんです。ここで、すごくわかりやすい例えがあるんです。LLMが単体で頑張るのって、記憶力だけが頼りの暗記試験、つまりクローズドブック試験に挑む学生みたいなもんなんですよ。一方で、これからお話しするRAGっていう技術を使ったLLMは、教科書とか資料を自由に見てもいいよっていう持ち込み可能試験、オープンブック試験に挑む学生なんです。この違い、もう決定的一ですよね。これが回答の正確さを劇的に変えることになるんです。それではいよいよ本題です。このAIのための画期的なオープンブック試験の仕組みであるRAGとは一体全体何なのか、その核心に迫っていきましょう。ラグというのは、リトリーバルオーギュメンテッドジェネレーションの略で、日本語だと検索拡張生成って言います。まあその名前の通りなんですけど、ユーザーから質問が来ると、まず外部のデータベースから最新の関連情報をわーっと検索してくるんですね。で、その内容をAIにインプットしてから回答を生成させる。つまりAIに対して、ほら、この最新資料を読んで、これをもとに答えてねってカンニングペーパーを渡してあげるようなものなんです。なるほど、仕組みはなんとなくわかりました。でもここで次の疑問が出てきますよね。その外部のデータベースっていうのが、もし巨大な図書館みたいなものだとしたら、AIはどうやって膨大な本の中から質問にピッタリのページを一瞬で見つけ出すことができるんでしょうか。その答えこそが、 RAGを裏で支えている超強力なエンジン、ベクトルデータベースとセマンティック検索っていう技術なんです。これ、単に言葉の表面的な一致を探すんじゃなくて、その言葉が持っている意味そのものを捉えるっていう全く新しい検索方法なんですよ。この表を見るとその違いがすごくわかりやすいと思います。今までのキーワード検索って、例えば猫って入れたら、もう単純に猫っていう文字が含まれてる文章を探してくるだけだったんですよね。でもベクトル検索は全然レベルが違うんです。猫っていう言葉が持つその意味とかコンセプトを理解するんですよ。だからにゃーと鳴く動物とか人気のペットみたいに、猫という単語が直接入ってなくても、あ、これって猫のことだよねって意味で近いものを見つけてきてくれる。すごいですよね。この魔法みたいな検索を可能にしているのがベクトルデータベースです。これは言葉とか文章を、意味の地図上の座標みたいな数値データ、つまりベクトルっていうものに変換して保存しておくんです。こうすることで、概念的に近いもの、つまり地図上で近くにあるものを一瞬で見つけ出せるようになるわけです。まさにAIが必要な情報を完璧に探し出してくれる超有能な図書館の司書さんみたいな存在ですね。じゃあ、このRAGっていう仕組み全体が具体的にどんなステップで動いているのか。実はこれ、ものすごくシンプルで、たった3つの段階に分けて見ることができます。まずステップ1は情報のベクトル化、エンベディングです。あらゆる文章をさっきの意味の座標であるベクトルに変換して、データベースにどんどん格納していきます。次にステップ2、検索。リトライバル。ユーザーの質問も同じようにベクトルに変えて、データベースの中で意味が一番近い文章のベクトルを書き出します。そして最後のステップ3が生成、ジェネレーションですね。見つけ出した文章を質問と一緒にLLMに渡して、はい、この情報を参考に答えてくださいって指示する。たったこれだけのシンプルな3段階で根拠のある正確な答えが生まれるってわけです。さて、最後にこのRAGという技術がこれからのAI開発、特に2026年に向けてなぜこれほどまでに重要なのか、その未来にちょっと目を向けてみましょう。つまり信頼できるAIっていうのはこの強力なチームで成り立っていると言えるんです。文章を組み立てる頭脳としてのLLMがいて、正確な事実を供給する最新の参考書としてのRAGの仕組みがあって、そしてその参考書の最適なページを瞬時に見つけ出す図書館司書としてのベクトルデータベースがいる。この見事なチームワークこそが信頼性の鍵なんですね。このRAGっていう技術が登場したことで、AI開発の現場で求められるスキルも実は大きく変わってきてるんです。もうね、ただただ強力なAIを作り出すだけじゃ不十分で、全く新しい視点が求められるようになってきてるんですよ。そう、今一番大事なのはまさにここなんです。AIをどうやって制御、つまりコントロールしてその答えの精度を保証するかということ。ただ作るだけじゃなくて、例えばラガスみたいな専門のツールを使って、その精度をちゃんと評価して、継続的に、もっとよくしていく。この視点こそがこれからのプロの開発現場ではもう絶対に欠かせないスキルになってきてるんですね。 AIが私たちの生活のあらゆる場面で、そうですね、電気とか水道みたいに当たり前のインフラとして機能する未来って、もうすぐそこまできてると思うんです。その時私たちはAIの信頼性というものを、一体どんな基準で測って、どう付き合っていくことになるんでしょうか。今日のこの話がその未来を考える一つのきっかけになれば、これほど嬉しいことはありません。

このコンテンツは Web society で視聴・学習できます。