AIを信用せよ_ベクトルDBとRAGの全貌

5分13秒 | AI基礎FE

基本情報技術者試験の頻出テーマを解説した音声コンテンツです。

トランスクリプト（字幕テキスト）

こんにちは。AIがいかにも本当っぽい嘘をついちゃうハルシネーションって結構悩ましい問題ですよね。ええ、そうですね。今回はいただいた資料をもとにですね、AIの頭脳、つまりLLMにどうやって検索っていう強力な武器を持たせるのか、その最新の仕組みを一緒に探っていきましょう。はい。この問題の根本にあるのが、LLMが学習した時点までの知識しか持ってないっていうナレッジカットオフなんですね。ああ、なるほど。まるで何年も前の古い教科書を丸暗記した学生みたいなものです。だから最新のニュースとか、あとはあなたの会社の内部情報なんて聞かれても答えようがないわけです。そこで出てくるのが、えーっと、RAGでしたっけ？検索拡張生成。そうそう。資料にあった例えがすごく分かりやすくて、暗記だけの試験を教科書持ち込みOKのオープンブック試験に変えるみたいな。ええ、まさにそれです。でもここでちょっと意地悪な質問かもしれないんですけど、その持ち込んだ教科書の情報自体がもし間違ってたらどうなるんですかね？ああ、AIはそれを鵜呑みにして前よりももっと自信満々に嘘をついちゃいそうな気もするんですが。いや、鋭い指摘ですね。まさにそれがRAGをうまく機能させる上での一番大事なポイントなんです。と言うと？だからこそ参照させる外部データ、つまり教科書の質と鮮度がものすごく重要になるわけです。なるほど。で、もう一つの課題が、たとえ質の良い教科書でも、それが何千ページもあったら、どうやって一瞬で正しいページを見つけ出すのかっていう点ですね。ああ、確かに。人間だってそんな分厚い資料を渡されたら探すだけで日が暮れちゃいますよね。そこで活躍するのがベクトルデータベースっていう技術なんです。ベクトルデータベース？はい。従来のキーワード検索って猫と入れたら猫っていう文字を探すだけだったじゃないですか。ええ、そうですね。でもベクトル検索は違うんです。猫っていう単語のその意味とか概念で探すんですよ。意味で探す、ですか？それって具体的にはどういうことでしょう？例えば通販サイトなんかで、春に着る軽くて青くない上着みたいになんか曖昧な言葉で検索してもちゃんとトレンチコートとか候補に出てきますよね。ああ、あれですね。確かに。あれが意味で探してる身近な例です。専門的に言うと、文章を意味の空間上の座標、つまりベクトルに変換して、意味的に近いものを探し出す技術なんです。なるほど。これのおかげで文章に猫って単語がなくても、ニャーと鳴く動物みたいな関連性の高い情報を見つけ出せるわけです。はあ、面白いですね。じゃあ資料の例えをもう一度使うと、LLMが頭脳で。ええ。 RAGが持ち込みOKの教科書。はい。そしてこのベクトルデータベースが目的のページを一瞬で見つけ出す、超有能な図書館司書みたいな。まさにその通りです。この司書さんがいないと、AIはただ図書館の中で迷子になっちゃうと。この組み合わせが2026年の今、なんでこんなに重要になってるんでしょうか？そこが面白いところでして。ほんの1年前までは、みんなどうやってこの仕組みを作るかに躍起になっていたんです。ええ。でも今はもう作るのが当たり前になって、関心が次のフェーズに移ってるんですね。次のフェーズですか？はい。作ったAIの答えをどうやって信用するのか、っていういわば品質保証のフェーズです。これは技術が成熟してきたっていうすごく重要なサインだと思いますね。なるほど。作ったはいいけどその性能は本当に信頼できるのかと。その評価って具体的には何を測るんですか？単純な正解か不正解かとかじゃないですよね。ええええ。例えば資料にもあったRAGASのような評価の仕組みは、複数の指標で精度を見るんです。 AIが参照した情報が本当に質問と関連性があったかとか。はい。あとはその情報から導いた答えが元の文脈をねじ曲げていないかとか、そういう点ですね。AIに嘘をつかせないだけじゃなくて、質の高い答えを安定して出させるための、まあAIの通信簿みたいなものです。はあ。作る時代から性能を保証する時代へ。では本日の探求をまとめましょうか。信頼できるAIの裏側には、強力な頭脳であるLLM、そして外部の知識を賢く参照するRAGとベクトルデータベース、そしてその精度を測る通信簿がありました。そうですね。最後にあなたにも一つ考えていただきたい問いがあります。はい。 AIにオープンブック試験をさせることが当たり前になった今、我々の課題はAIが答えを見つけられるか、から、その答えが本当に最善であるとどうやって確かめるか、に移っています。これは私たちがAIの能力そのものよりも、その信頼性をより重視し始めたということなのかもしれませんね。

このコンテンツは Web society で視聴・学習できます。