「RAG・AIエージェント[実践]入門」を読む　～第1章 LLMアプリケーション開発の基礎～

はじめに

OpenAIの大規模言語モデル(Large Language Model)を活用したサービスであるChatGPTの登場以来，業務においてもLLM・生成AIが活用され，2024年現在ではかなり浸透している。

業務でLLMを活用していくためには，検索拡張生成(RAG)やAIエージェントといった技術が必要になってくると考えられる。これらの技術の基礎知識と実践経験を積むために，西見公宏・吉田真吾・大嶋勇樹著「LangChainとLangGraphによるRAG・AIエージェント［実践］入門」を読むことにした。

本記事は，第1章「LLMアプリケーション開発の基礎」の読書メモである。

本書の紹介ページ

gihyo.jp

第1章 LLMアプリケーション開発の基礎

1.1 活用され始めた生成AI

本節では，ChatGPTをはじめとしたLLM(大規模言語モデル)が，企業内で使われ始めたシーンについて説明している。特に重要な技術として，本書のテーマである検索拡張生成(Retrieval-Augmented Generation; RAG)について，従来のエンタープライズ検索システムの代替である，と紹介している。

本節において，社内ドキュメント検索以外の応用方法として，下記が挙げられている。

外部ソース統合型Q&Aサービス(デスクトップリサーチ)
メタデータ活用型分析(Text-to-SQL)
カスタマーサポートの強化
コンテンツ生成の自動化
コード生成と最適化

今後の方向性として，特定のドメインに特化したモデル，マルチモーダル，そしてこれらを統合して複雑なワークフローの自動化を実現するAIエージェントの普及が進む，と説明している。

1.2 Copilot vs AIエージェント

本節では，GitHub CopilotやMicrosoft Copilotなどの"Copilot型"アプリケーションの問題点とAIエージェントの重要性について説明している。

AIエージェントの特徴は，置かれている環境を認識して，複雑な目標に対して自律的に稼働することである。

本節においてCopilot型のAIシステムとAIエージェントの違いは下表のように説明されている。

	Copilot型AIシステム	AIエージェント
環境情報や制約，記憶	都度人間から与えられる	置かれている環境を認識する
ユーザへの影響	ユーザ側で使いこなすスキルが必要	ユーザの手間を大幅に削減することが可能