RAGとは
RAG(Retrieval-Augmented Generation)は、LLMに社内独自ドキュメントの知識を持たせる技術です。「ファインチューニング」よりコストが低く、ドキュメントの更新にも対応できます。
RAGの仕組み
-
ドキュメントの分割・ベクトル化 — PDFやWordのテキストをチャンク分割し、Embeddingモデルでベクトルに変換してDBに保存します。
-
質問時の検索 — ユーザーの質問をベクトル化し、類似ベクトルのチャンクをDBから検索します。
-
回答生成 — 検索で見つかったチャンクをコンテキストとしてLLMに渡し、回答を生成します。
技術スタック
-
ベクトルDB: PostgreSQL + pgvector(Laravelと親和性が高い)
-
Embeddingモデル: text-embedding-3-small(OpenAI)/ nomic-embed-text(Ollama)
-
LLM: Claude 3.5 Sonnet / Llama 3.1(Local)
実装事例
弊社では顧客サポートの問い合わせ対応に社内FAQをRAGで組み込んだシステムを構築しました。よくある質問の約70%がAIで自動回答されるようになり、人的対応工数を削減しています。
まとめ
RAGは「ChatGPTに社内のことを聞けるようにしたい」という要望を実現する最も現実的な手法です。弊社では設計から構築・保守まで一貫して対応しています。