Local LLMをシステムに組み込む——Ollama + Llama 3 / DeepSeek の実践

なぜLocal LLMを使うのか

クラウドAPIの懸念点は「データが外部サーバーに送信される」点です。個人情報・営業秘密・顧客データを扱うシステムではLocal LLMが有力な選択肢になります。

OllamaはLlama・DeepSeek・Mistraなどの大規模言語モデルをローカルで簡単に動かせるツールです。ollama run llama3 のコマンド1つでモデルが起動し、OpenAI互換のAPIでアクセスできます。

弊社で動作確認済みのモデルです。

OllamaはOpenAI互換のREST APIを提供するため、Laravelからは通常のHTTPクライアントでアクセスできます。エンドポイントを http://localhost:11434/api/generate に向けるだけです。

社内FAQ自動回答 — 社内マニュアル・規程をRAGで検索してLocal LLMが回答。データが外部に出ない完全プライベート環境。

顧客問い合わせの自動分類 — 受信したお問い合わせを自動でカテゴリ分類・優先度付けするシステム。

コード自動生成ツール — DeepSeek-Coderを使ったコード補完・スニペット生成の内部ツール。

7Bパラメータのモデルなら16GB RAM・MacBook Pro M1以上で動作します。13B以上は32GB RAM推奨です。弊社サーバーではNVIDIA GPU + 64GB RAMで70Bモデルを運用しています。

Local LLMはクラウドAPIに比べてセットアップのコストはかかりますが、プライバシー・コスト・レイテンシのすべてで優れています。弊社ではお客様の環境に合わせてクラウド/ローカルを選択して提案しています。