株式会社WR

株式会社WR

WEB TOTAL CONSULTING

Local LLMをシステムに組み込む——Ollama + Llama 3 / DeepSeek の実践
ブログ一覧へ
AI・技術ブログ

Local LLMをシステムに組み込む——Ollama + Llama 3 / DeepSeek の実践

ChatGPTやClaudeのクラウドAPIは強力ですが、社内の機密データを外部に送りたくない企業も多いです。OllamaでLocal LLMをサーバーに立ち上げ、LaravelシステムからAPIで呼び出す構成を解説します。

なぜLocal LLMを使うのか

クラウドAPIの懸念点は「データが外部サーバーに送信される」点です。個人情報・営業秘密・顧客データを扱うシステムではLocal LLMが有力な選択肢になります。

Ollamaとは

OllamaはLlama・DeepSeek・Mistraなどの大規模言語モデルをローカルで簡単に動かせるツールです。ollama run llama3 のコマンド1つでモデルが起動し、OpenAI互換のAPIでアクセスできます。

対応モデル

弊社で動作確認済みのモデルです。

  • Llama 3.1 / 3.2(Meta製。汎用タスクに最適)

  • DeepSeek-Coder V2(コード生成に特化。Claude並みの性能)

  • Qwen2.5-Coder(日本語対応が比較的良好)

  • Aida(日本語特化のLLM。日本語文書処理に強み)

LaravelからAPIで呼び出す

OllamaはOpenAI互換のREST APIを提供するため、Laravelからは通常のHTTPクライアントでアクセスできます。エンドポイントを http://localhost:11434/api/generate に向けるだけです。

実用的なユースケース

社内FAQ自動回答 — 社内マニュアル・規程をRAGで検索してLocal LLMが回答。データが外部に出ない完全プライベート環境。

顧客問い合わせの自動分類 — 受信したお問い合わせを自動でカテゴリ分類・優先度付けするシステム。

コード自動生成ツール — DeepSeek-Coderを使ったコード補完・スニペット生成の内部ツール。

ハードウェア要件

7Bパラメータのモデルなら16GB RAM・MacBook Pro M1以上で動作します。13B以上は32GB RAM推奨です。弊社サーバーではNVIDIA GPU + 64GB RAMで70Bモデルを運用しています。

まとめ

Local LLMはクラウドAPIに比べてセットアップのコストはかかりますが、プライバシー・コスト・レイテンシのすべてで優れています。弊社ではお客様の環境に合わせてクラウド/ローカルを選択して提案しています。

Category AI・技術ブログ

Related Posts

関連記事

開発・技術のご相談はお気軽に

お見積りは無料です。まずはお気軽にご相談ください。

お問い合わせ →