【API代ゼロ】OllamaをVPSに入れてローカルLLMを無料API化する方法【ChatGPT API代を節約】

ChatGPT API代が高すぎる…OllamaでローカルLLMを無料API化する方法

ChatGPT APIの料金、気になっていませんか?

ChatGPT API(OpenAI API)は従量課金制。使えば使うほどお金がかかります。

モデル入力出力
GPT-4o$2.50/100万トークン$10.00/100万トークン
GPT-4$30/100万トークン$60/100万トークン

個人で月に数千円、企業なら月に数万〜数十万円になることも珍しくありません。

でも、VPSにOllamaを入れれば、API利用料ゼロで同等の機能が手に入ります。

Ollamaの「APIモード」とは

OllamaにはOpenAI互換のAPIサーバー機能が内蔵されています。つまり:

  • ChatGPT APIと同じ形式でリクエストを送れる
  • 既存のコードの api_base を変更するだけで移行可能
  • Python、JavaScript、curl、どの言語からも呼び出せる
  • 月額料金はVPS代のみ。API利用料ゼロ。

コスト比較

項目ChatGPT APIOllama on VPS
月額固定費なし990円(VPS代)
API利用料従量課金無料
月1万リクエスト時約3,000〜5,000円990円
月10万リクエスト時約30,000〜50,000円990円
データの送信先OpenAIサーバー自分のVPS内

使えば使うほど差が開きます。

導入手順

ステップ1:VPSを用意

おすすめVPS:

KAGOYA CLOUD VPS(月770円〜) →

XServer VPS(月990円〜) →

ステップ2:Ollamaをインストール

ssh root@あなたのIPアドレス
curl -fsSL https://ollama.ai/install.sh | sh

ステップ3:モデルをダウンロード

ollama pull llama3

ステップ4:APIサーバーとして起動

Ollamaはインストール時点でAPIサーバーが自動起動しています。デフォルトでポート11434でリッスン。

外部からアクセスできるようにするには:

# /etc/systemd/system/ollama.service を編集
systemctl edit ollama

# 以下を追加
[Service]
Environment="OLLAMA_HOST=0.0.0.0"

# 再起動
systemctl restart ollama

ステップ5:APIを呼び出す

curlの場合

curl http://あなたのIPアドレス:11434/api/chat -d '{
  "model": "llama3",
  "messages": [{"role": "user", "content": "こんにちは"}],
  "stream": false
}'

Pythonの場合(OpenAI互換)

from openai import OpenAI

client = OpenAI(
    base_url="http://あなたのIPアドレス:11434/v1",
    api_key="dummy"  # Ollamaは認証不要
)

response = client.chat.completions.create(
    model="llama3",
    messages=[{"role": "user", "content": "こんにちは"}]
)
print(response.choices[0].message.content)

既存のOpenAI APIコードの base_url を変えるだけで移行完了です。

JavaScriptの場合

const response = await fetch('http://あなたのIPアドレス:11434/api/chat', {
  method: 'POST',
  headers: { 'Content-Type': 'application/json' },
  body: JSON.stringify({
    model: 'llama3',
    messages: [{ role: 'user', content: 'こんにちは' }],
    stream: false
  })
});
const data = await response.json();
console.log(data.message.content);

活用例

1. ブログ記事の自動生成

APIを使って大量の下書きを自動生成。従量課金の心配なく、何千記事でも生成可能。

2. 社内チャットボット

SlackやTeamsと連携して、社内の質問に自動回答。API料金を気にせず全社展開可能。

3. データ分析の自動化

CSVデータをAIに読ませて分析レポートを自動生成。大量データでもコスト固定。

4. アプリケーションへの組み込み

自社アプリにAI機能を追加。ユーザー数が増えてもAPI料金が膨らまない。

セキュリティ対策

APIサーバーを外部に公開する場合、以下の対策を推奨:

# ファイアウォールで特定IPのみ許可
ufw allow from あなたのIPアドレス to any port 11434

# または、Nginxリバースプロキシ + Basic認証
apt install -y nginx apache2-utils
htpasswd -c /etc/nginx/.htpasswd apiuser

よくある質問(FAQ)

OllamaはOpenAI互換のAPIエンドポイント(/v1/chat/completions)を提供しています。基本的なチャット機能は互換性がありますが、Function CallingやVisionなど一部の高度な機能は対応状況が異なります。
CPU推論の場合、ChatGPT APIより遅くなります。4GBプランで5〜15トークン/秒程度。リアルタイムチャットでは体感で2〜5秒の待ちが発生しますが、バッチ処理や非同期処理なら問題ありません。
可能ですが、CPUリソースを共有するため同時リクエスト数が増えると応答が遅くなります。4コアVPSで2〜3リクエストの同時処理が実用的な上限です。高負荷が予想される場合は8GBプラン以上を検討してください。
Llama 3 8BはGPT-3.5相当の性能です。GPT-4には及びませんが、文章生成・要約・翻訳・コード生成など多くのタスクで実用的な品質を発揮します。用途によっては十分にChatGPT APIの代替になります。

まとめ:API代をゼロにしよう

  • OllamaならOpenAI互換APIが月額990円で使い放題
  • 既存コードの base_url を変えるだけで移行可能
  • データを外部に送らないのでセキュリティも向上
  • 使えば使うほどコスト差が広がる

最安のKAGOYA CLOUD VPSで始める(月770円〜) →

高速なXServer VPSで始める(月990円〜) →