ChatGPT API代が高すぎる…OllamaでローカルLLMを無料API化する方法
ChatGPT APIの料金、気になっていませんか?
ChatGPT API(OpenAI API)は従量課金制。使えば使うほどお金がかかります。
| モデル | 入力 | 出力 |
|---|---|---|
| GPT-4o | $2.50/100万トークン | $10.00/100万トークン |
| GPT-4 | $30/100万トークン | $60/100万トークン |
個人で月に数千円、企業なら月に数万〜数十万円になることも珍しくありません。
でも、VPSにOllamaを入れれば、API利用料ゼロで同等の機能が手に入ります。
Ollamaの「APIモード」とは
OllamaにはOpenAI互換のAPIサーバー機能が内蔵されています。つまり:
- ChatGPT APIと同じ形式でリクエストを送れる
- 既存のコードの
api_baseを変更するだけで移行可能 - Python、JavaScript、curl、どの言語からも呼び出せる
- 月額料金はVPS代のみ。API利用料ゼロ。
コスト比較
| 項目 | ChatGPT API | Ollama on VPS |
|---|---|---|
| 月額固定費 | なし | 990円(VPS代) |
| API利用料 | 従量課金 | 無料 |
| 月1万リクエスト時 | 約3,000〜5,000円 | 990円 |
| 月10万リクエスト時 | 約30,000〜50,000円 | 990円 |
| データの送信先 | OpenAIサーバー | 自分のVPS内 |
使えば使うほど差が開きます。
導入手順
ステップ1:VPSを用意
おすすめVPS:
ステップ2:Ollamaをインストール
ssh root@あなたのIPアドレス
curl -fsSL https://ollama.ai/install.sh | sh
ステップ3:モデルをダウンロード
ollama pull llama3
ステップ4:APIサーバーとして起動
Ollamaはインストール時点でAPIサーバーが自動起動しています。デフォルトでポート11434でリッスン。
外部からアクセスできるようにするには:
# /etc/systemd/system/ollama.service を編集
systemctl edit ollama
# 以下を追加
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
# 再起動
systemctl restart ollama
ステップ5:APIを呼び出す
curlの場合
curl http://あなたのIPアドレス:11434/api/chat -d '{
"model": "llama3",
"messages": [{"role": "user", "content": "こんにちは"}],
"stream": false
}'
Pythonの場合(OpenAI互換)
from openai import OpenAI
client = OpenAI(
base_url="http://あなたのIPアドレス:11434/v1",
api_key="dummy" # Ollamaは認証不要
)
response = client.chat.completions.create(
model="llama3",
messages=[{"role": "user", "content": "こんにちは"}]
)
print(response.choices[0].message.content)
既存のOpenAI APIコードの base_url を変えるだけで移行完了です。
JavaScriptの場合
const response = await fetch('http://あなたのIPアドレス:11434/api/chat', {
method: 'POST',
headers: { 'Content-Type': 'application/json' },
body: JSON.stringify({
model: 'llama3',
messages: [{ role: 'user', content: 'こんにちは' }],
stream: false
})
});
const data = await response.json();
console.log(data.message.content);
活用例
1. ブログ記事の自動生成
APIを使って大量の下書きを自動生成。従量課金の心配なく、何千記事でも生成可能。
2. 社内チャットボット
SlackやTeamsと連携して、社内の質問に自動回答。API料金を気にせず全社展開可能。
3. データ分析の自動化
CSVデータをAIに読ませて分析レポートを自動生成。大量データでもコスト固定。
4. アプリケーションへの組み込み
自社アプリにAI機能を追加。ユーザー数が増えてもAPI料金が膨らまない。
セキュリティ対策
APIサーバーを外部に公開する場合、以下の対策を推奨:
# ファイアウォールで特定IPのみ許可
ufw allow from あなたのIPアドレス to any port 11434
# または、Nginxリバースプロキシ + Basic認証
apt install -y nginx apache2-utils
htpasswd -c /etc/nginx/.htpasswd apiuser
よくある質問(FAQ)
OllamaはOpenAI互換のAPIエンドポイント(/v1/chat/completions)を提供しています。基本的なチャット機能は互換性がありますが、Function CallingやVisionなど一部の高度な機能は対応状況が異なります。
CPU推論の場合、ChatGPT APIより遅くなります。4GBプランで5〜15トークン/秒程度。リアルタイムチャットでは体感で2〜5秒の待ちが発生しますが、バッチ処理や非同期処理なら問題ありません。
可能ですが、CPUリソースを共有するため同時リクエスト数が増えると応答が遅くなります。4コアVPSで2〜3リクエストの同時処理が実用的な上限です。高負荷が予想される場合は8GBプラン以上を検討してください。
Llama 3 8BはGPT-3.5相当の性能です。GPT-4には及びませんが、文章生成・要約・翻訳・コード生成など多くのタスクで実用的な品質を発揮します。用途によっては十分にChatGPT APIの代替になります。
まとめ:API代をゼロにしよう
- OllamaならOpenAI互換APIが月額990円で使い放題
- 既存コードの
base_urlを変えるだけで移行可能 - データを外部に送らないのでセキュリティも向上
- 使えば使うほどコスト差が広がる