ホーム / Uncensored AIホスティング — 自分のLLMをセルフホスト

DeepSeek-R1、Llama-3.3、Qwen3をセルフホスト — 推論ログなし、コンテンツポリシーなし。

Uncensored AIホスティング — 自分のLLMをセルフホスト

OpenAI、Anthropic、Google、xAIはいずれもホスト型エンドポイントにコンテンツポリシーを適用し、安全性分類、モデル改善、政府からの要請への対応のためにすべてのプロンプトを記録します。自前のGPUマシンでセルフホストすれば、その構図は逆転します。合法的に入手できるオープンウェイトモデルであれば何でもローカルで実行でき、推論トラフィックは当社のネットワーク層を通過せず、プロンプトは記録されず、出力もフィルタリングされません。ServPrivateは、RTX 4090 / RTX 5090 / H100 SXM5のGPUサーバーを4つのオフショア法域で提供し、vLLM、Ollama、ComfyUI、Whisper、Barkの1クリックテンプレートを用意しています。

VPSプランを見る最適な法域を探す

ここでの「無検閲」の本当の意味

推論ログなし — お客様のプロンプトは記録されません
コンテンツポリシーなし—持ち込んだモデルの重みはそのまま実行
オープンウェイトモデルは注文時に事前ダウンロード済み
標準で第三者のAI APIからエアギャップされています
CUD12 + vLLM / Ollama / ComfyUI 1-クリック ready

KYC不要

暗号資産決済のみ

ログなし

DMCA無視

フルroot

NVMe SSD

ホスト型エンドポイントはすべてを記録します。ローカルの重みは何も記録しません。

「無検閲AI」という問いは、実のところ主権の問題です

OpenAI API を呼び出すと、プロンプトは米国法域のログに入り、最低 30 日保持されます。安全分類によってはさらに長く保持され、フラグが立てば安全性チームのレビュー対象になり、米国の法的手続きで提出を求められる可能性もあります。モデル自体も、安全性 RLHF で訓練されたカテゴリの出力を拒否します。一方、自分の GPU 上で Llama-3.3-70B-Instruct やその派生モデルを動かす場合、プロンプトは自分のマシンから出ず、拒否挙動は選んだ重みに依存し、法域はサーバーを置いた場所になります。「無検閲 AI」と呼ばれるものは、この 2 層、つまりログを残さないことと重みを自分で選べることです。ServPrivate はその両方を提供します。推論ネットワークを記録しないオフショア GPU と、HuggingFace モデルを当社が重みを検査せずに読み込める 1 クリックテンプレートです。

任意のオープンウェイトモデルを持ち込み可能

Llama-3.3、DeepSeek-R1、Qwen3、Mistral-Small-3、Gemma-3、Phi-4、abliteratedフォーク、カスタムファインチューン——HuggingFace上にあるものでも、お客様自身の.safetensorsファイルでも構いません。リポジトリのパスをご指定いただければ、注文時に事前ダウンロードしておきます。

推論トラフィックの取得なし

推論はお客様のGPU、お客様のKVM guest上で実行されます。当社はモデルトラフィックをプロキシ、ミラー、サンプリングしません。プロンプトと生成は、お客様が選ばない限りローカルに留まります。

オフショア法域

アイスランド（言論の自由の保護圏、100%再生可能エネルギー）、オランダ（EU最良のピアリング）、ルーマニア（データ保持を否定した司法判例）、モルドバ（軽い規制、低コスト）。適合する法的枠組みをお選びください。

公開HTTPSエンドポイント（任意）

注文時に有効化すると、当社がLet's Encrypt + リバースプロキシをport 443にプロビジョニングします。お客様のvLLM / Ollamaインスタンスは、60秒未満でTLS付きの公開URLから到達可能になります。

"無検閲 AI" really 意味で2026

「無検閲AI」という言葉には、文脈によって3つの意味があります。1. 拒否応答を除去した重み — Llama-3.3-70B-abliteratedのように、activation editingやdirectional ablationで安全性RLHFを取り除いたベースモデルまたはファインチューニングモデルです。元のInstructモデルが拒否する出力も生成します。2. 提供レイヤーにコンテンツモデレーションがないこと — 同じモデルを、OpenAI型のポリシー分類器を前段に置かずに実行する構成です。3. プロンプトや補完をログしないこと — 入力と出力がお客様のマシン外へ出ず、上流で保持されない構成です。ServPrivateは標準で2と3を提供し、1についてはお客様がモデル重みを用意します。当社はお客様のハードウェア上で実行される内容を検査・フィルタリングしません。

2026年現在のセルフホスト可能なLLMの状況

2026 年 5 月時点で、オープンウェイトのエコシステムは多くのタスクでホスト型 GPT-4 / Claude / Gemini と本格的に競合しています。DeepSeek-R1とLlama-70B への蒸留版は、推論ベンチマークで GPT-4 に近い水準をはるかに低い推論コストで実現します。Llama-3.3-70B-Instruct は汎用アシスタントの標準的な主力です。Qwen3-32B は多言語性能と推論能力に強みがあります。Gemma-3-27B は能力よりライセンスの明確さを重視する選択です。Mistral-Small-3 はコード作業で速度と品質のバランスが良く、Phi-4は14B というサイズを超えた性能を出します。画像生成では FLUX.1-devがSDXL を置き換えつつあり、音声認識では Whisper-Large-v3 が今もオープンウェイトのリーダーです。これらはすべて下記 GPU ティアで動作します。サイズ選定は GPU 購入ガイドを参照してください。

無検閲AIホストの運用衛生管理

推論ログを取らないKYC不要のGPUマシンであっても、ワークロードに本人情報を漏らしてしまうことはあります。本格的にセルフホストする方向けの実用的な対策: (1) SSH接続の前にTorまたはVPN経由でマシンに接続する。(2) GitHubアカウントに紐付いていない新しいSSH鍵を使う。(3) 公開HTTPSエンドポイントを公開する場合は、APIキーで保護し、IPではなくトークン単位でレート制限する。(4) 重みはデプロイ後にHuggingFaceアカウントで取得するのではなく、注文時にあらかじめダウンロードしておく。(5) 機密性の高いプロンプトを扱う場合は、隔離されたネットワーク名前空間の内側でllama.cppやvLLMを実行する。これらのパターンはガイドハブで詳しく解説しています。

「無検閲」の対象範囲と対象外

対象範囲内:ベースモデルの安全性RLHF訓練では拒否されるようなNSFWまたは政治的にセンシティブな出力、暴力を含むフィクション作品、実名を挙げた個人や政府を批判する出力、デュアルユース研究に関する出力(例:サイバーセキュリティ、生物学、教科書レベルの化学)、敵対的なプロンプトエンジニアリング口調の出力。当社のAUP(利用規定)の対象外:CSAM(モデルを問わず一切容認しません)、大量殺傷を狙ったCBRN攻撃の手順(モデルを問わず)、実名を挙げた個人への標的型嫌がらせキャンペーン、およびホスト国の法律で明確に禁止されている出力。判断のほとんどはモデル自身が行い、AUPは最も難しいエッジケースのみを扱います。

法域

Uncensored AI ホスティングで4 オフショア法域

ロシアはNVIDIA H100 / RTX 4090+の輸出制裁により、GPUラインナップの対象外です。

アイスランド

言論の自由を重視

強いプライバシー法、再生可能エネルギー、EU圏外。

$10.00/mo VPS $63.00/mo 専用

パナマ

データ保持義務なし

データ保持義務なし、多くの西側諸国と MLATなし。

$8.50/mo VPS $53.50/mo 専用

モルドバ

低コストなオフショア

規制が軽く、価格が低く、国際協力は限定的。

$7.50/mo VPS $48.50/mo 専用

ルーマニア

反データ保持

裁判所がデータ保持法を違憲判断。EU接続も優秀。

$8.50/mo VPS $53.50/mo 専用

スイス

プレミアムプライバシー

厳格なプライバシー法、政治的中立、高品質インフラ。

$11.00/mo VPS $68.00/mo 専用

オランダ

最高水準のピアリング

優れた接続性、寛容なホスティング、AMS-IX ピアリング。

$9.00/mo VPS $58.50/mo 専用

ロシア

西側法域の影響を受けにくい

西側の法的影響圏外。ロシア国内法の適用。

$7.50/mo VPS $48.50/mo 専用

FAQ

無検閲AIホスティング — よくある質問

01 プロンプトやモデル outputをログしますか？

いいえ。GPU マシンはお客様のKVM guestです。当社は推論トラフィックをプロキシ、ミラー、サンプリングせず、プロンプトや補完 contentを外部へ転送しません。当社が保持するログはネットワーク-レベルの帯域counterとhypervisor-レベルの稼働率、GPU power drawのみです。

02 Llama-3.3-70B-abliteratedやDeepSeek-R1をここで運用できますか？

はい。合法的に入手できるHuggingFace上のオープンウェイトモデルであれば何でも運用できます — Llama-3.3-70B-Instruct、abliterated派生モデル、DeepSeek-R1、DeepSeek-R1-Distill-Llama-70B、Qwen3-32B、Gemma-3-27B、Mistral-Small-3、Phi-4などです。注文時にHFリポジトリを指定すれば事前ダウンロードしておきますし、最初のSSHログイン後に手動で取得することもできます。

03 どのモデルサイズがどのGPUティアに適していますか？

Q4量子化でのおおよその目安: RTX 4090（24 GB）は7B〜13Bなら余裕で動作し、27B〜32Bはオフロードが必要で厳しくなります。RTX 5090（32 GB）は27B〜32Bなら余裕で動作し、70BはCPUオフロードが必要です。H100 SXM5（80 GB）はQ4〜Q5の70Bなら余裕で動作します。デュアルH100（160 GB）はFP16の70B、Q4なら120B〜180Bまで動作します。詳細なスループット数値は購入ガイド /guides/rtx-4090-vs-h100-for-ai-inference をご覧ください。

04 コンテンツポリシーに引っかかることはありますか？

モデルの出力に対するプラットフォームレベルのコンテンツポリシーはありません。当社の利用規約が禁止するのは、生成方法にかかわらずホスト国で違法となるもののみです（CSAM、大量被害を引き起こす CBRN 攻撃の手順、特定の個人に対するターゲット型ハラスメント）。NSFW、政治的コンテンツ、デュアルユース研究、敵対的プロンプトによる出力を含む、その他すべては動作します。

05 自分のLLMを公開URLで提供できますか？

はい。注文時に「Public HTTPS」を有効にすると、Let's Encrypt 証明書を発行し、ポート 443 のリバースプロキシを vLLM / Ollama / Open WebUI のポートへ自動設定します。モデルは `https://.servprivate.dev` で到達できます。独自ドメインの A レコードを向ける場合も、TLS 付きで追加設定は不要です。

06 OpenAI、Anthropic、OpenRouterのプロキシと比べてどう違いますか？

OpenAI / Anthropic：ホステッド、完全なコンテンツポリシー、30日間のプロンプトログ記録、米国の法域。OpenRouter / Together / Fireworks：依然としてホステッド、ベンダー定義のコンテンツポリシー、ベンダーによるログ記録。オフショア GPU 上でのセルフホスト：プラットフォームレベルのポリシーなし、当社によるログ記録なし、ホスト国の法域。トレードオフ：使用するしないにかかわらず GPU 時間の料金が発生し、スタックの運用は自分自身で行う必要があります。大規模な利用ではセルフホストが有利になり、散発的な利用ではホステッド API がコスト面で勝ります。

ご利用の流れ

5分でオフショアサーバーをデプロイする方法

法域を選び、プランを選び、暗号資産で支払い、トークンを受け取り、デプロイします。

1

法域を選ぶ

表現の自由ならアイスランド、データ保持なしならパナマ、DMCA耐性ならロシアなど、法的要件に合う国を選びます。迷う場合は法域セレクターを使ってください。
2

プランを選ぶ

VPSまたは専用サーバーのプランをご覧ください。すべてにNVMe SSD、無制限帯域、DDoS保護、IPv6が含まれます。
3

暗号資産で支払う

Bitcoin、Monero、Ethereum、Tether、またはその他5種類の対応暗号資産コインで支払えます。メールアドレス、氏名、電話番号、IDは不要です。法定通貨には対応していません。
4

アクセストークンを受け取る

支払いが承認されると、固有のトークンを受け取ります。このトークンがすべてのアカウント認証情報の代わりになります。安全に保存してください。
5

サーバーに接続する

サーバーは5分未満で自動プロビジョニングされます。発行された認証情報でSSH接続できます。フルrootアクセスとVNC コンソールを利用できます。

自前のAIをセルフホスト—ログなし、ポリシーなし

Llama、DeepSeek、Qwen、Mistral、Gemma — どのオープンウェイトモデルでも持ち込み可能。オフショアGPUは月額$122.00から、CUDA 12対応 + 1クリックvLLM対応済み。

開始する最適な法域を探す