ホーム / Uncensored AIホスティング — 自分のLLMをセルフホスト
Self-ホスト DeepSeek-R1, Llama-3.3, Qwen3 —なし 推論 ログ記録,なし コンテンツ ポリシー.

Uncensored AIホスティング — 自分のLLMをセルフホスト

OpenAI、Anthropic、Google、xAIはいずれもホステッド エンドポイント上でコンテンツポリシーを適用し、安全性 classification、モデル improvement、政府要請対応のためにすべてのプロンプトをログします。自前のGPU マシンでセルフホスティングすれば構図は逆になります。合法的に入手できる任意のopen-weight モデルをlocalで実行でき、推論トラフィックは当社ネットワーク planeを通過せず、プロンプトはログされず、replyはfilterされません。ServPrivateは、RTX 4090 / RTX 5090 / H100 SXM5 GPUサーバーを4つのオフショア法域で提供し、vLLM、Ollama、ComfyUI、Whisper、Barkの1-click テンプレートを用意しています。

KYC不要
暗号資産決済のみ
ログなし
DMCA無視
フルroot
NVMe SSD
Hosted エンドポイント ログ everything. Local 重み ログ 何もありません.

"無検閲" questionです really sovereignty question

OpenAI API を呼び出すと、プロンプトは米国法域のログに入り、最低 30 日保持されます。安全分類によってはさらに長く保持され、フラグが立てば安全性チームのレビュー対象になり、米国の法的手続きで提出を求められる可能性もあります。モデル自体も、安全性 RLHF で訓練されたカテゴリの出力を拒否します。一方、自分の GPU 上で Llama-3.3-70B-Instruct やその派生モデルを動かす場合、プロンプトは自分のマシンから出ず、拒否挙動は選んだ重みに依存し、法域はサーバーを置いた場所になります。「無検閲 AI」と呼ばれるものは、この 2 層、つまりログを残さないことと重みを自分で選べることです。ServPrivate はその両方を提供します。推論ネットワークを記録しないオフショア GPU と、HuggingFace モデルを当社が重みを検査せずに読み込める 1 クリックテンプレートです。

01

Bring 任意の open-weight モデル

Llama-3.3, DeepSeek-R1, Qwen3, Mistral-Small-3, Gemma-3, Phi-4, abliterated forks, カスタム finetunes — anything on HuggingFaceまたはお客様の 自前の。safetensors. 当社は 事前ダウンロード at 注文 time if お客様 提供する repo path.

02

推論トラフィックの取得なし

推論はお客様のGPU、お客様のKVM guest上で実行されます。当社はモデルトラフィックをプロキシ、ミラー、サンプリングしません。プロンプトと生成は、お客様が選ばない限りローカルに留まります。

03

オフショア 法域

アイスランド (free-speech 保護圏, 100% 再生可能 power), オランダ (最適 EU ピアリング), ルーマニア (anti-保持 裁判所 precedent), モルドバ (軽い 規制, 低い コスト). 選択 法的 枠組み その 適合する.

04

Public HTTPS エンドポイント 任意

注文時に有効化すると、当社がLet's Encrypt + reverse プロキシをport 443上にプロビジョニングします。vLLM / Ollama instanceは60秒未満でTLS付き公開URLから到達可能になります。

"無検閲 AI" really 意味で2026

「無検閲AI」という言葉には、文脈によって3つの意味があります。1. 拒否応答を除去した重み — Llama-3.3-70B-abliteratedのように、activation editingやdirectional ablationで安全性RLHFを取り除いたベースモデルまたはファインチューニングモデルです。元のInstructモデルが拒否する出力も生成します。2. 提供レイヤーにコンテンツモデレーションがないこと — 同じモデルを、OpenAI型のポリシー分類器を前段に置かずに実行する構成です。3. プロンプトや補完をログしないこと — 入力と出力がお客様のマシン外へ出ず、上流で保持されない構成です。ServPrivateは標準で2と3を提供し、1についてはお客様がモデル重みを用意します。当社はお客様のハードウェア上で実行される内容を検査・フィルタリングしません。

current 2026 landscapeのself-hostable LLMs

2026 年 5 月時点で、オープンウェイトのエコシステムは多くのタスクでホスト型 GPT-4 / Claude / Gemini と本格的に競合しています。DeepSeek-R1とLlama-70B への蒸留版は、推論ベンチマークで GPT-4 に近い水準をはるかに低い推論コストで実現します。Llama-3.3-70B-Instruct は汎用アシスタントの標準的な主力です。Qwen3-32B は多言語性能と推論能力に強みがあります。Gemma-3-27B は能力よりライセンスの明確さを重視する選択です。Mistral-Small-3 はコード作業で速度と品質のバランスが良く、Phi-4は14B というサイズを超えた性能を出します。画像生成では FLUX.1-devがSDXL を置き換えつつあり、音声認識では Whisper-Large-v3 が今もオープンウェイトのリーダーです。これらはすべて下記 GPU ティアで動作します。サイズ選定は GPU 購入ガイドを参照してください。

稼働中 衛生状態向け無検閲 AI ホスト

Even on KYC不要 GPU マシン 付きなし 推論 ログ記録, お客様 可能 leak 本人情報へワークロード. 実用的 衛生状態向け本格的な セルフホスト利用者: (1) connectにマシン 経由 TorまたはVPN 前 SSH; (2) 使用 新しい SSH 鍵ではありません tiedにお客様の GitHub アカウント; (3) if お客様 expose 公開 HTTPS エンドポイント, gate it付きAPI 鍵とレート制限 による トークン ratherよりによる IP; (4) 事前ダウンロード 重み inline at 注文 time ratherよりfetching それら post-デプロイ付きお客様の HuggingFace アカウント; (5)向けsensitive prompts, 運用 llama.cppまたはvLLM behind isolated ネットワーク 氏名space. 当社は document これら patternsでガイドs hub.

「無検閲」の対象範囲と対象外

In 対象範囲: NSFWまたはpolitically-sensitive output 安全性-RLHF trainingのbase モデル would refuse, fictional コンテンツ involving violence, output その critiques 特定の 氏名d individualsまたはgovernments, dual-使用 research output (例: cybersecurity, biology, chemistry at textbook レベル), outputでadversarial プロンプト-engineering tone. Outの対象範囲未満で当社の 利用規定: CSAM (ゼロ tolerance, regardlessのモデル), instructions向けmass-casualty CBRN attacks (regardlessのモデル), targeted harassment campaigns に対して 氏名d individuals,とoutputs explicitly forbidden未満でホスト 国 法律. モデル itself decides almost everything; 利用規定 carves out hardest cases.

FAQ

Uncensored AI ホスティング — frequently asked

01 プロンプトやモデル outputをログしますか?

いいえ。GPU マシンはお客様のKVM guestです。当社は推論トラフィックをプロキシ、ミラー、サンプリングせず、プロンプトや補完 contentを外部へ転送しません。当社が保持するログはネットワーク-レベルの帯域counterとhypervisor-レベルの稼働率、GPU power drawのみです。

02 Llama-3.3-70B-abliteratedやDeepSeek-R1をここで運用できますか?

はい。Any open-weight モデル on HuggingFace お客様 可能 legally obtain — Llama-3.3-70B-Instruct, abliterated forks, DeepSeek-R1, DeepSeek-R1-Distill-Llama-70B, Qwen3-32B, Gemma-3-27B, Mistral-Small-3, Phi-4とothers. 当社は 事前ダウンロード at 注文 time 場合 お客様 specify HF repo,またはお客様 可能 pull manually 後 最初の SSH.

03 sizes fit on どの GPU ティア?

Approximate sizing at Q4 quantization: RTX 4090 (24 GB) 適合する 7B-13B comfortablyと27-32B付きoffload pain. RTX 5090 (32 GB) 適合する 27B-32B comfortablyと70B付きoffload. H100 SXM5 (80 GB) 適合する 70B at Q4-Q5 comfortably. Dual H100 (160 GB) 適合する 70B at FP16, 120-180B at Q4. buying ガイド at /ガイドs/rtx-4090-vs-h100-向け-ai-推論 を備えます detailed スループット numbers.

04 Is there コンテンツ ポリシー I 〜します hit?

モデルの出力に対するプラットフォームレベルのコンテンツポリシーはありません。当社の利用規約が禁止するのは、生成方法にかかわらずホスト国で違法となるもののみです(CSAM、大量被害を引き起こす CBRN 攻撃の手順、特定の個人に対するターゲット型ハラスメント)。NSFW、政治的コンテンツ、デュアルユース研究、敵対的プロンプトによる出力を含む、その他すべては動作します。

05 自分のLLMを公開URLで提供できますか?

はい。注文時に「Public HTTPS」を有効にすると、Let's Encrypt 証明書を発行し、ポート 443 のリバースプロキシを vLLM / Ollama / Open WebUI のポートへ自動設定します。モデルは `https://.servprivate.dev` で到達できます。独自ドメインの A レコードを向ける場合も、TLS 付きで追加設定は不要です。

06 どのように 行います この 比較にOpenAI, Anthropicまたはopen-router proxies?

OpenAI / Anthropic:ホステッド、完全なコンテンツポリシー、30日間のプロンプトログ記録、米国の法域。OpenRouter / Together / Fireworks:依然としてホステッド、ベンダー定義のコンテンツポリシー、ベンダーによるログ記録。オフショア GPU 上でのセルフホスト:プラットフォームレベルのポリシーなし、当社によるログ記録なし、ホスト国の法域。トレードオフ:使用するしないにかかわらず GPU 時間の料金が発生し、スタックの運用は自分自身で行う必要があります。大規模な利用ではセルフホストが有利になり、散発的な利用ではホステッド API がコスト面で勝ります。

Self-ホスト お客様の 自前の AI, ログなし,なし ポリシー

Llama, DeepSeek, Qwen, Mistral, Gemma — bring 任意の open-weight モデル. オフショア GPUから$122.00/mo, CUD12 + 1-クリック vLLM ready.

開始する 最適な法域を探す