ホーム / GPU AI ホスティング
RTX 4090 · RTX 5090 · H100 SXM5 · CUDA 12

匿名オフショア GPU AI ホスティング、KYC不要

NVIDIRTX 4090, RTX 5090とH100 SXM5 GPU サーバー向けAI training, 推論, イメージとvideo 生成. CUD12とcuDNN プリインストール済み, 加えて PyTorch / ComfyUI / Ollama イメージ presets readyにssh へ. Threadripper Pro ホスト on H100 ティア向け完全 PCIe Gen 5 lane count. Availableで4 オフショア法域, KYC不要, 暗号資産決済のみで20 コイン including Monero.

KYC不要
暗号資産決済のみ
CUDA 12
クリーンIP
フルroot
Monero accepted
すべての GPU プラン

GPU プラン による ロケーション

全法域で同一の NVIDIA ハードウェアを使用し、全プランで帯域無制限です。料金は法域によって異なります。アイスランドは最低炭素排出量のオプション、モルドバは最安値です。

アイスランド 言論の自由を重視

プランGPUVRAMCPURAMNVMe帯域価格
IS-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe 無制限 $146.50/mo 注文
IS-M 人気 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe 無制限 $234.50/mo 注文
IS-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe 無制限 $906.00/mo 注文
IS-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe 無制限 $1714.50/mo 注文

モルドバ 低コストなオフショア

プランGPUVRAMCPURAMNVMe帯域価格
MD-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe 無制限 $122.00/mo 注文
MD-M 人気 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe 無制限 $195.50/mo 注文
MD-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe 無制限 $832.50/mo 注文
MD-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe 無制限 $1567.50/mo 注文

ルーマニア 反データ保持

プランGPUVRAMCPURAMNVMe帯域価格
RO-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe 無制限 $132.00/mo 注文
RO-M 人気 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe 無制限 $210.00/mo 注文
RO-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe 無制限 $857.00/mo 注文
RO-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe 無制限 $1616.50/mo 注文

オランダ 最高水準のピアリング

プランGPUVRAMCPURAMNVMe帯域価格
NL-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe 無制限 $136.50/mo 注文
NL-M 人気 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe 無制限 $220.00/mo 注文
NL-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe 無制限 $881.50/mo 注文
NL-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe 無制限 $1665.50/mo 注文

GPU ホスティングです 利用可能で4 法域 at launch (アイスランド, オランダ, ルーマニア, モルドバ). ロシアです excluded dueにNVIDIexport 制裁; スイスとパナマはkept Linux-のみ向けnow.

含まれます on すべての GPU サーバー

CUDA 12

CUD12.4/12.6 + cuDNN プリインストール済み. Boot, ssh で, 運用 nvidia-smi.

60秒デプロイ

支払い済み注文からnvidia-smi outputまで60秒未満です。

NVMe SSD

Upに4 TB NVMe SSD, paired付きDDR5 RAM向けfast dataset I/O.

SSH + Jupyter

Full root SSH, 加えて pre-bound JupyterLab on port 8888付きトークン 認証.

用途

What GPU AI Hosting is Used For

LLM ファインチューニングと推論

Llama, Mistral, Qwen, DeepSeek ファインチューニング付きLoR/ QLoR/ 完全 FT on H100. Or セルフホスト 推論付きvLLM / TGI / Ollama向けproduction モデル serving.

画像生成

Stable Diffusion, FLUX.1, SDXL付きComfyUIまたはForge. Train お客様の 自前の LoRA, バッチ-generate at スケール,またはself-ホスト 推論 エンドポイント.

AI 動画生成

OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Video 生成 needs 本格的な VRAM — 開始 at RTX 5090 (32 GB)またはH100 (80 GB).

本番推論

デプロイ fine-tuned モデル behind お客様の 自前の API. Predictable コスト,なし ごと-トークン fees, データなし leaving お客様の 法域. JupyterLab + FastAPI 含まれます.

1-クリック デプロイ

プリインストール済みAIテンプレート

Tick 任意ののこれら at 注文 timeとお客様の GPU サーバー boots付きスタック already インストール済み, configuredと開始ed 経由 systemd. Add pre-ダウンロード済み モデル belowにskip HuggingFace 30-60 min download too.

LLM推論

vLLM (OpenAI-compatible)

Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.

LLMOpenAI APIproduction 16 GB+
LLM推論

Ollama + Open WebUI

Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".

LLMchat UIbeginner 8 GB+
LLM推論

text-generation-webui (Oobabooga)

Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.

LLMmulti-backendpower user 16 GB+
LLM推論

HuggingFace TGI

HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.

LLMproductionHuggingFace 24 GB+
ファインチューニング

Axolotl (LLM finetuning)

YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.

finetuneLoRAQLoRA 24 GB+
ファインチューニング

Unsloth (2× faster finetune)

2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.

finetunefastlow VRAM 16 GB+
ファインチューニング

LLaMA-Factory

WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.

finetuneGUI 24 GB+
画像生成

ComfyUI + FLUX.1

Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.

imageFLUXworkflow 24 GB+
画像生成

Automatic1111 + SD 3.5

The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.

imageSD 3.5 16 GB+
画像生成

Forge (faster A1111)

A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.

imageFLUXfast 16 GB+
画像生成

Kohya SS (LoRA training)

GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.

LoRA trainingimageGUI 16 GB+
AI動画

ComfyUI + Wan 2.2 / HunyuanVideo

ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.

videoWan 2.2HunyuanVideo 40 GB+
AI動画

ComfyUI Video Lite (CogVideoX / LTX)

Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.

videoCogVideoXlow VRAM 16 GB+
音声

Whisper Large v3 Turbo server

OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.

audiospeech-to-textAPI 6 GB+
音声

TTS server (Kokoro + CSM-1B)

Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.

audiotext-to-speechAPI 6 GB+
ノートブック & 開発

JupyterLab + PyTorch baseline

Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.

notebookbaselinealways-on 0 GB+
ノートブック & 開発

code-server (VSCode in browser)

VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.

IDEVSCodedev 0 GB+

Combine 複数の スタック on 同じ GPU — デプロイ スクリプト resolves dependency conflictsとassigns non-clashing ports.

省略 download

Pre-ダウンロード済み open-weight モデル

Tick モデル お客様 必要 at 注文 timeとそれら're cachedで/root/.cache/huggingface 前 お客様 ログ で. 🔒 Gated モデル (Llama, Mistral, Gemma, FLUX-dev, SD 3.5) 要求 お客様の HuggingFace トークン (また asked at 注文 time).

モデル HuggingFace サイズ 最小VRAM Min GPU ティア タイプ
Llama 3.3 70B Instruct 🔒 制限付き meta-llama/Llama-3.3-70B-Instruct 140 GB 160 GB GPU-L LLM
Qwen3 32B Qwen/Qwen3-32B 64 GB 80 GB GPU-L LLM
Qwen3 14B Qwen/Qwen3-14B 28 GB 32 GB GPU-S LLM
Qwen3 8B Qwen/Qwen3-8B 16 GB 20 GB GPU-S LLM
DeepSeek-R1 Distill Qwen 32B deepseek-ai/DeepSeek-R1-Distill-Qwen-32B 64 GB 80 GB GPU-S LLM
DeepSeek-R1 Distill Llama 70B deepseek-ai/DeepSeek-R1-Distill-Llama-70B 140 GB 160 GB GPU-S LLM
Mistral Small 3.2 24B (multimodal) mistralai/Mistral-Small-3.2-24B-Instruct-2506 48 GB 60 GB GPU-S LLM
Gemma 3 27B (multimodal) 🔒 制限付き google/gemma-3-27b-it 54 GB 64 GB GPU-L LLM
Gemma 3 12B (multimodal) 🔒 制限付き google/gemma-3-12b-it 24 GB 28 GB GPU-S LLM
Phi-4 (14B) microsoft/phi-4 28 GB 32 GB GPU-S LLM
Phi-4 Mini Instruct (3.8B) microsoft/Phi-4-mini-instruct 8 GB 10 GB GPU-S LLM
FLUX.1 [dev] 🔒 制限付き black-forest-labs/FLUX.1-dev 24 GB 24 GB GPU-S 画像
FLUX.1 [schnell] black-forest-labs/FLUX.1-schnell 24 GB 24 GB GPU-S 画像
FLUX.1 Kontext [dev] (image editing) 🔒 制限付き black-forest-labs/FLUX.1-Kontext-dev 24 GB 24 GB GPU-S 画像
Stable Diffusion 3.5 Large 🔒 制限付き stabilityai/stable-diffusion-3.5-large 16 GB 18 GB GPU-S 画像
Stable Diffusion 3.5 Medium 🔒 制限付き stabilityai/stable-diffusion-3.5-medium 5 GB 10 GB GPU-S 画像
HiDream-I1 Full HiDream-ai/HiDream-I1-Full 34 GB 40 GB GPU-S 画像
Wan 2.2 T2V A14B Wan-AI/Wan2.2-T2V-A14B 28 GB 40 GB GPU-S 動画
Wan 2.1 T2V 1.3B (low VRAM) Wan-AI/Wan2.1-T2V-1.3B 3 GB 8 GB GPU-S 動画
HunyuanVideo 1.5 (8.3B) tencent/HunyuanVideo-1.5 17 GB 24 GB GPU-S 動画
LTX-Video 0.9.8 13B Lightricks/LTX-Video 26 GB 24 GB GPU-S 動画
CogVideoX-5B zai-org/CogVideoX-5b 10 GB 16 GB GPU-S 動画
Whisper Large v3 Turbo openai/whisper-large-v3-turbo 2 GB 4 GB GPU-S 音声
Whisper Large v3 openai/whisper-large-v3 3 GB 6 GB GPU-S 音声
Kokoro 82M (TTS) hexgrad/Kokoro-82M 1 GB 2 GB GPU-S 音声
Sesame CSM-1B (conversational TTS) sesame/csm-1b 2 GB 6 GB GPU-S 音声
Stable Audio Open 1.0 🔒 制限付き stabilityai/stable-audio-open-1.0 3 GB 8 GB GPU-S 音声

SizesはFP16 重み.向けRTX 4090 (24 GB VRAM) on 70B モデル, AWQ-quantized variantです 自動ダウンロード済みでparallel.

どのように 当社 比較

ServPrivate vs Vast.ai · RunPod · Paperspace · Lambda Labs · TensorDock

暗号資産決済のみ 決済フロー, ネイティブ Monero, トークン-のみ 登録, プリインストール済み AI スタック, pre-ダウンロード済み HuggingFace モデル, 暗号化 HF トークン, auto Let's Encrypt エンドポイント, 帯域無制限と100% 再生可能 エネルギーでアイスランド — 読み込み row labelled "ServPrivate"とjudge向けyourself.

機能 ServPrivate Vast.ai RunPod Paperspace Lambda TensorDock
暗号資産決済のみ 決済フロー ✅ 20 coins⚠️ BTC⚠️ Gateway⚠️ BTC/ETH/USDT
Monero (XMR) ネイティブ対応
KYC不要,なし メールアドレス 登録 ✅ Token-only⚠️ Email + ID for trust⚠️ Email + payment❌ Full KYC❌ Enterprise KYC⚠️ Email + light KYC
プリインストール済みAIスタック ✅ 17 templates⚠️ Docker BYO✅ 100+⚠️ Notebooks only⚠️ Lambda Stack only⚠️ Docker BYO
Pre-ダウンロード済み モデル at 注文 ✅ 27 models
HuggingFace トークン at 注文 ✅ Encrypted, used once
SSH 鍵 at 注文 ⚠️⚠️
自動シャットダウンタイマー ✅ 6h-7d⚠️ Spot only
Public HTTPS エンドポイント (Let's Encrypt) ✅ Auto⚠️ Manual✅ Pods⚠️ Manual
帯域無制限 ⚠️ Per host⚠️ Capped⚠️ Capped⚠️ Capped⚠️ Per host
Renewable-エネルギー データセンター ✅ Iceland 100% geo+hydro❌ Variable⚠️ US grid⚠️ US grid⚠️ US grid⚠️ Variable
オフショア 法域 ✅ IS / NL / RO / MD❌ Distributed P2P❌ US-centric❌ US❌ US-only⚠️ Multi-region
Sandbox dry-運用 mode ✅ ?dry_run=1⚠️ Trial credit⚠️ Limited⚠️ Free GPU tier
AI-エージェント / MCP 最初の ✅ MCP + REST + x402⚠️ REST⚠️ REST⚠️ REST⚠️ REST⚠️ REST
RTX 4090エントリー / 月 $122.00~$216 spot~$396 on-demandn/an/a~$252 spot

Comparison データ sourcedからcompetitors' 公開 2026-05 料金 pagesと登録 flows. ServPrivate エントリー RTX 4090 = $122.00/mo モルドバ; competitor "spot" 価格はaverage rates向けequivalent ハードウェア.

FAQ

GPU AI ホスティング FAQ

01 Is GPU passed 経由して付き完全 ハードウェア アクセス, またはです it 共有 / vGPU sliced?

完全なハードウェアパススルーです。vGPU スライスでも時間共有の MIG パーティションでもなく、VRAM に直接アクセスできる物理 NVIDIA カード全体を取得します。VM 内の nvidia-smi はベアメタルホストと同じ数値を表示します。フルのドライバーアクセス、完全な CUDA、完全な PyTorch / TensorFlow スタック — SR-IOV の制約はありません。

02 どの CUD/ driver versionsはプリインストール済み?

Default imageはUbuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550です。すぐ使えるimageとしてUbuntu 24.04 + CUDA 12.6、Ubuntu 22 + PyTorch 2.5、Ubuntu 22 + ComfyUI + Flux、Ubuntu 22 + Ollama + Open WebUIも用意しています。自分のスタックを入れたい場合は、Vanilla Ubuntu / Debian / AlmaLinux / Rockyも選べます。完全rootとしていつでもdriver versionを切り替えられます。

03 自社AI startupのproduction 推論をこれらのGPUで運用できますか?

はい。当社のGPU利用者の多くは、vLLM / TGI / FastAPI上で公開推論 APIを運用しています。GPUサーバーには完全root、予測可能な月額請求 (トークン単位のsurpriseなし)、固定法域IPが含まれます。すべてのGPUプランで帯域は無制限のため、meterやoverage feeを気にせず高トラフィックの公開 エンドポイントを提供できます。

04 なぜです ロシア excludedからGPU ロケーション?

NVIDIA H100、A100、高性能RTXカード(4090以上)は、米国商務省の輸出規制(15 CFR Part 744)およびEUのデュアルユース規制の対象であり、ロシアのデータセンターへの出荷が禁止されています。当社はサプライチェーンに適用される規制を遵守するため、これらをロシアではプロビジョニングしません。ロシアでオフショアLinux VPSまたは専用サーバーが必要な場合、それらの製品ラインは影響を受けません。

05 なぜです アイスランド positioned as プレミアム GPU ロケーション?

アイスランドのデータセンターは 100% 再生可能エネルギー(地熱 + 水力)で運用されており、冷涼な外気温が持続負荷時に各 700W を消費する H100 の冷却コストを大幅に削減します。その結果、市場における最低炭素排出量のオフショア GPU 演算を実現しています。プレミアム価格はアイスランドの高いデータセンターコストとクリーンなエネルギー調達費用を反映しています。クリーンな電力でオフショアプライバシーを必要とする ESG 重視の AI チームにとって、唯一信頼できるオフショアの選択肢です。

06 distributed training (DDP / FSDP) で複数GPUを使えますか?

はい。GPU-XLティアは、1台のマシン内にNVLink接続の2×H100 SXM5を搭載しており、FSDP、DeepSpeed ZeRO-3、同一マシン上のDDPに適しています。マルチノード学習では、同じデータセンター内で複数のGPU-XLサーバーを借り、10Gbpsアップリンクで接続できます。8×H100クラスターのノードはまだ提供していません。さらに大きな学習運用が必要な場合はお問い合わせください。

オフショアGPUサーバーをデプロイ

法域とNVIDIA GPUを選び、20種類の暗号資産のいずれかで支払うだけです。60秒未満でLive JupyterLabが起動します。KYC不要、メールアドレス不要、電話番号不要。必要なのはトークンだけです。

表示 GPU プラン