ホーム / GPU AI ホスティング

RTX 4090 · RTX 5090 · H100 SXM5 · CUDA 12

匿名オフショア GPU AI ホスティング、KYC不要

Name: Offshore GPU AI Hosting
Brand: ServPrivate
Availability: InStock

AIの学習、推論、画像・動画生成向けのNVIDIA RTX 4090、RTX 5090、H100 SXM5 GPUサーバー。CUDA 12とcuDNNをプリインストール済みで、PyTorch/ComfyUI/Ollamaのイメージプリセットもすぐにsshで利用できます。H100ティアはThreadripper Proホストを採用し、PCIe Gen 5のレーン数をフルに確保。4つのオフショア法域で利用可能、KYC不要、Moneroを含む8種類のコインによる暗号資産決済のみに対応。

表示 GPU プラン専用サーバーいいえ-KYC GPU Uncensored AI ホスティング

すべての GPU サーバー Includes

NVIDIハードウェア, 完全 passthrough
CUD12 + cuDNN プリインストール済み
Threadripper / Ryzen 9 ホスト
NVMe SSD & DDR5
60秒デプロイ
Moneroを含む8種類の暗号資産に対応

KYC不要

暗号資産決済のみ

CUDA 12

クリーンIP

フルroot

Monero accepted

すべての GPU プラン

ロケーション別GPUプラン

全法域で同一の NVIDIA ハードウェアを使用し、全プランで帯域無制限です。料金は法域によって異なります。アイスランドは最低炭素排出量のオプション、モルドバは最安値です。

アイスランド言論の自由を重視

プラン	GPU	VRAM	CPU	RAM	NVMe	帯域	価格
IS-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	無制限	$146.50/mo	注文
IS-M 人気	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	無制限	$234.50/mo	注文
IS-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	無制限	$906.00/mo	注文
IS-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	無制限	$1714.50/mo	注文

モルドバ低コストなオフショア

プラン	GPU	VRAM	CPU	RAM	NVMe	帯域	価格
MD-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	無制限	$122.00/mo	注文
MD-M 人気	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	無制限	$195.50/mo	注文
MD-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	無制限	$832.50/mo	注文
MD-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	無制限	$1567.50/mo	注文

ルーマニア反データ保持

プラン	GPU	VRAM	CPU	RAM	NVMe	帯域	価格
RO-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	無制限	$132.00/mo	注文
RO-M 人気	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	無制限	$210.00/mo	注文
RO-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	無制限	$857.00/mo	注文
RO-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	無制限	$1616.50/mo	注文

オランダ最高水準のピアリング

プラン	GPU	VRAM	CPU	RAM	NVMe	帯域	価格
NL-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	無制限	$136.50/mo	注文
NL-M 人気	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	無制限	$220.00/mo	注文
NL-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	無制限	$881.50/mo	注文
NL-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	無制限	$1665.50/mo	注文

GPUホスティングはローンチ時点で4法域（アイスランド、オランダ、ルーマニア、モルドバ）で利用可能です。ロシアはNVIDIAの輸出制裁により対象外です。スイスとパナマは当面Linux専用のままとなります。

含まれます on すべての GPU サーバー

CUDA 12

CUDA 12.4/12.6+cuDNNをプリインストール。起動してSSHし、nvidia-smiを実行するだけです。

60秒デプロイ

支払い済み注文からnvidia-smi outputまで60秒未満です。

NVMe SSD

最大4TBのNVMe SSDとDDR5 RAMを組み合わせ、高速なデータセットI/Oを実現。

SSH + Jupyter

完全なrootでのSSHに加え、トークン認証付きでポート8888にJupyterLabを事前バインド。

用途

What GPU AI Hosting is Used For

LLM ファインチューニングと推論

Llama、Mistral、Qwen、DeepSeekをH100上でLoRA/QLoRA/フルファインチューニング。あるいはvLLM/TGI/Ollamaによるセルフホスト推論で本番向けモデル配信も可能です。

画像生成

Stable Diffusion、FLUX.1、SDXLをComfyUIまたはForgeで。独自のLoRAを学習させたり、大規模にバッチ生成したり、推論エンドポイントを自前でホストできます。

AI 動画生成

OpenSora、CogVideoX、Wan-2.1、AnimateDiff。動画生成には大量のVRAMが必要です——RTX 5090（32GB）またはH100（80GB）から始めてください。

本番推論

ファインチューニング済みモデルを自前のAPI経由でデプロイ。コストは予測可能で、トークン単位の料金もなく、データが法域外へ出ることもありません。JupyterLab+FastAPIも含まれます。

ワンクリックデプロイ

プリインストール済みAIテンプレート

注文時に必要なオプションにチェックを入れると、GPUサーバーはスタックがインストール・設定済みで、systemd経由ですでに起動した状態でブートします。下で事前ダウンロード済みモデルを有効にすると、HuggingFaceの30〜60分のダウンロードもスキップできます。

LLM推論

vLLM (OpenAI-compatible)

Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.

LLMOpenAI APIproduction 16 GB+

LLM推論

Ollama + Open WebUI

Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".

LLMchat UIbeginner 8 GB+

LLM推論

text-generation-webui (Oobabooga)

Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.

LLMmulti-backendpower user 16 GB+

LLM推論

HuggingFace TGI

HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.

LLMproductionHuggingFace 24 GB+

ファインチューニング

Axolotl (LLM finetuning)

YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.

finetuneLoRAQLoRA 24 GB+

ファインチューニング

Unsloth (2× faster finetune)

2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.

finetunefastlow VRAM 16 GB+

ファインチューニング

LLaMA-Factory

WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.

finetuneGUI 24 GB+

画像生成

ComfyUI + FLUX.1

Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.

imageFLUXworkflow 24 GB+

画像生成

Automatic1111 + SD 3.5

The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.

imageSD 3.5 16 GB+

画像生成

Forge (faster A1111)

A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.

imageFLUXfast 16 GB+

画像生成

Kohya SS (LoRA training)

GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.

LoRA trainingimageGUI 16 GB+

AI動画

ComfyUI + Wan 2.2 / HunyuanVideo

ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.

videoWan 2.2HunyuanVideo 40 GB+

AI動画

ComfyUI Video Lite (CogVideoX / LTX)

Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.

videoCogVideoXlow VRAM 16 GB+

音声

Whisper Large v3 Turbo server

OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.

audiospeech-to-textAPI 6 GB+

音声

TTS server (Kokoro + CSM-1B)

Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.

audiotext-to-speechAPI 6 GB+

ノートブック & 開発

JupyterLab + PyTorch baseline

Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.

notebookbaselinealways-on 0 GB+

ノートブック & 開発

code-server (VSCode in browser)

VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.

IDEVSCodedev 0 GB+

同じGPU上で複数のスタックを組み合わせられます——デプロイスクリプトが依存関係の競合を解決し、重複しないポートを割り当てます。

省略 download

事前ダウンロード済みのオープンウェイトモデル

注文時に必要なモデルにチェックを入れると、ログイン前に/root/.cache/huggingfaceへキャッシュされます。🔒ゲートモデル（Llama、Mistral、Gemma、FLUX-dev、SD 3.5）にはHuggingFaceトークンが必要です（こちらも注文時に入力）。

モデル	HuggingFace	サイズ	最小VRAM	Min GPU ティア	タイプ
Llama 3.3 70B Instruct 🔒 制限付き	`meta-llama/Llama-3.3-70B-Instruct`	140 GB	160 GB	GPU-L	LLM
Qwen3 32B	`Qwen/Qwen3-32B`	64 GB	80 GB	GPU-L	LLM
Qwen3 14B	`Qwen/Qwen3-14B`	28 GB	32 GB	GPU-S	LLM
Qwen3 8B	`Qwen/Qwen3-8B`	16 GB	20 GB	GPU-S	LLM
DeepSeek-R1 Distill Qwen 32B	`deepseek-ai/DeepSeek-R1-Distill-Qwen-32B`	64 GB	80 GB	GPU-S	LLM
DeepSeek-R1 Distill Llama 70B	`deepseek-ai/DeepSeek-R1-Distill-Llama-70B`	140 GB	160 GB	GPU-S	LLM
Mistral Small 3.2 24B (multimodal)	`mistralai/Mistral-Small-3.2-24B-Instruct-2506`	48 GB	60 GB	GPU-S	LLM
Gemma 3 27B (multimodal) 🔒 制限付き	`google/gemma-3-27b-it`	54 GB	64 GB	GPU-L	LLM
Gemma 3 12B (multimodal) 🔒 制限付き	`google/gemma-3-12b-it`	24 GB	28 GB	GPU-S	LLM
Phi-4 (14B)	`microsoft/phi-4`	28 GB	32 GB	GPU-S	LLM
Phi-4 Mini Instruct (3.8B)	`microsoft/Phi-4-mini-instruct`	8 GB	10 GB	GPU-S	LLM
FLUX.1 [dev] 🔒 制限付き	`black-forest-labs/FLUX.1-dev`	24 GB	24 GB	GPU-S	画像
FLUX.1 [schnell]	`black-forest-labs/FLUX.1-schnell`	24 GB	24 GB	GPU-S	画像
FLUX.1 Kontext [dev] (image editing) 🔒 制限付き	`black-forest-labs/FLUX.1-Kontext-dev`	24 GB	24 GB	GPU-S	画像
Stable Diffusion 3.5 Large 🔒 制限付き	`stabilityai/stable-diffusion-3.5-large`	16 GB	18 GB	GPU-S	画像
Stable Diffusion 3.5 Medium 🔒 制限付き	`stabilityai/stable-diffusion-3.5-medium`	5 GB	10 GB	GPU-S	画像
HiDream-I1 Full	`HiDream-ai/HiDream-I1-Full`	34 GB	40 GB	GPU-S	画像
Wan 2.2 T2V A14B	`Wan-AI/Wan2.2-T2V-A14B`	28 GB	40 GB	GPU-S	動画
Wan 2.1 T2V 1.3B (low VRAM)	`Wan-AI/Wan2.1-T2V-1.3B`	3 GB	8 GB	GPU-S	動画
HunyuanVideo 1.5 (8.3B)	`tencent/HunyuanVideo-1.5`	17 GB	24 GB	GPU-S	動画
LTX-Video 0.9.8 13B	`Lightricks/LTX-Video`	26 GB	24 GB	GPU-S	動画
CogVideoX-5B	`zai-org/CogVideoX-5b`	10 GB	16 GB	GPU-S	動画
Whisper Large v3 Turbo	`openai/whisper-large-v3-turbo`	2 GB	4 GB	GPU-S	音声
Whisper Large v3	`openai/whisper-large-v3`	3 GB	6 GB	GPU-S	音声
Kokoro 82M (TTS)	`hexgrad/Kokoro-82M`	1 GB	2 GB	GPU-S	音声
Sesame CSM-1B (conversational TTS)	`sesame/csm-1b`	2 GB	6 GB	GPU-S	音声
Stable Audio Open 1.0 🔒 制限付き	`stabilityai/stable-audio-open-1.0`	3 GB	8 GB	GPU-S	音声

サイズはFP16重みでの数値です。RTX 4090（24GB VRAM）で70Bモデルを使う場合、AWQ量子化版が自動的に並行ダウンロードされます。

比較方法

ServPrivate vs Vast.ai · RunPod · Paperspace · Lambda Labs · TensorDock

暗号資産のみの決済、Monero対応、トークンのみの登録、プリインストール済みAIスタック、事前ダウンロード済みHuggingFaceモデル、暗号化されたHFトークン、自動Let's Encryptエンドポイント、帯域無制限、そしてアイスランドでの100%再生可能エネルギー——ServPrivateの行をご覧になり、ご自身で判断してください。

機能	ServPrivate	Vast.ai	RunPod	Paperspace	Lambda	TensorDock
暗号資産のみの決済	✅ 8 coins	⚠️ BTC	⚠️ Gateway	❌	❌	⚠️ BTC/ETH/USDT
Monero (XMR) ネイティブ対応	✅	❌	❌	❌	❌	❌
KYC不要、メールアドレス登録も不要	✅ Token-only	⚠️ Email + ID for trust	⚠️ Email + payment	❌ Full KYC	❌ Enterprise KYC	⚠️ Email + light KYC
プリインストール済みAIスタック	✅ 17 templates	⚠️ Docker BYO	✅ 100+	⚠️ Notebooks only	⚠️ Lambda Stack only	⚠️ Docker BYO
注文時にダウンロード済みのモデル	✅ 27 models	❌	❌	❌	❌	❌
HuggingFace トークン at 注文	✅ Encrypted, used once	❌	❌	❌	❌	❌
SSH 鍵 at 注文	✅	✅	✅	⚠️	✅	⚠️
自動シャットダウンタイマー	✅ 6h-7d	✅	⚠️ Spot only	❌	❌	❌
公開HTTPSエンドポイント（Let's Encrypt）	✅ Auto	⚠️ Manual	✅ Pods	✅	❌	⚠️ Manual
帯域無制限	✅	⚠️ Per host	⚠️ Capped	⚠️ Capped	⚠️ Capped	⚠️ Per host
再生可能エネルギーデータセンター	✅ Iceland 100% geo+hydro	❌ Variable	⚠️ US grid	⚠️ US grid	⚠️ US grid	⚠️ Variable
オフショア法域	✅ IS / NL / RO / MD	❌ Distributed P2P	❌ US-centric	❌ US	❌ US-only	⚠️ Multi-region
サンドボックス・ドライランモード	✅ ?dry_run=1	⚠️ Trial credit	⚠️ Limited	⚠️ Free GPU tier	❌	❌
AI-エージェント / MCP 最初の	✅ MCP + REST + x402	⚠️ REST	⚠️ REST	⚠️ REST	⚠️ REST	⚠️ REST
RTX 4090エントリー / 月	$122.00	~$216 spot	~$396 on-demand	n/a	n/a	~$252 spot

比較データは、2026年5月時点の競合他社の公開料金ページおよび登録フローから収集しています。ServPrivateのエントリーRTX 4090はモルドバで月額$249。競合の「スポット」価格は同等ハードウェアの平均レートです。

FAQ

GPU AI ホスティング FAQ

01 GPUは完全なハードウェアアクセスでパススルーされますか、それとも共有/vGPUスライスですか？

完全なハードウェアパススルーです。vGPU スライスでも時間共有の MIG パーティションでもなく、VRAM に直接アクセスできる物理 NVIDIA カード全体を取得します。VM 内の nvidia-smi はベアメタルホストと同じ数値を表示します。フルのドライバーアクセス、完全な CUDA、完全な PyTorch / TensorFlow スタック — SR-IOV の制約はありません。

02 どのCUDA/ドライバーバージョンがプリインストールされていますか？

Default imageはUbuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550です。すぐ使えるimageとしてUbuntu 24.04 + CUDA 12.6、Ubuntu 22 + PyTorch 2.5、Ubuntu 22 + ComfyUI + Flux、Ubuntu 22 + Ollama + Open WebUIも用意しています。自分のスタックを入れたい場合は、Vanilla Ubuntu / Debian / AlmaLinux / Rockyも選べます。完全rootとしていつでもdriver versionを切り替えられます。

03 自社AI startupのproduction 推論をこれらのGPUで運用できますか？

はい。当社のGPU利用者の多くは、vLLM/TGI/FastAPI上で公開推論APIを運用しています。GPUサーバーには完全なroot権限、予測可能な月額請求（トークン単位の想定外料金なし）、固定の法域IPが含まれます。すべてのGPUプランで帯域は無制限のため、メーターや超過料金を気にせず高トラフィックの公開エンドポイントを提供できます。

04 なぜロシアはGPUロケーションから除外されているのですか?

NVIDIA H100、A100、高性能RTXカード（4090以上）は、米国商務省の輸出規制（15 CFR Part 744）およびEUのデュアルユース規制の対象であり、ロシアのデータセンターへの出荷が禁止されています。当社はサプライチェーンに適用される規制を遵守するため、これらをロシアではプロビジョニングしません。ロシアでオフショアLinux VPSまたは専用サーバーが必要な場合、それらの製品ラインは影響を受けません。

05 なぜアイスランドがプレミアムGPUロケーションと位置づけられているのですか?

アイスランドのデータセンターは 100% 再生可能エネルギー（地熱 + 水力）で運用されており、冷涼な外気温が持続負荷時に各 700W を消費する H100 の冷却コストを大幅に削減します。その結果、市場における最低炭素排出量のオフショア GPU 演算を実現しています。プレミアム価格はアイスランドの高いデータセンターコストとクリーンなエネルギー調達費用を反映しています。クリーンな電力でオフショアプライバシーを必要とする ESG 重視の AI チームにとって、唯一信頼できるオフショアの選択肢です。

06 distributed training (DDP / FSDP) で複数GPUを使えますか？

はい。GPU-XLティアは、1台のマシン内にNVLink接続の2×H100 SXM5を搭載しており、FSDP、DeepSpeed ZeRO-3、同一マシン上のDDPに適しています。マルチノード学習では、同じデータセンター内で複数のGPU-XLサーバーを借り、10Gbpsアップリンクで接続できます。8×H100クラスターのノードはまだ提供していません。さらに大きな学習運用が必要な場合はお問い合わせください。

オフショアGPUサーバーをデプロイ

法域とNVIDIA GPUを選び、8種類の暗号資産のいずれかで支払うだけです。60秒未満でLive JupyterLabが起動します。KYC不要、メールアドレス不要、電話番号不要。必要なのはトークンだけです。

表示 GPU プラン

匿名オフショア GPU AI ホスティング、KYC不要

すべての GPU サーバー Includes

ロケーション別GPUプラン

アイスランド 言論の自由を重視

モルドバ 低コストなオフショア

ルーマニア 反データ保持

オランダ 最高水準のピアリング

含まれます on すべての GPU サーバー

CUDA 12

60秒デプロイ

NVMe SSD

SSH + Jupyter

What GPU AI Hosting is Used For

LLM ファインチューニングと推論

画像生成

AI 動画生成

本番推論

プリインストール済みAIテンプレート

vLLM (OpenAI-compatible)

Ollama + Open WebUI

text-generation-webui (Oobabooga)

HuggingFace TGI

Axolotl (LLM finetuning)

Unsloth (2× faster finetune)

LLaMA-Factory

ComfyUI + FLUX.1

Automatic1111 + SD 3.5

Forge (faster A1111)

Kohya SS (LoRA training)

ComfyUI + Wan 2.2 / HunyuanVideo

ComfyUI Video Lite (CogVideoX / LTX)

Whisper Large v3 Turbo server

TTS server (Kokoro + CSM-1B)

JupyterLab + PyTorch baseline

code-server (VSCode in browser)

事前ダウンロード済みのオープンウェイトモデル

ServPrivate vs Vast.ai · RunPod · Paperspace · Lambda Labs · TensorDock

GPU AI ホスティング FAQ

オフショアGPUサーバーをデプロイ

アイスランド言論の自由を重視

モルドバ低コストなオフショア

ルーマニア反データ保持

オランダ最高水準のピアリング