Ana Sayfa / GPU AI Barındırma
RTX 4090 · RTX 5090 · H100 SXM5 · CUDA 12

Anonim Offshore GPU AI Barındırma, KYC'siz

NVIDIA RTX 4090, RTX 5090 ve H100 SXM5 GPU sunucular için AI training, inference, image ve video generation. CUDA 12 ve cuDNN preinstalled, plus PyTorch / ComfyUI / Ollama image presets hazır için ssh içine. Threadripper Pro hosts üzerinde H100 tiers için tam PCIe Gen 5 lane count. Available içinde 4 offshore jurisdictions, yok KYC, crypto-yalnızca ödeme içinde 20 coins including Monero.

KYC yok
Yalnızca Kripto
CUDA 12
Temiz IP'ler
Tam Root
Monero accepted
Tüm GPU Planları

GPU Plans tarafından Lokasyon

Her yargı bölgesinde aynı NVIDIA donanımı ve her planda sınırsız bant genişliği. Fiyatlandırma yargı bölgesine göre değişir — İzlanda en düşük karbonlu seçenek, Moldova en ucuzu.

İzlanda İfade özgürlüğü için güvenli bölge

PaketGPUVRAMCPURAMNVMeBant GenişliğiFiyat
IS-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe Sınırsız $146.50/mo Sipariş
IS-M Popüler 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe Sınırsız $234.50/mo Sipariş
IS-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe Sınırsız $906.00/mo Sipariş
IS-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe Sınırsız $1714.50/mo Sipariş

Moldova Uygun maliyetli offshore

PaketGPUVRAMCPURAMNVMeBant GenişliğiFiyat
MD-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe Sınırsız $122.00/mo Sipariş
MD-M Popüler 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe Sınırsız $195.50/mo Sipariş
MD-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe Sınırsız $832.50/mo Sipariş
MD-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe Sınırsız $1567.50/mo Sipariş

Romanya Veri saklama karşıtı

PaketGPUVRAMCPURAMNVMeBant GenişliğiFiyat
RO-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe Sınırsız $132.00/mo Sipariş
RO-M Popüler 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe Sınırsız $210.00/mo Sipariş
RO-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe Sınırsız $857.00/mo Sipariş
RO-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe Sınırsız $1616.50/mo Sipariş

Hollanda En iyi peering

PaketGPUVRAMCPURAMNVMeBant GenişliğiFiyat
NL-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe Sınırsız $136.50/mo Sipariş
NL-M Popüler 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe Sınırsız $220.00/mo Sipariş
NL-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe Sınırsız $881.50/mo Sipariş
NL-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe Sınırsız $1665.50/mo Sipariş

GPU barındırma olur mevcut içinde 4 jurisdictions konumunda launch (İzlanda, Hollanda, Romanya, Moldova). Rusya olur excluded due için NVIDIA export sanctions; İsviçre ve Panama olur kept Linux-yalnızca için now.

Included üzerinde Her GPU Server

CUDA 12

CUDA 12.4/12.6 + cuDNN preinstalled. Boot, ssh içinde, run nvidia-smi.

60 saniyelik dağıtım

From paid sipariş için nvidia-smi output içinde altında 60 seconds.

NVMe SSD

Up için 4 TB NVMe SSD, paired ile DDR5 RAM için fast dataset I/O.

SSH + Jupyter

Full root SSH, plus pre-bound JupyterLab üzerinde port 8888 ile token auth.

Kullanım senaryoları

What GPU AI Hosting is Used For

LLM ince ayarı ve çıkarım

Llama, Mistral, Qwen, DeepSeek finetuning ile LoRA / QLoRA / tam FT üzerinde H100. Or self-hosted inference ile vLLM / TGI / Ollama için production model serving.

Görüntü oluşturma

Stable Diffusion, FLUX.1, SDXL ile ComfyUI veya Forge. Train sizin own LoRA, batch-generate konumunda scale, veya self-host an inference endpoint.

AI video oluşturma

OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Video generation needs serious VRAM — başla konumunda RTX 5090 (32 GB) veya H100 (80 GB).

Üretim çıkarımı

Deploy fine-tuned models behind sizin own API. Predictable costs, yok per-token fees, yok data leaving sizin jurisdiction. JupyterLab + FastAPI dahil.

1 tıklamayla dağıtım

Önceden yüklü AI şablonları

Tick any -ın bunlar konumunda sipariş zaman ve sizin GPU sunucu boots ile stack already installed, yapılandırınd ve started üzerinden systemd. Add pre-downloaded models below için skip HuggingFace 30-60 min download too.

LLM Çıkarımı

vLLM (OpenAI-compatible)

Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.

LLMOpenAI APIproduction 16 GB+
LLM Çıkarımı

Ollama + Open WebUI

Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".

LLMchat UIbeginner 8 GB+
LLM Çıkarımı

text-generation-webui (Oobabooga)

Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.

LLMmulti-backendpower user 16 GB+
LLM Çıkarımı

HuggingFace TGI

HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.

LLMproductionHuggingFace 24 GB+
İnce ayar

Axolotl (LLM finetuning)

YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.

finetuneLoRAQLoRA 24 GB+
İnce ayar

Unsloth (2× faster finetune)

2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.

finetunefastlow VRAM 16 GB+
İnce ayar

LLaMA-Factory

WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.

finetuneGUI 24 GB+
Görüntü Oluşturma

ComfyUI + FLUX.1

Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.

imageFLUXworkflow 24 GB+
Görüntü Oluşturma

Automatic1111 + SD 3.5

The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.

imageSD 3.5 16 GB+
Görüntü Oluşturma

Forge (faster A1111)

A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.

imageFLUXfast 16 GB+
Görüntü Oluşturma

Kohya SS (LoRA training)

GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.

LoRA trainingimageGUI 16 GB+
AI Video

ComfyUI + Wan 2.2 / HunyuanVideo

ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.

videoWan 2.2HunyuanVideo 40 GB+
AI Video

ComfyUI Video Lite (CogVideoX / LTX)

Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.

videoCogVideoXlow VRAM 16 GB+
Ses

Whisper Large v3 Turbo server

OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.

audiospeech-to-textAPI 6 GB+
Ses

TTS server (Kokoro + CSM-1B)

Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.

audiotext-to-speechAPI 6 GB+
Dizüstü Bilgisayarlar & Geliştirme

JupyterLab + PyTorch baseline

Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.

notebookbaselinealways-on 0 GB+
Dizüstü Bilgisayarlar & Geliştirme

code-server (VSCode in browser)

VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.

IDEVSCodedev 0 GB+

Combine multiple stacks üzerinde aynı GPU — deploy script resolves dependency conflicts ve assigns non-clashing ports.

Skip download

Önceden indirilmiş açık ağırlıklı modeller

Tick models siz need konumunda sipariş zaman ve onlar're cached içinde /root/.cache/huggingface before siz log içinde. 🔒 Gated models (Llama, Mistral, Gemma, FLUX-dev, SD 3.5) require sizin HuggingFace token (also asked konumunda sipariş zaman).

Model HuggingFace Size Min VRAM Min GPU kademesi Tür
Llama 3.3 70B Instruct 🔒 Kısıtlı meta-llama/Llama-3.3-70B-Instruct 140 GB 160 GB GPU-L LLM
Qwen3 32B Qwen/Qwen3-32B 64 GB 80 GB GPU-L LLM
Qwen3 14B Qwen/Qwen3-14B 28 GB 32 GB GPU-S LLM
Qwen3 8B Qwen/Qwen3-8B 16 GB 20 GB GPU-S LLM
DeepSeek-R1 Distill Qwen 32B deepseek-ai/DeepSeek-R1-Distill-Qwen-32B 64 GB 80 GB GPU-S LLM
DeepSeek-R1 Distill Llama 70B deepseek-ai/DeepSeek-R1-Distill-Llama-70B 140 GB 160 GB GPU-S LLM
Mistral Small 3.2 24B (multimodal) mistralai/Mistral-Small-3.2-24B-Instruct-2506 48 GB 60 GB GPU-S LLM
Gemma 3 27B (multimodal) 🔒 Kısıtlı google/gemma-3-27b-it 54 GB 64 GB GPU-L LLM
Gemma 3 12B (multimodal) 🔒 Kısıtlı google/gemma-3-12b-it 24 GB 28 GB GPU-S LLM
Phi-4 (14B) microsoft/phi-4 28 GB 32 GB GPU-S LLM
Phi-4 Mini Instruct (3.8B) microsoft/Phi-4-mini-instruct 8 GB 10 GB GPU-S LLM
FLUX.1 [dev] 🔒 Kısıtlı black-forest-labs/FLUX.1-dev 24 GB 24 GB GPU-S Görüntü
FLUX.1 [schnell] black-forest-labs/FLUX.1-schnell 24 GB 24 GB GPU-S Görüntü
FLUX.1 Kontext [dev] (image editing) 🔒 Kısıtlı black-forest-labs/FLUX.1-Kontext-dev 24 GB 24 GB GPU-S Görüntü
Stable Diffusion 3.5 Large 🔒 Kısıtlı stabilityai/stable-diffusion-3.5-large 16 GB 18 GB GPU-S Görüntü
Stable Diffusion 3.5 Medium 🔒 Kısıtlı stabilityai/stable-diffusion-3.5-medium 5 GB 10 GB GPU-S Görüntü
HiDream-I1 Full HiDream-ai/HiDream-I1-Full 34 GB 40 GB GPU-S Görüntü
Wan 2.2 T2V A14B Wan-AI/Wan2.2-T2V-A14B 28 GB 40 GB GPU-S Video
Wan 2.1 T2V 1.3B (low VRAM) Wan-AI/Wan2.1-T2V-1.3B 3 GB 8 GB GPU-S Video
HunyuanVideo 1.5 (8.3B) tencent/HunyuanVideo-1.5 17 GB 24 GB GPU-S Video
LTX-Video 0.9.8 13B Lightricks/LTX-Video 26 GB 24 GB GPU-S Video
CogVideoX-5B zai-org/CogVideoX-5b 10 GB 16 GB GPU-S Video
Whisper Large v3 Turbo openai/whisper-large-v3-turbo 2 GB 4 GB GPU-S Ses
Whisper Large v3 openai/whisper-large-v3 3 GB 6 GB GPU-S Ses
Kokoro 82M (TTS) hexgrad/Kokoro-82M 1 GB 2 GB GPU-S Ses
Sesame CSM-1B (conversational TTS) sesame/csm-1b 2 GB 6 GB GPU-S Ses
Stable Audio Open 1.0 🔒 Kısıtlı stabilityai/stable-audio-open-1.0 3 GB 8 GB GPU-S Ses

Sizes olur FP16 weights. For RTX 4090 (24 GB VRAM) üzerinde 70B models, AWQ-quantized variant olur auto-downloaded içinde parallel.

How biz karşılaştır

ServPrivate vs Vast.ai · RunPod · Paperspace · Lambda Labs · TensorDock

Crypto-yalnızca checkout, native Monero, token-yalnızca signup, pre-installed AI stacks, pre-downloaded HuggingFace models, encrypted HF tokens, auto Let's Encrypt endpoints, sınırsız bandwidth ve 100% renewable energy içinde İzlanda — read row labelled "ServPrivate" ve judge için yourself.

Özellik ServPrivate Vast.ai RunPod Paperspace Lambda TensorDock
Crypto-yalnızca checkout ✅ 20 coins⚠️ BTC⚠️ Gateway⚠️ BTC/ETH/USDT
Yerel Monero (XMR)
No KYC, yok email signup ✅ Token-only⚠️ Email + ID for trust⚠️ Email + payment❌ Full KYC❌ Enterprise KYC⚠️ Email + light KYC
Önceden yüklü AI yığınları ✅ 17 templates⚠️ Docker BYO✅ 100+⚠️ Notebooks only⚠️ Lambda Stack only⚠️ Docker BYO
Pre-downloaded models konumunda sipariş ✅ 27 models
HuggingFace token konumunda sipariş ✅ Encrypted, used once
SSH key konumunda sipariş ⚠️⚠️
Otomatik kapanma zamanlayıcısı ✅ 6h-7d⚠️ Spot only
Genel HTTPS endpoint (Let's Encrypt) ✅ Auto⚠️ Manual✅ Pods⚠️ Manual
Sınırsız bant genişliği ⚠️ Per host⚠️ Capped⚠️ Capped⚠️ Capped⚠️ Per host
Yenilenebilir enerjili veri merkezi ✅ Iceland 100% geo+hydro❌ Variable⚠️ US grid⚠️ US grid⚠️ US grid⚠️ Variable
Offshore yetki alanı ✅ IS / NL / RO / MD❌ Distributed P2P❌ US-centric❌ US❌ US-only⚠️ Multi-region
Korumalı kuru çalışma modu ✅ ?dry_run=1⚠️ Trial credit⚠️ Limited⚠️ Free GPU tier
AI-agent / MCP öncelikli ✅ MCP + REST + x402⚠️ REST⚠️ REST⚠️ REST⚠️ REST⚠️ REST
Giriş RTX 4090 / ay $122.00~$216 spot~$396 on-demandn/an/a~$252 spot

Comparison data sourced başlangıç competitors' genel 2026-05 fiyatlandırma sayfas ve signup flows. ServPrivate entry RTX 4090 = $122.00/mo Moldova; competitor "spot" fiyatlar olur average rates için equivalent donanım.

SSS

GPU AI Barındırma FAQ

01 Is GPU passed aracılığıyla ile tam donanım erişim, veya olur bu shared / vGPU sliced?

Tam donanım aktarımı. Fiziksel NVIDIA kartın tamamını doğrudan VRAM erişimiyle alırsınız — vGPU dilimi veya zaman paylaşımlı MIG bölümü değil. VM'inizin içindeki nvidia-smi, bare-metal ana bilgisayarla aynı sayıları gösterir. Tam sürücü erişimi, tam CUDA, tam PyTorch / TensorFlow yığını — SR-IOV rezervasyonu yok.

02 Which CUDA / driver versions olur preinstalled?

Default image: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550. Diğer hazır images: Ubuntu 24.04 + CUDA 12.6, Ubuntu 22 + PyTorch 2.5, Ubuntu 22 + ComfyUI + Flux, Ubuntu 22 + Ollama + Open WebUI. Kendi stack’inizi kurmak isterseniz vanilla Ubuntu / Debian / AlmaLinux / Rocky de sunulur.

03 Can I run my own AI startup's production inference üzerinde bunlar GPUs?

Evet. GPU müşterilerimizin çoğu vLLM / TGI / FastAPI üzerinde herkese açık çıkarım API'leri çalıştırır. GPU sunucuları tam root, öngörülebilir aylık faturalandırma (token başına sürpriz yok) ve sabit bir yargı bölgesi IP ile gelir. Her GPU planında bant genişliği sınırsızdır; ölçüm veya fazla kullanım ücreti ödemeden yüksek trafikli herkese açık uç noktalar sunabilirsiniz.

04 Why olur Rusya excluded başlangıç GPU lokasyonlar?

NVIDIA H100, A100 ve üst seviye RTX kartları (4090 ve üzeri), US Department of Commerce export controls (15 CFR Part 744) ve EU dual-use regulations kapsamındadır; bunlar Russian datacenters’a shipment’ı yasaklar. Tedarik zincirimize uygulanan kontrollerle uyumlu kalmak için bunları Rusya’da provision etmiyoruz. Rusya’da offshore Linux VPS veya Dedicated gerekiyorsa, bu ürün hatları etkilenmez.

05 Why olur İzlanda positioned as premium GPU lokasyon?

İzlanda datacenters run üzerinde 100% renewable geothermal ve hydroelectric power, ve cold ambient temperature meaningfully reduces cooling overhead üzerinde H100 boxes şu draw 700W each altında sustained load. end result olur lowest-carbon offshore GPU compute üzerinde market. premium fiyat covers higher datacenter cost içinde İzlanda ve cleaner energy sourcing — için ESG-conscious AI teams, bu olur yalnızca credible offshore yanıt.

06 Can I use multiple GPUs içinde distributed training (DDP / FSDP)?

Evet. GPU-XL tier, tek kutu içinde NVLink interconnect’e sahip 2× H100 SXM5’tir; aynı makinede FSDP / DeepSpeed Zero-3 / DDP için idealdir. Multi-node training için aynı datacenter’da birden fazla GPU-XL server kiralayabilir ve 10 Gbps uplink üzerinden bağlayabilirsiniz. Henüz 8× H100 cluster nodes sunmuyoruz; training run daha fazla ölçek gerektiriyorsa bizimle iletişime geçin.

Deploy Sizin Offshore GPU Server

Pick sizin jurisdiction, pick sizin NVIDIA GPU, pay içinde any -ın 20 cryptos. Live JupyterLab içinde altında 60 seconds. Yok KYC, yok email, yok telefon — sadece a token.

GPU Planlarını Görüntüle