CUDA 12
CUDA 12.4/12.6 + cuDNN terinstal sebelumnya. Boot, ssh masuk, jalankan nvidia-smi.
Server GPU NVIDIA RTX 4090, RTX 5090, dan H100 SXM5 untuk pelatihan AI, inferensi, serta pembuatan gambar dan video. CUDA 12 dan cuDNN sudah terinstal, ditambah preset image PyTorch / ComfyUI / Ollama yang siap di-SSH. Host Threadripper Pro pada tier H100 untuk jumlah lane PCIe Gen 5 penuh. Tersedia di 4 yurisdiksi offshore, tanpa KYC, pembayaran kripto-only dalam 20 koin termasuk Monero.
Perangkat keras NVIDIA yang sama di setiap yurisdiksi dengan bandwidth tak terbatas pada setiap paket. Harga bervariasi per yurisdiksi — Islandia adalah pilihan karbon terendah, Moldova yang termurah.
| Paket | GPU | VRAM | CPU | RAM | NVMe | Bandwidth | Harga | |
|---|---|---|---|---|---|---|---|---|
| IS-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Tanpa Batas | $146.50/mo | Pesanan |
| IS-M Populer | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Tanpa Batas | $234.50/mo | Pesanan |
| IS-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Tanpa Batas | $906.00/mo | Pesanan |
| IS-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Tanpa Batas | $1714.50/mo | Pesanan |
| Paket | GPU | VRAM | CPU | RAM | NVMe | Bandwidth | Harga | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Tanpa Batas | $122.00/mo | Pesanan |
| MD-M Populer | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Tanpa Batas | $195.50/mo | Pesanan |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Tanpa Batas | $832.50/mo | Pesanan |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Tanpa Batas | $1567.50/mo | Pesanan |
| Paket | GPU | VRAM | CPU | RAM | NVMe | Bandwidth | Harga | |
|---|---|---|---|---|---|---|---|---|
| RO-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Tanpa Batas | $132.00/mo | Pesanan |
| RO-M Populer | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Tanpa Batas | $210.00/mo | Pesanan |
| RO-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Tanpa Batas | $857.00/mo | Pesanan |
| RO-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Tanpa Batas | $1616.50/mo | Pesanan |
| Paket | GPU | VRAM | CPU | RAM | NVMe | Bandwidth | Harga | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Tanpa Batas | $136.50/mo | Pesanan |
| NL-M Populer | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Tanpa Batas | $220.00/mo | Pesanan |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Tanpa Batas | $881.50/mo | Pesanan |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Tanpa Batas | $1665.50/mo | Pesanan |
Hosting GPU tersedia di 4 yurisdiksi saat peluncuran (Islandia, Belanda, Rumania, Moldova). Rusia dikecualikan karena sanksi ekspor NVIDIA; Swiss dan Panama untuk saat ini hanya tersedia Linux.
CUDA 12.4/12.6 + cuDNN terinstal sebelumnya. Boot, ssh masuk, jalankan nvidia-smi.
Dari pesanan berbayar hingga output nvidia-smi dalam kurang dari 60 detik.
Hingga 4 TB NVMe SSD, dipasangkan dengan RAM DDR5 untuk I/O dataset cepat.
SSH root penuh, ditambah JupyterLab yang terikat sebelumnya pada port 8888 dengan autentikasi token.
Finetuning Llama, Mistral, Qwen, DeepSeek dengan LoRA / QLoRA / FT penuh pada H100. Atau inferensi self-hosted dengan vLLM / TGI / Ollama untuk penyajian model produksi.
Stable Diffusion, FLUX.1, SDXL dengan ComfyUI atau Forge. Latih LoRA Anda sendiri, buat dalam batch secara besar-besaran, atau self-host endpoint inferensi.
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Generasi video memerlukan VRAM serius — mulai dari RTX 5090 (32 GB) atau H100 (80 GB).
Deploy model yang sudah di-fine-tune di balik API Anda sendiri. Biaya yang dapat diprediksi, tanpa biaya per token, tidak ada data yang meninggalkan yurisdiksi Anda. JupyterLab + FastAPI sudah termasuk.
Centang salah satu saat order dan GPU server Anda boot dengan stack sudah installed, configured, dan started via systemd. Tambahkan pre-downloaded models di bawah untuk melewati download HuggingFace 30-60 menit.
Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.
Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".
Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.
HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.
YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.
2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.
WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.
Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.
The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.
A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.
GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.
ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.
Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.
OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.
Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.
Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.
VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.
Gabungkan beberapa stack di GPU yang sama — skrip deploy menyelesaikan konflik dependensi dan menetapkan port yang tidak berbenturan.
Centang model yang Anda butuhkan saat order; model tersebut akan di-cache di /root/.cache/huggingface sebelum Anda login. 🔒 Gated models (Llama, Mistral, Gemma, FLUX-dev, SD 3.5) membutuhkan token HuggingFace Anda, yang juga diminta saat order.
| Model | HuggingFace | Size | VRAM Min | Tier GPU Min | Jenis |
|---|---|---|---|---|---|
| Llama 3.3 70B Instruct 🔒 Dibatasi | meta-llama/Llama-3.3-70B-Instruct |
140 GB | 160 GB | GPU-L | LLM |
| Qwen3 32B | Qwen/Qwen3-32B |
64 GB | 80 GB | GPU-L | LLM |
| Qwen3 14B | Qwen/Qwen3-14B |
28 GB | 32 GB | GPU-S | LLM |
| Qwen3 8B | Qwen/Qwen3-8B |
16 GB | 20 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Qwen 32B | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B |
64 GB | 80 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Llama 70B | deepseek-ai/DeepSeek-R1-Distill-Llama-70B |
140 GB | 160 GB | GPU-S | LLM |
| Mistral Small 3.2 24B (multimodal) | mistralai/Mistral-Small-3.2-24B-Instruct-2506 |
48 GB | 60 GB | GPU-S | LLM |
| Gemma 3 27B (multimodal) 🔒 Dibatasi | google/gemma-3-27b-it |
54 GB | 64 GB | GPU-L | LLM |
| Gemma 3 12B (multimodal) 🔒 Dibatasi | google/gemma-3-12b-it |
24 GB | 28 GB | GPU-S | LLM |
| Phi-4 (14B) | microsoft/phi-4 |
28 GB | 32 GB | GPU-S | LLM |
| Phi-4 Mini Instruct (3.8B) | microsoft/Phi-4-mini-instruct |
8 GB | 10 GB | GPU-S | LLM |
| FLUX.1 [dev] 🔒 Dibatasi | black-forest-labs/FLUX.1-dev |
24 GB | 24 GB | GPU-S | Gambar |
| FLUX.1 [schnell] | black-forest-labs/FLUX.1-schnell |
24 GB | 24 GB | GPU-S | Gambar |
| FLUX.1 Kontext [dev] (image editing) 🔒 Dibatasi | black-forest-labs/FLUX.1-Kontext-dev |
24 GB | 24 GB | GPU-S | Gambar |
| Stable Diffusion 3.5 Large 🔒 Dibatasi | stabilityai/stable-diffusion-3.5-large |
16 GB | 18 GB | GPU-S | Gambar |
| Stable Diffusion 3.5 Medium 🔒 Dibatasi | stabilityai/stable-diffusion-3.5-medium |
5 GB | 10 GB | GPU-S | Gambar |
| HiDream-I1 Full | HiDream-ai/HiDream-I1-Full |
34 GB | 40 GB | GPU-S | Gambar |
| Wan 2.2 T2V A14B | Wan-AI/Wan2.2-T2V-A14B |
28 GB | 40 GB | GPU-S | Video |
| Wan 2.1 T2V 1.3B (low VRAM) | Wan-AI/Wan2.1-T2V-1.3B |
3 GB | 8 GB | GPU-S | Video |
| HunyuanVideo 1.5 (8.3B) | tencent/HunyuanVideo-1.5 |
17 GB | 24 GB | GPU-S | Video |
| LTX-Video 0.9.8 13B | Lightricks/LTX-Video |
26 GB | 24 GB | GPU-S | Video |
| CogVideoX-5B | zai-org/CogVideoX-5b |
10 GB | 16 GB | GPU-S | Video |
| Whisper Large v3 Turbo | openai/whisper-large-v3-turbo |
2 GB | 4 GB | GPU-S | Audio |
| Whisper Large v3 | openai/whisper-large-v3 |
3 GB | 6 GB | GPU-S | Audio |
| Kokoro 82M (TTS) | hexgrad/Kokoro-82M |
1 GB | 2 GB | GPU-S | Audio |
| Sesame CSM-1B (conversational TTS) | sesame/csm-1b |
2 GB | 6 GB | GPU-S | Audio |
| Stable Audio Open 1.0 🔒 Dibatasi | stabilityai/stable-audio-open-1.0 |
3 GB | 8 GB | GPU-S | Audio |
Ukuran adalah bobot FP16. Untuk RTX 4090 (24 GB VRAM) pada model 70B, varian AWQ-quantized diunduh secara paralel secara otomatis.
Kripto-only checkout, native Monero, token-only signup, pre-installed AI stacks, pre-downloaded HuggingFace models, encrypted HF tokens, auto Let’s Encrypt endpoints, unlimited bandwidth, dan 100% renewable energy di Islandia — baca baris “ServPrivate” dan nilai sendiri.
| Fitur | ServPrivate | Vast.ai | RunPod | Paperspace | Lambda | TensorDock |
|---|---|---|---|---|---|---|
| Kripto-only checkout | ✅ 20 coins | ⚠️ BTC | ⚠️ Gateway | ❌ | ❌ | ⚠️ BTC/ETH/USDT |
| Monero (XMR) Native | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| Tanpa KYC, no email signup | ✅ Token-only | ⚠️ Email + ID for trust | ⚠️ Email + payment | ❌ Full KYC | ❌ Enterprise KYC | ⚠️ Email + light KYC |
| Stack AI terinstal sebelumnya | ✅ 17 templates | ⚠️ Docker BYO | ✅ 100+ | ⚠️ Notebooks only | ⚠️ Lambda Stack only | ⚠️ Docker BYO |
| Model terunduh sebelumnya saat pemesanan | ✅ 27 models | ❌ | ❌ | ❌ | ❌ | ❌ |
| Token HuggingFace saat pemesanan | ✅ Encrypted, used once | ❌ | ❌ | ❌ | ❌ | ❌ |
| Kunci SSH saat pemesanan | ✅ | ✅ | ✅ | ⚠️ | ✅ | ⚠️ |
| Timer mati otomatis | ✅ 6h-7d | ✅ | ⚠️ Spot only | ❌ | ❌ | ❌ |
| Endpoint HTTPS publik (Let's Encrypt) | ✅ Auto | ⚠️ Manual | ✅ Pods | ✅ | ❌ | ⚠️ Manual |
| Bandwidth tanpa batas | ✅ | ⚠️ Per host | ⚠️ Capped | ⚠️ Capped | ⚠️ Capped | ⚠️ Per host |
| Pusat data energi terbarukan | ✅ Iceland 100% geo+hydro | ❌ Variable | ⚠️ US grid | ⚠️ US grid | ⚠️ US grid | ⚠️ Variable |
| Offshore yurisdiksi | ✅ IS / NL / RO / MD | ❌ Distributed P2P | ❌ US-centric | ❌ US | ❌ US-only | ⚠️ Multi-region |
| Mode dry-run sandbox | ✅ ?dry_run=1 | ⚠️ Trial credit | ⚠️ Limited | ⚠️ Free GPU tier | ❌ | ❌ |
| AI-agent / MCP pertama | ✅ MCP + REST + x402 | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST |
| RTX 4090 awal / bln | $122.00 | ~$216 spot | ~$396 on-demand | n/a | n/a | ~$252 spot |
Comparison data bersumber dari pricing pages dan signup flows publik kompetitor pada 2026-05. ServPrivate entry RTX 4090 = $122.00/mo Moldova; harga “spot” kompetitor adalah rata-rata untuk hardware setara.
Full hardware passthrough. Anda mendapat seluruh kartu NVIDIA fisik dengan direct VRAM access; bukan vGPU slice, bukan time-shared MIG partition. nvidia-smi di dalam VM menampilkan angka yang sama seperti bare-metal host. Full driver access, full CUDA, full PyTorch / TensorFlow stack — tanpa reservasi SR-IOV.
Image default: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + driver NVIDIA 550. Image siap pakai lain: Ubuntu 24.04 + CUDA 12.6, Ubuntu 22 + PyTorch 2.5, Ubuntu 22 + ComfyUI + Flux, serta Ubuntu 22 + Ollama + Open WebUI. Vanilla Ubuntu / Debian / AlmaLinux / Rocky juga tersedia jika Anda ingin memasang stack sendiri. Reinstall dapat dilakukan dari dashboard.
Ya. Banyak pelanggan GPU kami menjalankan public inference APIs di atas vLLM / TGI / FastAPI. GPU servers hadir dengan full root, tagihan bulanan yang predictable tanpa kejutan per-token, dan IP yurisdiksi tetap. Bandwidth unlimited di setiap GPU plan, sehingga Anda dapat melayani high-traffic public endpoints tanpa memantau meter atau membayar overage fees.
NVIDIA H100, A100, dan kartu RTX high-end (4090 ke atas) tunduk pada export controls US Department of Commerce (15 CFR Part 744) dan regulasi dual-use EU yang melarang pengiriman ke datacenter Rusia. Kami tidak mem-provision GPU tersebut di Rusia agar tetap patuh pada kontrol yang berlaku bagi supply chain kami. Jika Anda membutuhkan offshore Linux VPS atau Dedicated di Rusia, lini produk itu tidak terpengaruh.
Datacenter Islandia berjalan dengan 100% energi geothermal dan hydroelectric terbarukan, dan suhu lingkungan yang dingin secara nyata mengurangi overhead cooling pada box H100 yang menarik 700W masing-masing di bawah load berkelanjutan. Hasilnya adalah GPU compute offshore dengan karbon terendah di pasar. Harga premium mencakup biaya datacenter yang lebih tinggi di Islandia dan sumber energi yang lebih bersih. Untuk tim AI yang peduli ESG, ini adalah jawaban offshore paling kredibel.
Ya. Tier GPU-XL adalah 2× H100 SXM5 dengan interconnect NVLink di dalam satu box, ideal untuk FSDP, DeepSpeed Zero-3, dan DDP pada mesin yang sama. Untuk training multi-node, Anda dapat menyewa beberapa server GPU-XL di datacenter yang sama dan menghubungkannya melalui uplink 10 Gbps. Kami belum menyediakan node cluster 8× H100; hubungi kami jika training run Anda membutuhkan skala lebih besar.
Pilih yurisdiksi, pilih GPU NVIDIA, bayar dengan salah satu dari 20 kripto. JupyterLab live dalam kurang dari 60 detik. Tanpa KYC, tanpa email, tanpa telepon; hanya token.
Lihat Paket GPU