CUDA 12
CUDA 12.4/12.6 + cuDNN पूर्व-स्थापित। boot करें, ssh से जोड़ें, nvidia-smi चलाएँ।
AI ट्रेनिंग, इनफरेंस, इमेज और वीडियो जनरेशन के लिए NVIDIA RTX 4090, RTX 5090 और H100 SXM5 GPU सर्वर। CUDA 12 और cuDNN पूर्व-इंस्टॉल, साथ ही PyTorch / ComfyUI / Ollama इमेज प्रीसेट SSH-तैयार। H100 स्तरों पर पूर्ण PCIe Gen 5 लेन काउंट के लिए Threadripper Pro होस्ट। 4 ऑफशोर न्यायक्षेत्रों में उपलब्ध, KYC नहीं, Monero सहित 20 कॉइन में केवल-क्रिप्टो भुगतान।
हर न्यायक्षेत्र में एक ही NVIDIA हार्डवेयर और हर प्लान पर असीमित बैंडविड्थ। मूल्य न्यायक्षेत्र के अनुसार भिन्न होता है — आइसलैंड सबसे कम-कार्बन विकल्प है, मोल्दोवा सबसे सस्ता।
| प्लान | GPU | VRAM | CPU | RAM | NVMe | बैंडविड्थ | कीमत | |
|---|---|---|---|---|---|---|---|---|
| IS-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | असीमित | $146.50/mo | ऑर्डर |
| IS-M लोकप्रिय | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | असीमित | $234.50/mo | ऑर्डर |
| IS-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | असीमित | $906.00/mo | ऑर्डर |
| IS-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | असीमित | $1714.50/mo | ऑर्डर |
| प्लान | GPU | VRAM | CPU | RAM | NVMe | बैंडविड्थ | कीमत | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | असीमित | $122.00/mo | ऑर्डर |
| MD-M लोकप्रिय | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | असीमित | $195.50/mo | ऑर्डर |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | असीमित | $832.50/mo | ऑर्डर |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | असीमित | $1567.50/mo | ऑर्डर |
| प्लान | GPU | VRAM | CPU | RAM | NVMe | बैंडविड्थ | कीमत | |
|---|---|---|---|---|---|---|---|---|
| RO-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | असीमित | $132.00/mo | ऑर्डर |
| RO-M लोकप्रिय | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | असीमित | $210.00/mo | ऑर्डर |
| RO-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | असीमित | $857.00/mo | ऑर्डर |
| RO-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | असीमित | $1616.50/mo | ऑर्डर |
| प्लान | GPU | VRAM | CPU | RAM | NVMe | बैंडविड्थ | कीमत | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | असीमित | $136.50/mo | ऑर्डर |
| NL-M लोकप्रिय | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | असीमित | $220.00/mo | ऑर्डर |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | असीमित | $881.50/mo | ऑर्डर |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | असीमित | $1665.50/mo | ऑर्डर |
GPU होस्टिंग लॉन्च पर 4 न्यायक्षेत्रों में उपलब्ध है (आइसलैंड, नीदरलैंड्स, रोमानिया, मोल्दोवा)। रूस को NVIDIA निर्यात प्रतिबंधों के कारण बाहर रखा गया है; स्विट्ज़रलैंड और पनामा अभी के लिए केवल-Linux रखे गए हैं।
CUDA 12.4/12.6 + cuDNN पूर्व-स्थापित। boot करें, ssh से जोड़ें, nvidia-smi चलाएँ।
From paid ऑर्डर to nvidia-smi output in के अंतर्गत 60 सेकंड.
Up to 4 TB NVMe SSD, paired with DDR5 RAM for तेज dataset I/O.
पूर्ण root SSH, साथ ही port 8888 पर token auth के साथ pre-bound JupyterLab।
H100 पर LoRA / QLoRA / full FT के साथ Llama, Mistral, Qwen, DeepSeek finetuning। या production model serving के लिए vLLM / TGI / Ollama के साथ self-होस्टेड inference।
ComfyUI या Forge के साथ Stable Diffusion, FLUX.1, SDXL। अपना खुद का LoRA train करें, बड़े पैमाने पर batch-generate करें, या एक inference endpoint self-host करें।
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Video generation needs serious VRAM — से शुरू होते हैं RTX 5090 (32 GB) or H100 (80 GB).
डिप्लॉय fine-tuned models behind your अपने API. Predictable costs, no per-token fees, no डेटा leaving your न्यायक्षेत्र. JupyterLab + FastAPI शामिल.
ऑर्डर के समय इनमें से कोई भी चुनें और आपका GPU सर्वर पहले से इंस्टॉल, कॉन्फ़िगर और systemd से शुरू किए गए स्टैक के साथ बूट होता है। HuggingFace के 30-60 मिनट के डाउनलोड को भी छोड़ने के लिए नीचे पूर्व-डाउनलोड मॉडल जोड़ें।
Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.
Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".
Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.
HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.
YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.
2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.
WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.
Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.
The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.
A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.
GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.
ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.
Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.
OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.
Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.
Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.
VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.
एक ही GPU पर multiple stacks combine करें — deploy script dependency conflicts resolve करती है और non-clashing ports assign करती है।
ऑर्डर समय पर जिन models की जरूरत है उन्हें tick करें; login से पहले वे /root/.कैश/huggingface में कैश हो जाएँगे। 🔒 Gated models (Llama, Mistral, Gemma, FLUX-dev, SD 3.5) के लिए आपका HuggingFace token चाहिए, जो ऑर्डर समय पर पूछा जाता है।
| मॉडल | HuggingFace | Size | न्यूनतम VRAM | न्यूनतम GPU tier | प्रकार |
|---|---|---|---|---|---|
| Llama 3.3 70B Instruct 🔒 प्रतिबंधित | meta-llama/Llama-3.3-70B-Instruct |
140 GB | 160 GB | GPU-L | LLM |
| Qwen3 32B | Qwen/Qwen3-32B |
64 GB | 80 GB | GPU-L | LLM |
| Qwen3 14B | Qwen/Qwen3-14B |
28 GB | 32 GB | GPU-S | LLM |
| Qwen3 8B | Qwen/Qwen3-8B |
16 GB | 20 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Qwen 32B | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B |
64 GB | 80 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Llama 70B | deepseek-ai/DeepSeek-R1-Distill-Llama-70B |
140 GB | 160 GB | GPU-S | LLM |
| Mistral Small 3.2 24B (multimodal) | mistralai/Mistral-Small-3.2-24B-Instruct-2506 |
48 GB | 60 GB | GPU-S | LLM |
| Gemma 3 27B (multimodal) 🔒 प्रतिबंधित | google/gemma-3-27b-it |
54 GB | 64 GB | GPU-L | LLM |
| Gemma 3 12B (multimodal) 🔒 प्रतिबंधित | google/gemma-3-12b-it |
24 GB | 28 GB | GPU-S | LLM |
| Phi-4 (14B) | microsoft/phi-4 |
28 GB | 32 GB | GPU-S | LLM |
| Phi-4 Mini Instruct (3.8B) | microsoft/Phi-4-mini-instruct |
8 GB | 10 GB | GPU-S | LLM |
| FLUX.1 [dev] 🔒 प्रतिबंधित | black-forest-labs/FLUX.1-dev |
24 GB | 24 GB | GPU-S | इमेज |
| FLUX.1 [schnell] | black-forest-labs/FLUX.1-schnell |
24 GB | 24 GB | GPU-S | इमेज |
| FLUX.1 Kontext [dev] (image editing) 🔒 प्रतिबंधित | black-forest-labs/FLUX.1-Kontext-dev |
24 GB | 24 GB | GPU-S | इमेज |
| Stable Diffusion 3.5 Large 🔒 प्रतिबंधित | stabilityai/stable-diffusion-3.5-large |
16 GB | 18 GB | GPU-S | इमेज |
| Stable Diffusion 3.5 Medium 🔒 प्रतिबंधित | stabilityai/stable-diffusion-3.5-medium |
5 GB | 10 GB | GPU-S | इमेज |
| HiDream-I1 Full | HiDream-ai/HiDream-I1-Full |
34 GB | 40 GB | GPU-S | इमेज |
| Wan 2.2 T2V A14B | Wan-AI/Wan2.2-T2V-A14B |
28 GB | 40 GB | GPU-S | वीडियो |
| Wan 2.1 T2V 1.3B (low VRAM) | Wan-AI/Wan2.1-T2V-1.3B |
3 GB | 8 GB | GPU-S | वीडियो |
| HunyuanVideo 1.5 (8.3B) | tencent/HunyuanVideo-1.5 |
17 GB | 24 GB | GPU-S | वीडियो |
| LTX-Video 0.9.8 13B | Lightricks/LTX-Video |
26 GB | 24 GB | GPU-S | वीडियो |
| CogVideoX-5B | zai-org/CogVideoX-5b |
10 GB | 16 GB | GPU-S | वीडियो |
| Whisper Large v3 Turbo | openai/whisper-large-v3-turbo |
2 GB | 4 GB | GPU-S | ऑडियो |
| Whisper Large v3 | openai/whisper-large-v3 |
3 GB | 6 GB | GPU-S | ऑडियो |
| Kokoro 82M (TTS) | hexgrad/Kokoro-82M |
1 GB | 2 GB | GPU-S | ऑडियो |
| Sesame CSM-1B (conversational TTS) | sesame/csm-1b |
2 GB | 6 GB | GPU-S | ऑडियो |
| Stable Audio Open 1.0 🔒 प्रतिबंधित | stabilityai/stable-audio-open-1.0 |
3 GB | 8 GB | GPU-S | ऑडियो |
आकार FP16 weights हैं। RTX 4090 (24 GB VRAM) पर 70B models के लिए AWQ-quantized variant समानांतर में ऑटो-डाउनलोड होता है।
Crypto-only checkout, native Monero, token-only साइनअप, pre-installed AI stacks, pre-downloaded HuggingFace models, encrypted HF tokens, auto Let's Encrypt endpoints, unlimited bandwidth और आइसलैंड में 100% renewable energy — "ServPrivate" लेबल वाली row पढ़ें और खुद judge करें।
| विशेषता | ServPrivate | Vast.ai | RunPod | Paperspace | Lambda | TensorDock |
|---|---|---|---|---|---|---|
| क्रिप्टो-केवल checkout | ✅ 20 coins | ⚠️ BTC | ⚠️ Gateway | ❌ | ❌ | ⚠️ BTC/ETH/USDT |
| नेटिव Monero (XMR) | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| KYC नहीं, ईमेल नहीं signup | ✅ Token-only | ⚠️ Email + ID for trust | ⚠️ Email + payment | ❌ Full KYC | ❌ Enterprise KYC | ⚠️ Email + light KYC |
| पूर्व-स्थापित AI stacks | ✅ 17 templates | ⚠️ Docker BYO | ✅ 100+ | ⚠️ Notebooks only | ⚠️ Lambda Stack only | ⚠️ Docker BYO |
| Pre-downloaded models at ऑर्डर | ✅ 27 models | ❌ | ❌ | ❌ | ❌ | ❌ |
| HuggingFace token at ऑर्डर | ✅ Encrypted, used once | ❌ | ❌ | ❌ | ❌ | ❌ |
| SSH key at ऑर्डर | ✅ | ✅ | ✅ | ⚠️ | ✅ | ⚠️ |
| ऑटो-शटडाउन टाइमर | ✅ 6h-7d | ✅ | ⚠️ Spot only | ❌ | ❌ | ❌ |
| Public HTTPS endpoint (Let's Encrypt) | ✅ Auto | ⚠️ Manual | ✅ Pods | ✅ | ❌ | ⚠️ Manual |
| असीमित बैंडविड्थ | ✅ | ⚠️ Per host | ⚠️ Capped | ⚠️ Capped | ⚠️ Capped | ⚠️ Per host |
| नवीकरणीय ऊर्जा डेटासेंटर | ✅ Iceland 100% geo+hydro | ❌ Variable | ⚠️ US grid | ⚠️ US grid | ⚠️ US grid | ⚠️ Variable |
| Offshore न्यायक्षेत्र | ✅ IS / NL / RO / MD | ❌ Distributed P2P | ❌ US-centric | ❌ US | ❌ US-only | ⚠️ Multi-region |
| Sandbox dry-run मोड | ✅ ?dry_run=1 | ⚠️ Trial credit | ⚠️ Limited | ⚠️ Free GPU tier | ❌ | ❌ |
| AI-agent / MCP प्रथम | ✅ MCP + REST + x402 | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST |
| एंट्री RTX 4090 / माह | $122.00 | ~$216 spot | ~$396 on-demand | n/a | n/a | ~$252 spot |
तुलना डेटा sourced from competitors' public 2026-05 कीमत pages and signup flows. ServPrivate entry RTX 4090 = $122.00/mo मोल्दोवा; competitor "spot" prices are average rates for equivalent hardware.
Full hardware passthrough। आपको पूरी physical NVIDIA card direct VRAM एक्सेस के साथ मिलती है; vGPU slice नहीं, समय-shared MIG partition नहीं। VM के अंदर nvidia-smi वही numbers दिखाता है जो bare-metal host पर हैं। Full driver एक्सेस, full CUDA, full PyTorch / TensorFlow stack — कोई SR-IOV reservation नहीं।
Default image: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550। Ready-to-go images में Ubuntu 24.04 + CUDA 12.6, Ubuntu 22 + PyTorch 2.5, Ubuntu 22 + ComfyUI + Flux, और Ubuntu 22 + Ollama + Open WebUI शामिल हैं। यदि आप अपनी stack खुद install करना चाहते हैं तो vanilla Ubuntu / Debian / AlmaLinux / Rocky भी उपलब्ध हैं। Reinstall डैशबोर्ड से किया जा सकता है।
हाँ। हमारे कई GPU ग्राहक vLLM / TGI / FastAPI के ऊपर public inference APIs चलाते हैं। GPU सर्वर full root, predictable monthly बिलिंग (per-token surprises नहीं) और fixed jurisdictional IP के साथ आते हैं। हर GPU प्लान पर बैंडविड्थ unlimited है, इसलिए आप meters या overage fees देखे बिना high-ट्रैफिक public endpoints serve कर सकते हैं।
NVIDIA H100, A100 और high-end RTX cards (4090 और ऊपर) US Department of Commerce export controls (15 CFR Part 744) और EU dual-use regulations के अधीन हैं, जो रूसी datacenters को shipment prohibit करते हैं। हमारी supply चेन पर लागू controls का पालन करने के लिए हम इन्हें रूस में provision नहीं करते। अगर आपको रूस में offshore Linux VPS या Dedicated चाहिए, तो वे product lines अप्रभावित हैं।
आइसलैंड datacenters 100% renewable भूतापीय और जलविद्युत पावर पर चलते हैं, और ठंडा ambient temperature sustained load पर 700W खींचने वाले H100 boxes की cooling overhead meaningfully कम करता है। नतीजा market का lowest-carbon offshore GPU compute है। प्रीमियम price आइसलैंड में higher datacenter cost और cleaner energy sourcing को cover करता है। ESG-conscious AI teams के लिए यह सबसे credible offshore answer है।
हाँ। GPU-XL tier एक box के अंदर NVLink interconnect के साथ 2× H100 SXM5 है, जो same machine पर FSDP, DeepSpeed शून्य-3 और DDP के लिए उपयुक्त है। multi-नोड training के लिए आप same datacenter में multiple GPU-XL सर्वर किराए पर लें करके उन्हें 10 Gbps अपलिंक पर connect कर सकते हैं। हम अभी 8× H100 cluster nodes ship नहीं करते; अगर आपके training run को अधिक scale चाहिए तो contact करें।
अपना न्यायक्षेत्र चुनें, NVIDIA GPU चुनें, 20 में से किसी भी क्रिप्टो में भुगतान करें। 60 सेकंड से कम में लाइव JupyterLab। KYC नहीं, ईमेल नहीं, फ़ोन नहीं — बस एक टोकन।
View GPU प्लान