CUDA 12
CUDA 12.4/12.6 + cuDNN از پیش نصب شده. بوت کنید، SSH بزنید، nvidia-smi اجرا کنید.
سرورهای GPU NVIDIA RTX 4090، RTX 5090 و H100 SXM5 برای آموزش هوش مصنوعی، استنتاج، تولید تصویر و ویدیو. CUDA 12 و cuDNN از پیش نصبشده، بهعلاوه پیشتنظیمات ایمیج PyTorch / ComfyUI / Ollama آماده برای اتصال SSH. هاستهای Threadripper Pro در تیرهای H100 برای پهنای باند کامل PCIe Gen 5. موجود در 4 حوزه قضایی آفشور، بدون KYC، پرداخت کریپتو-only با 20 ارز شامل Monero.
سختافزار یکسان NVIDIA در تمام حوزههای قضایی با پهنای باند نامحدود در هر پلن. قیمتگذاری بر اساس حوزه متفاوت است — ایسلند کمکربنترین گزینه و مولداوی ارزانترین است.
| پلن | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| IS-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $146.50/mo | سفارش |
| IS-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $234.50/mo | سفارش |
| IS-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $906.00/mo | سفارش |
| IS-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1714.50/mo | سفارش |
| پلن | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $122.00/mo | سفارش |
| MD-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $195.50/mo | سفارش |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $832.50/mo | سفارش |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1567.50/mo | سفارش |
| پلن | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| RO-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $132.00/mo | سفارش |
| RO-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $210.00/mo | سفارش |
| RO-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $857.00/mo | سفارش |
| RO-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1616.50/mo | سفارش |
| پلن | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $136.50/mo | سفارش |
| NL-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $220.00/mo | سفارش |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $881.50/mo | سفارش |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1665.50/mo | سفارش |
میزبانی GPU در 4 حوزه قضایی در زمان راهاندازی موجود است (ایسلند، هلند، رومانی، مولداوی). روسیه بهدلیل تحریمهای صادراتی NVIDIA حذف شده؛ سوئیس و پاناما فعلاً فقط Linux نگه داشته شدهاند.
CUDA 12.4/12.6 + cuDNN از پیش نصب شده. بوت کنید، SSH بزنید، nvidia-smi اجرا کنید.
از سفارش پرداختشده تا خروجی nvidia-smi در کمتر از 60 ثانیه.
تا 4 TB NVMe SSD، همراه با DDR5 RAM برای I/O سریع مجموعه داده.
SSH با دسترسی root کامل، بهعلاوه JupyterLab از پیش پیکربندیشده روی پورت 8888 با احراز هویت توکن.
Fine-tuning مدلهای Llama، Mistral، Qwen، DeepSeek با LoRA / QLoRA / full FT روی H100. یا inference self-hosted با vLLM / TGI / Ollama برای سرویسدهی مدل در محیط تولید.
Stable Diffusion، FLUX.1، SDXL با ComfyUI یا Forge. LoRA اختصاصی خود را آموزش دهید، در مقیاس بزرگ تولید دستهای انجام دهید، یا یک endpoint inference self-hosted داشته باشید.
OpenSora، CogVideoX، Wan-2.1، AnimateDiff. تولید ویدیو به VRAM جدی نیاز دارد — از RTX 5090 (32 GB) یا H100 (80 GB) شروع کنید.
مدلهای fine-tuned شده را پشت API اختصاصی خود deploy کنید. هزینههای قابل پیشبینی، بدون هزینه per-token، بدون خروج داده از حوزه قضایی شما. JupyterLab + FastAPI در پکیج.
گزینههای مورد نظر را هنگام سفارش انتخاب کنید و سرور GPU شما با stack از پیش نصب، پیکربندی و راهاندازی شده از طریق systemd بوت میشود. مدلهای از پیش دانلود شده را در ادامه فعال کنید تا 30 تا 60 دقیقه دانلود از HuggingFace را نیز رد کنید.
Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.
Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".
Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.
HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.
YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.
2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.
WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.
Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.
The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.
A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.
GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.
ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.
Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.
OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.
Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.
Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.
VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.
چندین stack را روی یک GPU ترکیب کنید — اسکریپت deploy تعارضات وابستگی را حل میکند و پورتهای غیر متعارض اختصاص میدهد.
مدلهای مورد نیاز را هنگام سفارش انتخاب کنید تا قبل از ورود شما در /root/.cache/huggingface کش شوند. 🔒 مدلهای Gated (Llama، Mistral، Gemma، FLUX-dev، SD 3.5) به HuggingFace token شما نیاز دارند (که هنگام سفارش درخواست میشود).
| مدل | HuggingFace | اندازه | حداقل VRAM | حداقل سطح GPU | نوع |
|---|---|---|---|---|---|
| Llama 3.3 70B Instruct 🔒 دسترسی محدود | meta-llama/Llama-3.3-70B-Instruct |
140 GB | 160 GB | GPU-L | LLM |
| Qwen3 32B | Qwen/Qwen3-32B |
64 GB | 80 GB | GPU-L | LLM |
| Qwen3 14B | Qwen/Qwen3-14B |
28 GB | 32 GB | GPU-S | LLM |
| Qwen3 8B | Qwen/Qwen3-8B |
16 GB | 20 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Qwen 32B | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B |
64 GB | 80 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Llama 70B | deepseek-ai/DeepSeek-R1-Distill-Llama-70B |
140 GB | 160 GB | GPU-S | LLM |
| Mistral Small 3.2 24B (multimodal) | mistralai/Mistral-Small-3.2-24B-Instruct-2506 |
48 GB | 60 GB | GPU-S | LLM |
| Gemma 3 27B (multimodal) 🔒 دسترسی محدود | google/gemma-3-27b-it |
54 GB | 64 GB | GPU-L | LLM |
| Gemma 3 12B (multimodal) 🔒 دسترسی محدود | google/gemma-3-12b-it |
24 GB | 28 GB | GPU-S | LLM |
| Phi-4 (14B) | microsoft/phi-4 |
28 GB | 32 GB | GPU-S | LLM |
| Phi-4 Mini Instruct (3.8B) | microsoft/Phi-4-mini-instruct |
8 GB | 10 GB | GPU-S | LLM |
| FLUX.1 [dev] 🔒 دسترسی محدود | black-forest-labs/FLUX.1-dev |
24 GB | 24 GB | GPU-S | تصویر |
| FLUX.1 [schnell] | black-forest-labs/FLUX.1-schnell |
24 GB | 24 GB | GPU-S | تصویر |
| FLUX.1 Kontext [dev] (image editing) 🔒 دسترسی محدود | black-forest-labs/FLUX.1-Kontext-dev |
24 GB | 24 GB | GPU-S | تصویر |
| Stable Diffusion 3.5 Large 🔒 دسترسی محدود | stabilityai/stable-diffusion-3.5-large |
16 GB | 18 GB | GPU-S | تصویر |
| Stable Diffusion 3.5 Medium 🔒 دسترسی محدود | stabilityai/stable-diffusion-3.5-medium |
5 GB | 10 GB | GPU-S | تصویر |
| HiDream-I1 Full | HiDream-ai/HiDream-I1-Full |
34 GB | 40 GB | GPU-S | تصویر |
| Wan 2.2 T2V A14B | Wan-AI/Wan2.2-T2V-A14B |
28 GB | 40 GB | GPU-S | ویدیو |
| Wan 2.1 T2V 1.3B (low VRAM) | Wan-AI/Wan2.1-T2V-1.3B |
3 GB | 8 GB | GPU-S | ویدیو |
| HunyuanVideo 1.5 (8.3B) | tencent/HunyuanVideo-1.5 |
17 GB | 24 GB | GPU-S | ویدیو |
| LTX-Video 0.9.8 13B | Lightricks/LTX-Video |
26 GB | 24 GB | GPU-S | ویدیو |
| CogVideoX-5B | zai-org/CogVideoX-5b |
10 GB | 16 GB | GPU-S | ویدیو |
| Whisper Large v3 Turbo | openai/whisper-large-v3-turbo |
2 GB | 4 GB | GPU-S | صدا |
| Whisper Large v3 | openai/whisper-large-v3 |
3 GB | 6 GB | GPU-S | صدا |
| Kokoro 82M (TTS) | hexgrad/Kokoro-82M |
1 GB | 2 GB | GPU-S | صدا |
| Sesame CSM-1B (conversational TTS) | sesame/csm-1b |
2 GB | 6 GB | GPU-S | صدا |
| Stable Audio Open 1.0 🔒 دسترسی محدود | stabilityai/stable-audio-open-1.0 |
3 GB | 8 GB | GPU-S | صدا |
اندازهها وزنهای FP16 هستند. برای RTX 4090 (24 GB VRAM) با مدلهای 70B، نسخه AWQ-quantised به صورت خودکار و موازی دانلود میشود.
پرداخت فقط کریپتو، Monero بومی، ثبتنام فقط با توکن، stack های AI از پیش نصب شده، مدلهای HuggingFace از پیش دانلود شده، توکنهای HF رمزنگاریشده، endpoint های Let's Encrypt خودکار، پهنای باند نامحدود، و 100% انرژی تجدیدپذیر در ایسلند — ردیف ServPrivate را بخوانید و خودتان قضاوت کنید.
| ویژگی | ServPrivate | Vast.ai | RunPod | Paperspace | Lambda | TensorDock |
|---|---|---|---|---|---|---|
| پرداخت فقط با ارز دیجیتال | ✅ 20 coins | ⚠️ BTC | ⚠️ Gateway | ❌ | ❌ | ⚠️ BTC/ETH/USDT |
| Monero (XMR) بومی | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| بدون KYC، بدون ثبتنام با ایمیل | ✅ Token-only | ⚠️ Email + ID for trust | ⚠️ Email + payment | ❌ Full KYC | ❌ Enterprise KYC | ⚠️ Email + light KYC |
| استکهای AI از پیش نصبشده | ✅ 17 templates | ⚠️ Docker BYO | ✅ 100+ | ⚠️ Notebooks only | ⚠️ Lambda Stack only | ⚠️ Docker BYO |
| مدلهای از پیش دانلودشده هنگام سفارش | ✅ 27 models | ❌ | ❌ | ❌ | ❌ | ❌ |
| توکن HuggingFace هنگام سفارش | ✅ Encrypted, used once | ❌ | ❌ | ❌ | ❌ | ❌ |
| کلید SSH هنگام سفارش | ✅ | ✅ | ✅ | ⚠️ | ✅ | ⚠️ |
| تایمر خاموششدن خودکار | ✅ 6h-7d | ✅ | ⚠️ Spot only | ❌ | ❌ | ❌ |
| اندپوینت عمومی HTTPS (Let's Encrypt) | ✅ Auto | ⚠️ Manual | ✅ Pods | ✅ | ❌ | ⚠️ Manual |
| پهنای باند نامحدود | ✅ | ⚠️ Per host | ⚠️ Capped | ⚠️ Capped | ⚠️ Capped | ⚠️ Per host |
| دیتاسنتر با انرژی تجدیدپذیر | ✅ Iceland 100% geo+hydro | ❌ Variable | ⚠️ US grid | ⚠️ US grid | ⚠️ US grid | ⚠️ Variable |
| حوزه قضایی آفشور | ✅ IS / NL / RO / MD | ❌ Distributed P2P | ❌ US-centric | ❌ US | ❌ US-only | ⚠️ Multi-region |
| حالت اجرای آزمایشی Sandbox | ✅ ?dry_run=1 | ⚠️ Trial credit | ⚠️ Limited | ⚠️ Free GPU tier | ❌ | ❌ |
| اولویت AI-agent / MCP | ✅ MCP + REST + x402 | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST |
| ورودی RTX 4090 / ماه | $122.00 | ~$216 spot | ~$396 on-demand | n/a | n/a | ~$252 spot |
دادههای مقایسه از صفحات قیمتگذاری عمومی و فرآیند ثبتنام رقبا تا 2026-05 گرفته شده است. RTX 4090 ورودی ServPrivate = $249/mo مولداوی؛ قیمتهای «spot» رقبا میانگین سختافزار معادل هستند.
Pass-through سختافزاری کامل. کارت فیزیکی NVIDIA بهطور کامل با دسترسی مستقیم به VRAM در اختیار شماست — نه یک برش vGPU، نه یک پارتیشن MIG زمانبندیشده. nvidia-smi داخل VM شما همان اعداد host bare-metal را نشان میدهد. دسترسی کامل به درایور، CUDA کامل، stack کامل PyTorch / TensorFlow — بدون رزروهای SR-IOV.
ایمیج پیشفرض: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550. ایمیجهای آماده دیگر: Ubuntu 24.04 + CUDA 12.6، Ubuntu 22 + PyTorch 2.5، Ubuntu 22 + ComfyUI + Flux، Ubuntu 22 + Ollama + Open WebUI. Ubuntu / Debian / AlmaLinux / Rocky ساده هم ارائه میشود اگر میخواهید stack خود را نصب کنید. میتوانید در هر زمان بهعنوان root کامل نسخه درایور را تغییر دهید.
بله. بسیاری از مشتریان GPU ما APIهای inference عمومی را بر روی vLLM / TGI / FastAPI اجرا میکنند. سرورهای GPU با دسترسی root کامل، صورتحساب ماهانه قابل پیشبینی (بدون غافلگیری per-token) و یک IP ثابت jurisdictional ارائه میشوند. پهنای باند در تمام پلنهای GPU نامحدود است، بنابراین میتوانید endpointهای عمومی پر-ترافیک را بدون نگرانی از متر یا هزینههای اضافه سرویس دهید.
NVIDIA H100، A100 و کارتهای RTX سطح بالا (4090 و بالاتر) تحت کنترلهای صادراتی وزارت بازرگانی آمریکا (15 CFR Part 744) و مقررات dual-use اتحادیه اروپا هستند که ارسال به مراکز داده روسی را ممنوع میکنند. ما آنها را در روسیه تأمین نمیکنیم تا با کنترلهایی که برای زنجیره تأمین ما اعمال میشوند سازگار بمانیم. اگر به VPS لینوکسی آفشور یا Dedicated در روسیه نیاز دارید، آن خطوط محصول تحت تأثیر نیستند.
مراکز داده ایسلند با 100% انرژی تجدیدپذیر زمینگرمایی و برقآبی کار میکنند، و دمای محیطی سرد بهطور معناداری سربار خنککاری روی باکسهای H100 که تحت بار پایدار هر کدام 700 وات مصرف میکنند را کاهش میدهد. نتیجه نهایی کمکربنترین پردازش GPU آفشور در بازار است. قیمت پریمیوم هزینه بالاتر مرکز داده در ایسلند و تأمین انرژی پاکتر را پوشش میدهد — برای تیمهای هوش مصنوعی با رویکرد ESG، این تنها پاسخ معتبر آفشور است.
بله — ردیف GPU-XL شامل 2× H100 SXM5 با NVLink interconnect در یک باکس است، ایدهآل برای FSDP / DeepSpeed Zero-3 / DDP روی همان ماشین. برای آموزش multi-node میتوانید چندین سرور GPU-XL را در همان مرکز داده اجاره کنید و آنها را از طریق uplink 10 Gbps متصل کنید. ما هنوز nodeهای cluster 8× H100 ارائه نمیدهیم — اگر training run شما به مقیاس بیشتری نیاز دارد با ما تماس بگیرید.
حوزه قضایی خود را انتخاب کنید، GPU NVIDIA موردنظرتان را برگزینید، با هر یک از 20 ارز دیجیتال پرداخت کنید. JupyterLab زنده در کمتر از 60 ثانیه. بدون KYC، بدون ایمیل، بدون شماره تلفن — فقط یک توکن.
مشاهده پلنهای GPU