خانه / GPU AI Hosting

RTX 4090 · RTX 5090 · H100 SXM5 · CUDA 12

میزبانی ناشناس GPU AI آفشور، بدون KYC

Name: Offshore GPU AI Hosting
Brand: ServPrivate
Availability: InStock

سرورهای GPU NVIDIA RTX 4090، RTX 5090 و H100 SXM5 برای آموزش هوش مصنوعی، استنتاج، تولید تصویر و ویدیو. CUDA 12 و cuDNN از پیش نصب‌شده، به‌علاوه پیش‌تنظیمات ایمیج PyTorch / ComfyUI / Ollama آماده برای اتصال SSH. هاست‌های Threadripper Pro در تیرهای H100 برای پهنای باند کامل PCIe Gen 5. موجود در 4 حوزه قضایی آفشور، بدون KYC، پرداخت کریپتو-only با 8 ارز شامل Monero.

مشاهده پلن‌های GPU سرورهای اختصاصی GPU بدون KYC میزبانی هوش مصنوعی بدون سانسور

هر سرور GPU شامل می‌شود

سخت‌افزار NVIDIA، passthrough کامل
CUDA 12 + cuDNN از پیش نصب‌شده
هاست‌های Threadripper / Ryzen 9
NVMe SSD & DDR5
راه‌اندازی در 60 ثانیه
پذیرش 8 ارز دیجیتال شامل Monero

بدون KYC

فقط ارز دیجیتال

CUDA 12

IP های تمیز

دسترسی کامل Root

Monero accepted

تمام پلن‌های GPU

پلن‌های GPU بر اساس موقعیت

سخت‌افزار یکسان NVIDIA در تمام حوزه‌های قضایی با پهنای باند نامحدود در هر پلن. قیمت‌گذاری بر اساس حوزه متفاوت است — ایسلند کم‌کربن‌ترین گزینه و مولداوی ارزان‌ترین است.

ایسلند پناهگاه آزادی بیان

پلن	GPU	VRAM	CPU	RAM	NVMe	پهنای باند	قیمت
IS-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	نامحدود	$146.50/mo	سفارش
IS-M محبوب	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	نامحدود	$234.50/mo	سفارش
IS-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	نامحدود	$906.00/mo	سفارش
IS-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	نامحدود	$1714.50/mo	سفارش

مولداوی آفشور اقتصادی

پلن	GPU	VRAM	CPU	RAM	NVMe	پهنای باند	قیمت
MD-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	نامحدود	$122.00/mo	سفارش
MD-M محبوب	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	نامحدود	$195.50/mo	سفارش
MD-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	نامحدود	$832.50/mo	سفارش
MD-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	نامحدود	$1567.50/mo	سفارش

رومانی ضد نگهداری داده

پلن	GPU	VRAM	CPU	RAM	NVMe	پهنای باند	قیمت
RO-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	نامحدود	$132.00/mo	سفارش
RO-M محبوب	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	نامحدود	$210.00/mo	سفارش
RO-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	نامحدود	$857.00/mo	سفارش
RO-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	نامحدود	$1616.50/mo	سفارش

هلند بهترین پیرینگ

پلن	GPU	VRAM	CPU	RAM	NVMe	پهنای باند	قیمت
NL-S	1× NVIDIA RTX 4090	24 GB GDDR6X	12 vCPU	64 GB DDR5	1 TB NVMe	نامحدود	$136.50/mo	سفارش
NL-M محبوب	1× NVIDIA RTX 5090	32 GB GDDR7	16 vCPU	96 GB DDR5	1.5 TB NVMe	نامحدود	$220.00/mo	سفارش
NL-L	1× NVIDIA H100 SXM5	80 GB HBM3	24 vCPU	192 GB DDR5	2 TB NVMe	نامحدود	$881.50/mo	سفارش
NL-XL	2× NVIDIA H100 SXM5	160 GB HBM3	32 vCPU	384 GB DDR5	4 TB NVMe	نامحدود	$1665.50/mo	سفارش

میزبانی GPU در 4 حوزه قضایی در زمان راه‌اندازی موجود است (ایسلند، هلند، رومانی، مولداوی). روسیه به‌دلیل تحریم‌های صادراتی NVIDIA حذف شده؛ سوئیس و پاناما فعلاً فقط Linux نگه داشته شده‌اند.

موجود در هر سرور GPU

CUDA 12

CUDA 12.4/12.6 + cuDNN از پیش نصب شده. بوت کنید، SSH بزنید، nvidia-smi اجرا کنید.

راه‌اندازی در 60 ثانیه

از سفارش پرداخت‌شده تا خروجی nvidia-smi در کمتر از 60 ثانیه.

NVMe SSD

تا 4 TB NVMe SSD، همراه با DDR5 RAM برای I/O سریع مجموعه داده.

SSH + Jupyter

SSH با دسترسی root کامل، به‌علاوه JupyterLab از پیش پیکربندی‌شده روی پورت 8888 با احراز هویت توکن.

موارد استفاده

What GPU AI Hosting is Used For

Fine-tuning و inference مدل زبانی بزرگ

Fine-tuning مدل‌های Llama، Mistral، Qwen، DeepSeek با LoRA / QLoRA / full FT روی H100. یا inference self-hosted با vLLM / TGI / Ollama برای سرویس‌دهی مدل در محیط تولید.

تولید تصویر

Stable Diffusion، FLUX.1، SDXL با ComfyUI یا Forge. LoRA اختصاصی خود را آموزش دهید، در مقیاس بزرگ تولید دسته‌ای انجام دهید، یا یک endpoint inference self-hosted داشته باشید.

تولید ویدیو با هوش مصنوعی

OpenSora، CogVideoX، Wan-2.1، AnimateDiff. تولید ویدیو به VRAM جدی نیاز دارد — از RTX 5090 (32 GB) یا H100 (80 GB) شروع کنید.

Inference در محیط تولید

مدل‌های fine-tuned شده را پشت API اختصاصی خود deploy کنید. هزینه‌های قابل پیش‌بینی، بدون هزینه per-token، بدون خروج داده از حوزه قضایی شما. JupyterLab + FastAPI در پکیج.

استقرار با یک کلیک

قالب‌های AI از پیش نصب شده

گزینه‌های مورد نظر را هنگام سفارش انتخاب کنید و سرور GPU شما با stack از پیش نصب، پیکربندی و راه‌اندازی شده از طریق systemd بوت می‌شود. مدل‌های از پیش دانلود شده را در ادامه فعال کنید تا 30 تا 60 دقیقه دانلود از HuggingFace را نیز رد کنید.

استنتاج LLM

vLLM (OpenAI-compatible)

Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.

LLMOpenAI APIproduction 16 GB+

استنتاج LLM

Ollama + Open WebUI

Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".

LLMchat UIbeginner 8 GB+

استنتاج LLM

text-generation-webui (Oobabooga)

Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.

LLMmulti-backendpower user 16 GB+

استنتاج LLM

HuggingFace TGI

HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.

LLMproductionHuggingFace 24 GB+

فاین‌تیونینگ

Axolotl (LLM finetuning)

YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.

finetuneLoRAQLoRA 24 GB+

فاین‌تیونینگ

Unsloth (2× faster finetune)

2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.

finetunefastlow VRAM 16 GB+

فاین‌تیونینگ

LLaMA-Factory

WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.

finetuneGUI 24 GB+

تولید تصویر

ComfyUI + FLUX.1

Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.

imageFLUXworkflow 24 GB+

تولید تصویر

Automatic1111 + SD 3.5

The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.

imageSD 3.5 16 GB+

تولید تصویر

Forge (faster A1111)

A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.

imageFLUXfast 16 GB+

تولید تصویر

Kohya SS (LoRA training)

GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.

LoRA trainingimageGUI 16 GB+

ویدیوی AI

ComfyUI + Wan 2.2 / HunyuanVideo

ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.

videoWan 2.2HunyuanVideo 40 GB+

ویدیوی AI

ComfyUI Video Lite (CogVideoX / LTX)

Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.

videoCogVideoXlow VRAM 16 GB+

صدا

Whisper Large v3 Turbo server

OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.

audiospeech-to-textAPI 6 GB+

صدا

TTS server (Kokoro + CSM-1B)

Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.

audiotext-to-speechAPI 6 GB+

Notebook و توسعه

JupyterLab + PyTorch baseline

Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.

notebookbaselinealways-on 0 GB+

Notebook و توسعه

code-server (VSCode in browser)

VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.

IDEVSCodedev 0 GB+

چندین stack را روی یک GPU ترکیب کنید — اسکریپت deploy تعارضات وابستگی را حل می‌کند و پورت‌های غیر متعارض اختصاص می‌دهد.

رد کردن دانلود

مدل‌های open-weight از پیش دانلود شده

مدل‌های مورد نیاز را هنگام سفارش انتخاب کنید تا قبل از ورود شما در /root/.cache/huggingface کش شوند. 🔒 مدل‌های Gated (Llama، Mistral، Gemma، FLUX-dev، SD 3.5) به HuggingFace token شما نیاز دارند (که هنگام سفارش درخواست می‌شود).

مدل	HuggingFace	اندازه	حداقل VRAM	حداقل سطح GPU	نوع
Llama 3.3 70B Instruct 🔒 دسترسی محدود	`meta-llama/Llama-3.3-70B-Instruct`	140 GB	160 GB	GPU-L	LLM
Qwen3 32B	`Qwen/Qwen3-32B`	64 GB	80 GB	GPU-L	LLM
Qwen3 14B	`Qwen/Qwen3-14B`	28 GB	32 GB	GPU-S	LLM
Qwen3 8B	`Qwen/Qwen3-8B`	16 GB	20 GB	GPU-S	LLM
DeepSeek-R1 Distill Qwen 32B	`deepseek-ai/DeepSeek-R1-Distill-Qwen-32B`	64 GB	80 GB	GPU-S	LLM
DeepSeek-R1 Distill Llama 70B	`deepseek-ai/DeepSeek-R1-Distill-Llama-70B`	140 GB	160 GB	GPU-S	LLM
Mistral Small 3.2 24B (multimodal)	`mistralai/Mistral-Small-3.2-24B-Instruct-2506`	48 GB	60 GB	GPU-S	LLM
Gemma 3 27B (multimodal) 🔒 دسترسی محدود	`google/gemma-3-27b-it`	54 GB	64 GB	GPU-L	LLM
Gemma 3 12B (multimodal) 🔒 دسترسی محدود	`google/gemma-3-12b-it`	24 GB	28 GB	GPU-S	LLM
Phi-4 (14B)	`microsoft/phi-4`	28 GB	32 GB	GPU-S	LLM
Phi-4 Mini Instruct (3.8B)	`microsoft/Phi-4-mini-instruct`	8 GB	10 GB	GPU-S	LLM
FLUX.1 [dev] 🔒 دسترسی محدود	`black-forest-labs/FLUX.1-dev`	24 GB	24 GB	GPU-S	تصویر
FLUX.1 [schnell]	`black-forest-labs/FLUX.1-schnell`	24 GB	24 GB	GPU-S	تصویر
FLUX.1 Kontext [dev] (image editing) 🔒 دسترسی محدود	`black-forest-labs/FLUX.1-Kontext-dev`	24 GB	24 GB	GPU-S	تصویر
Stable Diffusion 3.5 Large 🔒 دسترسی محدود	`stabilityai/stable-diffusion-3.5-large`	16 GB	18 GB	GPU-S	تصویر
Stable Diffusion 3.5 Medium 🔒 دسترسی محدود	`stabilityai/stable-diffusion-3.5-medium`	5 GB	10 GB	GPU-S	تصویر
HiDream-I1 Full	`HiDream-ai/HiDream-I1-Full`	34 GB	40 GB	GPU-S	تصویر
Wan 2.2 T2V A14B	`Wan-AI/Wan2.2-T2V-A14B`	28 GB	40 GB	GPU-S	ویدیو
Wan 2.1 T2V 1.3B (low VRAM)	`Wan-AI/Wan2.1-T2V-1.3B`	3 GB	8 GB	GPU-S	ویدیو
HunyuanVideo 1.5 (8.3B)	`tencent/HunyuanVideo-1.5`	17 GB	24 GB	GPU-S	ویدیو
LTX-Video 0.9.8 13B	`Lightricks/LTX-Video`	26 GB	24 GB	GPU-S	ویدیو
CogVideoX-5B	`zai-org/CogVideoX-5b`	10 GB	16 GB	GPU-S	ویدیو
Whisper Large v3 Turbo	`openai/whisper-large-v3-turbo`	2 GB	4 GB	GPU-S	صدا
Whisper Large v3	`openai/whisper-large-v3`	3 GB	6 GB	GPU-S	صدا
Kokoro 82M (TTS)	`hexgrad/Kokoro-82M`	1 GB	2 GB	GPU-S	صدا
Sesame CSM-1B (conversational TTS)	`sesame/csm-1b`	2 GB	6 GB	GPU-S	صدا
Stable Audio Open 1.0 🔒 دسترسی محدود	`stabilityai/stable-audio-open-1.0`	3 GB	8 GB	GPU-S	صدا

اندازه‌ها وزن‌های FP16 هستند. برای RTX 4090 (24 GB VRAM) با مدل‌های 70B، نسخه AWQ-quantised به صورت خودکار و موازی دانلود می‌شود.

مقایسه ما

ServPrivate vs Vast.ai · RunPod · Paperspace · Lambda Labs · TensorDock

پرداخت فقط کریپتو، Monero بومی، ثبت‌نام فقط با توکن، stack های AI از پیش نصب شده، مدل‌های HuggingFace از پیش دانلود شده، توکن‌های HF رمزنگاری‌شده، endpoint های Let's Encrypt خودکار، پهنای باند نامحدود، و 100% انرژی تجدیدپذیر در ایسلند — ردیف ServPrivate را بخوانید و خودتان قضاوت کنید.

ویژگی	ServPrivate	Vast.ai	RunPod	Paperspace	Lambda	TensorDock
پرداخت فقط با ارز دیجیتال	✅ 8 coins	⚠️ BTC	⚠️ Gateway	❌	❌	⚠️ BTC/ETH/USDT
Monero (XMR) بومی	✅	❌	❌	❌	❌	❌
بدون KYC، بدون ثبت‌نام با ایمیل	✅ Token-only	⚠️ Email + ID for trust	⚠️ Email + payment	❌ Full KYC	❌ Enterprise KYC	⚠️ Email + light KYC
استک‌های AI از پیش نصب‌شده	✅ 17 templates	⚠️ Docker BYO	✅ 100+	⚠️ Notebooks only	⚠️ Lambda Stack only	⚠️ Docker BYO
مدل‌های از پیش دانلودشده هنگام سفارش	✅ 27 models	❌	❌	❌	❌	❌
توکن HuggingFace هنگام سفارش	✅ Encrypted, used once	❌	❌	❌	❌	❌
کلید SSH هنگام سفارش	✅	✅	✅	⚠️	✅	⚠️
تایمر خاموش‌شدن خودکار	✅ 6h-7d	✅	⚠️ Spot only	❌	❌	❌
اندپوینت عمومی HTTPS (Let's Encrypt)	✅ Auto	⚠️ Manual	✅ Pods	✅	❌	⚠️ Manual
پهنای باند نامحدود	✅	⚠️ Per host	⚠️ Capped	⚠️ Capped	⚠️ Capped	⚠️ Per host
دیتاسنتر با انرژی تجدیدپذیر	✅ Iceland 100% geo+hydro	❌ Variable	⚠️ US grid	⚠️ US grid	⚠️ US grid	⚠️ Variable
حوزه قضایی آفشور	✅ IS / NL / RO / MD	❌ Distributed P2P	❌ US-centric	❌ US	❌ US-only	⚠️ Multi-region
حالت اجرای آزمایشی Sandbox	✅ ?dry_run=1	⚠️ Trial credit	⚠️ Limited	⚠️ Free GPU tier	❌	❌
اولویت AI-agent / MCP	✅ MCP + REST + x402	⚠️ REST	⚠️ REST	⚠️ REST	⚠️ REST	⚠️ REST
ورودی RTX 4090 / ماه	$122.00	~$216 spot	~$396 on-demand	n/a	n/a	~$252 spot

داده‌های مقایسه از صفحات قیمت‌گذاری عمومی و فرآیند ثبت‌نام رقبا تا 2026-05 گرفته شده است. RTX 4090 ورودی ServPrivate = $249/mo مولداوی؛ قیمت‌های «spot» رقبا میانگین سخت‌افزار معادل هستند.

سؤالات متداول

سؤالات متداول میزبانی GPU برای هوش مصنوعی

01 آیا GPU با دسترسی کامل سخت‌افزاری pass-through می‌شود یا به‌صورت shared / vGPU sliced است؟

Pass-through سخت‌افزاری کامل. کارت فیزیکی NVIDIA به‌طور کامل با دسترسی مستقیم به VRAM در اختیار شماست — نه یک برش vGPU، نه یک پارتیشن MIG زمان‌بندی‌شده. nvidia-smi داخل VM شما همان اعداد host bare-metal را نشان می‌دهد. دسترسی کامل به درایور، CUDA کامل، stack کامل PyTorch / TensorFlow — بدون رزروهای SR-IOV.

02 کدام نسخه‌های CUDA / درایور از پیش نصب هستند؟

ایمیج پیش‌فرض: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550. ایمیج‌های آماده دیگر: Ubuntu 24.04 + CUDA 12.6، Ubuntu 22 + PyTorch 2.5، Ubuntu 22 + ComfyUI + Flux، Ubuntu 22 + Ollama + Open WebUI. Ubuntu / Debian / AlmaLinux / Rocky ساده هم ارائه می‌شود اگر می‌خواهید stack خود را نصب کنید. می‌توانید در هر زمان به‌عنوان root کامل نسخه درایور را تغییر دهید.

03 آیا می‌توانم inference تولید استارتاپ هوش مصنوعی خودم را روی این GPU‌ها اجرا کنم؟

بله. بسیاری از مشتریان GPU ما API‌های inference عمومی را بر روی vLLM / TGI / FastAPI اجرا می‌کنند. سرورهای GPU با دسترسی root کامل، صورت‌حساب ماهانه قابل پیش‌بینی (بدون غافلگیری per-token) و یک IP ثابت jurisdictional ارائه می‌شوند. پهنای باند در تمام پلن‌های GPU نامحدود است، بنابراین می‌توانید endpoint‌های عمومی پر-ترافیک را بدون نگرانی از متر یا هزینه‌های اضافه سرویس دهید.

04 چرا روسیه از موقعیت‌های GPU حذف شده است؟

NVIDIA H100، A100 و کارت‌های RTX سطح بالا (4090 و بالاتر) تحت کنترل‌های صادراتی وزارت بازرگانی آمریکا (15 CFR Part 744) و مقررات dual-use اتحادیه اروپا هستند که ارسال به مراکز داده روسی را ممنوع می‌کنند. ما آن‌ها را در روسیه تأمین نمی‌کنیم تا با کنترل‌هایی که برای زنجیره تأمین ما اعمال می‌شوند سازگار بمانیم. اگر به VPS لینوکسی آفشور یا Dedicated در روسیه نیاز دارید، آن خطوط محصول تحت تأثیر نیستند.

05 چرا ایسلند به‌عنوان موقعیت پریمیوم GPU معرفی می‌شود؟

مراکز داده ایسلند با 100% انرژی تجدیدپذیر زمین‌گرمایی و برق‌آبی کار می‌کنند، و دمای محیطی سرد به‌طور معناداری سربار خنک‌کاری روی باکس‌های H100 که تحت بار پایدار هر کدام 700 وات مصرف می‌کنند را کاهش می‌دهد. نتیجه نهایی کم‌کربن‌ترین پردازش GPU آفشور در بازار است. قیمت پریمیوم هزینه بالاتر مرکز داده در ایسلند و تأمین انرژی پاک‌تر را پوشش می‌دهد — برای تیم‌های هوش مصنوعی با رویکرد ESG، این تنها پاسخ معتبر آفشور است.

06 آیا می‌توانم از چندین GPU در آموزش توزیع‌شده (DDP / FSDP) استفاده کنم؟

بله — ردیف GPU-XL شامل 2× H100 SXM5 با NVLink interconnect در یک باکس است، ایده‌آل برای FSDP / DeepSpeed Zero-3 / DDP روی همان ماشین. برای آموزش multi-node می‌توانید چندین سرور GPU-XL را در همان مرکز داده اجاره کنید و آن‌ها را از طریق uplink 10 Gbps متصل کنید. ما هنوز node‌های cluster 8× H100 ارائه نمی‌دهیم — اگر training run شما به مقیاس بیشتری نیاز دارد با ما تماس بگیرید.

سرور GPU آفشور خود را راه‌اندازی کنید

حوزه قضایی خود را انتخاب کنید، GPU NVIDIA موردنظرتان را برگزینید، با هر یک از 8 ارز دیجیتال پرداخت کنید. JupyterLab زنده در کمتر از 60 ثانیه. بدون KYC، بدون ایمیل، بدون شماره تلفن — فقط یک توکن.

مشاهده پلن‌های GPU