Fine-tuning و inference مدل زبانی بزرگ
Fine-tuning مدلهای Llama، Mistral، Qwen، DeepSeek با LoRA / QLoRA / full FT روی H100. یا inference self-hosted با vLLM / TGI / Ollama برای سرویسدهی مدل در محیط تولید.
سرورهای GPU آفشور NVIDIA در مولداوی از $122.00 در ماه. کارتهای RTX 4090، RTX 5090 و H100 SXM5 با pass-through کامل روی KVM و دسترسی root کامل. CUDA 12 + cuDNN از پیش نصب شده، پیشتنظیمهای تصویری PyTorch / ComfyUI / Ollama آماده اتصال SSH. پرداخت فقط با ارز دیجیتال، بدون KYC، بدون ایمیل — فقط یک توکن حساب کاربری.
مولداوی ردیف بودجه GPU در شبکه ماست. همان سختافزار NVIDIA، اما هزینه برق پایینتر و چارچوب نظارتی حداقلی به ما اجازه میدهد پلنهای GPU را 10-15% زیر رومانی و 15-25% زیر ایسلند قیمتگذاری کنیم. از این حوزه قضایی استفاده کنید وقتی هزینه per-token اهمیت بیشتری نسبت به peering یا موضع بازاریابی دارد.
تمام پلنها شامل CUDA 12 + cuDNN از پیش نصب شده، NVMe SSD، DDR5 RAM، دسترسی root کامل، SSH + JupyterLab و پهنای باند نامحدود هستند.
| پلن | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $122.00/mo | سفارش |
| MD-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $195.50/mo | سفارش |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $832.50/mo | سفارش |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1567.50/mo | سفارش |
سرورهای GPU در کارهایی که با VRAM و tensor core مقیاس مییابند عالی عمل میکنند — fine-tuning و inference مدلهای زبانی بزرگ، تولید تصویر با diffusion، تولید ویدیو با هوش مصنوعی، و سرویسدهی مدل با توان عملیاتی بالا.
Fine-tuning مدلهای Llama، Mistral، Qwen، DeepSeek با LoRA / QLoRA / full FT روی H100. یا inference self-hosted با vLLM / TGI / Ollama برای سرویسدهی مدل در محیط تولید.
Stable Diffusion، FLUX.1، SDXL با ComfyUI یا Forge. LoRA اختصاصی خود را آموزش دهید، در مقیاس بزرگ تولید دستهای انجام دهید، یا یک endpoint inference self-hosted داشته باشید.
OpenSora، CogVideoX، Wan-2.1، AnimateDiff. تولید ویدیو به VRAM جدی نیاز دارد — از RTX 5090 (32 GB) یا H100 (80 GB) شروع کنید.
مدلهای fine-tuned شده را پشت API اختصاصی خود deploy کنید. هزینههای قابل پیشبینی، بدون هزینه per-token، بدون خروج داده از حوزه قضایی شما. JupyterLab + FastAPI در پکیج.
RTX 4090 (24 GB)، RTX 5090 (32 GB)، H100 SXM5 (80 GB)، 2× H100 (160 GB).
تا 4 TB NVMe SSD، همراه با DDR5 RAM برای I/O سریع مجموعه داده.
از سفارش پرداختشده تا خروجی nvidia-smi در کمتر از 60 ثانیه.
SSH با دسترسی root کامل، بهعلاوه JupyterLab از پیش پیکربندیشده روی پورت 8888 با احراز هویت توکن.
بله. هرچند کمتر از ایسلند یا سوئیس شناخته شده است، مولداوی با پیرینگ اروپایی زیرساخت محکمی ارائه میدهد. محیط نظارتی سبک و هزینههای پایین آن را به یک گزینه ارزش بالا برای میزبانی آفشور تبدیل میکند.
پلنهای VPS مولداوی ما از $7.50/mo برای 2 vCPU، 4GB DDR4 RAM، 60GB NVMe و پهنای باند نامحدود شروع میشوند. این مقرونبهصرفهترین گزینه در شبکه ماست.
مولداوی همکاری قضایی بسیار محدودی با کشورهای غربی دارد. هیچ توافق الزامآور اشتراکگذاری دادهای با آمریکا یا اکثر اعضای EU وجود ندارد که بر ارائهدهندگان میزبانی تأثیر بگذارد.
با BTC، XMR، ETH، USDT یا 10 زنجیره دیگر پرداخت کنید. SSH + JupyterLab روی یک GPU واقعی NVIDIA در مولداوی در کمتر از 60 ثانیه.