CUDA 12
CUDA 12.4/12.6 + cuDNN cài sẵn. Khởi động, SSH vào, chạy nvidia-smi.
Máy chủ GPU NVIDIA RTX 4090, RTX 5090 và H100 SXM5 cho huấn luyện AI, inference, tạo ảnh và video. CUDA 12 và cuDNN được cài sẵn cùng các preset image PyTorch / ComfyUI / Ollama sẵn sàng ssh vào dùng ngay. Host Threadripper Pro ở các gói H100 để có đầy đủ lane PCIe Gen 5. Có mặt tại 4 khu vực pháp lý offshore, no KYC, thanh toán chỉ bằng crypto với 20 loại coin bao gồm Monero.
Cùng phần cứng NVIDIA trên mọi khu vực pháp lý với băng thông không giới hạn cho mọi gói. Giá thay đổi theo khu vực — Iceland là lựa chọn carbon thấp nhất, Moldova là rẻ nhất.
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| IS-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $146.50/mo | Đặt mua |
| IS-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $234.50/mo | Đặt mua |
| IS-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $906.00/mo | Đặt mua |
| IS-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1714.50/mo | Đặt mua |
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $122.00/mo | Đặt mua |
| MD-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $195.50/mo | Đặt mua |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $832.50/mo | Đặt mua |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1567.50/mo | Đặt mua |
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| RO-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $132.00/mo | Đặt mua |
| RO-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $210.00/mo | Đặt mua |
| RO-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $857.00/mo | Đặt mua |
| RO-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1616.50/mo | Đặt mua |
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $136.50/mo | Đặt mua |
| NL-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $220.00/mo | Đặt mua |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $881.50/mo | Đặt mua |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1665.50/mo | Đặt mua |
GPU hosting có mặt tại 4 khu vực pháp lý khi ra mắt (Iceland, Netherlands, Romania, Moldova). Russia bị loại trừ do lệnh trừng phạt xuất khẩu NVIDIA; Switzerland và Panama chỉ cung cấp Linux tạm thời.
CUDA 12.4/12.6 + cuDNN cài sẵn. Khởi động, SSH vào, chạy nvidia-smi.
Từ lúc đặt mua đến khi có output nvidia-smi trong vòng dưới 60 giây.
Lên đến 4 TB NVMe SSD, kết hợp DDR5 RAM để I/O dataset nhanh chóng.
Full root SSH, cộng với JupyterLab gắn sẵn trên cổng 8888 với xác thực token.
Finetune Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Stable Diffusion, FLUX.1, SDXL với ComfyUI hoặc Forge. Huấn luyện LoRA của riêng bạn, tạo ảnh hàng loạt, hoặc tự host một inference endpoint.
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Tạo video cần VRAM nghiêm túc — bắt đầu từ RTX 5090 (32 GB) hoặc H100 (80 GB).
Triển khai mô hình đã finetune sau API của riêng bạn. Chi phí dự đoán được, không có phí per-token, không có dữ liệu rời khỏi khu vực pháp lý của bạn. JupyterLab + FastAPI có sẵn.
Chọn các tùy chọn bạn muốn khi đặt hàng và máy chủ GPU của bạn sẽ khởi động với stack đã được cài đặt, cấu hình và khởi chạy qua systemd. Bật tùy chọn tải sẵn mô hình bên dưới để cũng bỏ qua 30–60 phút tải HuggingFace.
Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.
Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".
Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.
HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.
YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.
2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.
WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.
Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.
The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.
A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.
GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.
ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.
Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.
OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.
Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.
Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.
VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.
Kết hợp nhiều stack trên cùng một GPU — script triển khai tự giải quyết xung đột dependency và phân bổ các cổng không trùng lặp.
Chọn các mô hình bạn cần khi đặt hàng và chúng sẽ được cache vào /root/.cache/huggingface trước khi bạn đăng nhập. 🔒 Các mô hình có kiểm soát (Llama, Mistral, Gemma, FLUX-dev, SD 3.5) yêu cầu HuggingFace token của bạn (cũng được yêu cầu khi đặt hàng).
| Mô hình | HuggingFace | Kích thước | VRAM tối thiểu | Tầng GPU tối thiểu | Loại |
|---|---|---|---|---|---|
| Llama 3.3 70B Instruct 🔒 Có kiểm soát | meta-llama/Llama-3.3-70B-Instruct |
140 GB | 160 GB | GPU-L | LLM |
| Qwen3 32B | Qwen/Qwen3-32B |
64 GB | 80 GB | GPU-L | LLM |
| Qwen3 14B | Qwen/Qwen3-14B |
28 GB | 32 GB | GPU-S | LLM |
| Qwen3 8B | Qwen/Qwen3-8B |
16 GB | 20 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Qwen 32B | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B |
64 GB | 80 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Llama 70B | deepseek-ai/DeepSeek-R1-Distill-Llama-70B |
140 GB | 160 GB | GPU-S | LLM |
| Mistral Small 3.2 24B (multimodal) | mistralai/Mistral-Small-3.2-24B-Instruct-2506 |
48 GB | 60 GB | GPU-S | LLM |
| Gemma 3 27B (multimodal) 🔒 Có kiểm soát | google/gemma-3-27b-it |
54 GB | 64 GB | GPU-L | LLM |
| Gemma 3 12B (multimodal) 🔒 Có kiểm soát | google/gemma-3-12b-it |
24 GB | 28 GB | GPU-S | LLM |
| Phi-4 (14B) | microsoft/phi-4 |
28 GB | 32 GB | GPU-S | LLM |
| Phi-4 Mini Instruct (3.8B) | microsoft/Phi-4-mini-instruct |
8 GB | 10 GB | GPU-S | LLM |
| FLUX.1 [dev] 🔒 Có kiểm soát | black-forest-labs/FLUX.1-dev |
24 GB | 24 GB | GPU-S | Hình ảnh |
| FLUX.1 [schnell] | black-forest-labs/FLUX.1-schnell |
24 GB | 24 GB | GPU-S | Hình ảnh |
| FLUX.1 Kontext [dev] (image editing) 🔒 Có kiểm soát | black-forest-labs/FLUX.1-Kontext-dev |
24 GB | 24 GB | GPU-S | Hình ảnh |
| Stable Diffusion 3.5 Large 🔒 Có kiểm soát | stabilityai/stable-diffusion-3.5-large |
16 GB | 18 GB | GPU-S | Hình ảnh |
| Stable Diffusion 3.5 Medium 🔒 Có kiểm soát | stabilityai/stable-diffusion-3.5-medium |
5 GB | 10 GB | GPU-S | Hình ảnh |
| HiDream-I1 Full | HiDream-ai/HiDream-I1-Full |
34 GB | 40 GB | GPU-S | Hình ảnh |
| Wan 2.2 T2V A14B | Wan-AI/Wan2.2-T2V-A14B |
28 GB | 40 GB | GPU-S | Video |
| Wan 2.1 T2V 1.3B (low VRAM) | Wan-AI/Wan2.1-T2V-1.3B |
3 GB | 8 GB | GPU-S | Video |
| HunyuanVideo 1.5 (8.3B) | tencent/HunyuanVideo-1.5 |
17 GB | 24 GB | GPU-S | Video |
| LTX-Video 0.9.8 13B | Lightricks/LTX-Video |
26 GB | 24 GB | GPU-S | Video |
| CogVideoX-5B | zai-org/CogVideoX-5b |
10 GB | 16 GB | GPU-S | Video |
| Whisper Large v3 Turbo | openai/whisper-large-v3-turbo |
2 GB | 4 GB | GPU-S | Âm thanh |
| Whisper Large v3 | openai/whisper-large-v3 |
3 GB | 6 GB | GPU-S | Âm thanh |
| Kokoro 82M (TTS) | hexgrad/Kokoro-82M |
1 GB | 2 GB | GPU-S | Âm thanh |
| Sesame CSM-1B (conversational TTS) | sesame/csm-1b |
2 GB | 6 GB | GPU-S | Âm thanh |
| Stable Audio Open 1.0 🔒 Có kiểm soát | stabilityai/stable-audio-open-1.0 |
3 GB | 8 GB | GPU-S | Âm thanh |
Kích thước là trọng số FP16. Với RTX 4090 (24 GB VRAM) và các mô hình 70B, biến thể được lượng tử hóa AWQ sẽ tự động được tải xuống song song.
Thanh toán chỉ bằng crypto, Monero gốc, đăng ký chỉ bằng token, AI stack được cài sẵn, mô hình HuggingFace được tải sẵn, HF token được mã hóa, endpoint Let's Encrypt tự động, băng thông không giới hạn, và 100% năng lượng tái tạo tại Iceland — hãy đọc hàng ServPrivate và tự đánh giá.
| Tính năng | ServPrivate | Vast.ai | RunPod | Paperspace | Lambda | TensorDock |
|---|---|---|---|---|---|---|
| Thanh toán chỉ bằng crypto | ✅ 20 coins | ⚠️ BTC | ⚠️ Gateway | ❌ | ❌ | ⚠️ BTC/ETH/USDT |
| Monero (XMR) gốc | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| Không KYC, không cần email đăng ký | ✅ Token-only | ⚠️ Email + ID for trust | ⚠️ Email + payment | ❌ Full KYC | ❌ Enterprise KYC | ⚠️ Email + light KYC |
| Bộ AI được cài sẵn | ✅ 17 templates | ⚠️ Docker BYO | ✅ 100+ | ⚠️ Notebooks only | ⚠️ Lambda Stack only | ⚠️ Docker BYO |
| Model được tải sẵn khi đặt hàng | ✅ 27 models | ❌ | ❌ | ❌ | ❌ | ❌ |
| HuggingFace token khi đặt hàng | ✅ Encrypted, used once | ❌ | ❌ | ❌ | ❌ | ❌ |
| SSH key khi đặt hàng | ✅ | ✅ | ✅ | ⚠️ | ✅ | ⚠️ |
| Hẹn giờ tắt máy tự động | ✅ 6h-7d | ✅ | ⚠️ Spot only | ❌ | ❌ | ❌ |
| Endpoint HTTPS công khai (Let's Encrypt) | ✅ Auto | ⚠️ Manual | ✅ Pods | ✅ | ❌ | ⚠️ Manual |
| Băng thông không giới hạn | ✅ | ⚠️ Per host | ⚠️ Capped | ⚠️ Capped | ⚠️ Capped | ⚠️ Per host |
| Trung tâm dữ liệu năng lượng tái tạo | ✅ Iceland 100% geo+hydro | ❌ Variable | ⚠️ US grid | ⚠️ US grid | ⚠️ US grid | ⚠️ Variable |
| Khu vực pháp lý offshore | ✅ IS / NL / RO / MD | ❌ Distributed P2P | ❌ US-centric | ❌ US | ❌ US-only | ⚠️ Multi-region |
| Chế độ chạy thử sandbox | ✅ ?dry_run=1 | ⚠️ Trial credit | ⚠️ Limited | ⚠️ Free GPU tier | ❌ | ❌ |
| Ưu tiên AI-agent / MCP | ✅ MCP + REST + x402 | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST |
| RTX 4090 cơ bản / tháng | $122.00 | ~$216 spot | ~$396 on-demand | n/a | n/a | ~$252 spot |
Dữ liệu so sánh được lấy từ các trang giá công khai và quy trình đăng ký của đối thủ tính đến 2026-05. ServPrivate RTX 4090 khởi điểm = $249/tháng tại Moldova; giá "spot" của đối thủ là mức trung bình cho phần cứng tương đương.
Passthrough phần cứng đầy đủ. Bạn có toàn bộ card NVIDIA vật lý với quyền truy cập VRAM trực tiếp — không phải vGPU slice, không phải MIG partition chia sẻ thời gian. nvidia-smi bên trong VM của bạn hiển thị cùng con số với host bare-metal. Full driver access, full CUDA, full stack PyTorch / TensorFlow — không có SR-IOV reservation.
Image mặc định: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550. Các image sẵn dùng khác: Ubuntu 24.04 + CUDA 12.6, Ubuntu 22 + PyTorch 2.5, Ubuntu 22 + ComfyUI + Flux, Ubuntu 22 + Ollama + Open WebUI. Vanilla Ubuntu / Debian / AlmaLinux / Rocky cũng có nếu bạn muốn tự cài stack. Bạn có thể chuyển đổi phiên bản driver bất kỳ lúc nào với full root.
Được. Nhiều khách hàng GPU của chúng tôi chạy API inference công khai trên vLLM / TGI / FastAPI. Các máy chủ GPU đi kèm full root, thanh toán hàng tháng dự đoán được (không có bất ngờ per-token) và IP khu vực pháp lý cố định. Băng thông không giới hạn trên mọi gói GPU, vì vậy bạn có thể phục vụ các endpoint công khai lưu lượng cao mà không cần theo dõi đồng hồ hay trả phí vượt mức.
NVIDIA H100, A100 và các card RTX cao cấp (4090 trở lên) chịu sự kiểm soát xuất khẩu của Bộ Thương mại Mỹ (15 CFR Part 744) và các quy định dual-use của EU cấm vận chuyển đến các datacenter ở Russia. Chúng tôi không cung cấp chúng tại Russia để tuân thủ các kiểm soát áp dụng cho chuỗi cung ứng của mình. Nếu bạn cần Linux VPS offshore hoặc Dedicated tại Russia, các dòng sản phẩm đó không bị ảnh hưởng.
Các datacenter Iceland chạy 100% bằng năng lượng tái tạo từ địa nhiệt và thủy điện, và nhiệt độ môi trường lạnh giúp giảm đáng kể chi phí làm mát cho các hộp H100 tiêu thụ 700W mỗi hộp khi chạy tải liên tục. Kết quả cuối cùng là GPU compute offshore có lượng carbon thấp nhất trên thị trường. Giá cao cấp phản ánh chi phí datacenter cao hơn tại Iceland và nguồn năng lượng sạch hơn — đối với các đội AI có ý thức về ESG, đây là câu trả lời offshore đáng tin cậy duy nhất.
Được — gói GPU-XL là 2× H100 SXM5 với NVLink interconnect trong một hộp, lý tưởng cho FSDP / DeepSpeed Zero-3 / DDP trên cùng một máy. Để huấn luyện multi-node bạn có thể thuê nhiều máy chủ GPU-XL trong cùng datacenter và kết nối qua uplink 10 Gbps. Chúng tôi hiện chưa cung cấp các node cluster 8× H100 — liên hệ chúng tôi nếu lần chạy huấn luyện của bạn cần quy mô lớn hơn.
Chọn khu vực pháp lý, chọn GPU NVIDIA, thanh toán bằng bất kỳ trong số 20 loại crypto. JupyterLab trực tiếp trong vòng dưới 60 giây. Không KYC, không email, không số điện thoại — chỉ cần một token.
Xem các gói GPU