JOY.VN: AI - Machine Learning

Benchmark Qwen3.5-35B-A3B-GPTQ-Int4 trên RTX Pro 6000 Blackwell

JOY — Sun, 29 Mar 2026 12:13:03 GMT

Bài được viết bởi Claude và edit bởi tui.

Phần cứng & Model

GPU: NVIDIA RTX Pro 6000 Blackwell - 96GB GDDR7
CPU: AMD Threadripper Pro 9965WX (24C/48T, Zen 5)
RAM: Micron 768GB ECC DDR5-5600
PCIe: Crucial T705 4TB PCIe Gen5

Thật ra máy mình không phải để benchmark — nó chạy …

Cách build Docker image cho vLLM hỗ trợ CUDA 12.8 và GPU RTX 5090 (SM120)

JOY — Fri, 16 May 2025 12:52:47 GMT

Ban đầu thì mình xài Ollama cho AI Inference kết hợp với Open WebUI. Em này cài là chạy, không phải suy nghĩ nhiều. Nhưng giờ do cần chạy dual RTX 5090 nên phải kiếm giải pháp thay thế. Hỏi em ChatGPT Lê Ky (tên mình đặt cho ẻm) thì em ấy gợi ý xài hàng top vLLM. Mình sẽ có bài so sánh 2 em này sau.

Ngặt nỗi vLLM chưa support chính thức cho dòng Blackwel…

Build Dual System Để Train AI, Làm Việc và Chơi Game - Phần 1: Chuẩn Bị

JOY — Sat, 15 Mar 2025 19:35:58 GMT

Gần đây thì mình và team mình có nghiên cứu và áp dụng một ít về AI.

Cấu hình bộ máy:

Main system for AI training & home server

CPU: Intel Core Ultra 9 285K
Main: ASRock Z890 Taichi AQUA
RAM: CORSAIR VENGEANCE RGB DDR5 RAM 192GB (4 x 48GB)
SSD:
- Crucial T705 Gen5 4TB
- Acer Pre…