FPT Kubernetes Engine with GPU
Tất cả tài liệu FPT Integration
FPT Data Platform
FPT Security Platform
AI Infrastructure
FPT AI Factory Billing
Support
Multi Cloud FPT Database Engine
FPT Cloud Server
- Tagging
- SSO - Single sign-on
- Policy Management
- Global Search
- FPT Cloud Portal – Pay As You Go
- FPT Cloud Desktop
- FPT Autoscale
- Cloud Server
FPT DevSecOps Services
FPT Next-Gen Firewall FPT Cloud Backup & DR
FPT Monitoring
FPT Security
- IAM
- FPT Cloud WAPPLES
- FPT Cloud WAF
- FPT Cloud VA
- Fortigate - FPT NGFW
- DdoS Protection
- CheckPoint - FPT NGFW
FPT Container
- Managed - FPT Kubernetes Engine
- FPT Kubernetes Engine with GPU
- FPT Container Registry
- Dedicated - FPT Kubernetes Engine
FPT Network
FPT Storage
-
- Tổng quan dịch vụ GPU trên Kubernetes FPT Cloud
- Cài đặt và khởi tạo Cluster Kubernetes sử dụng GPU
- Thay đổi Worker Group sử dụng GPU
- Triển khai ứng dụng sử dụng GPU trên Kubernetes
- Hướng dẫn sử dụng GPU Telemetry
- Hướng dẫn sử dụng Autoscaler với GPU
- Hướng dẫn sử dụng các chế độ GPU sharing
- Tăng thêm Worker Group sử dụng GPU
- Hướng dẫn cài đặt GPU Driver trên Kubernetes
- Hướng dẫn cấu hình Auto Scale sử dụng GPU Custom Metric
- Hướng dẫn cấu hình Auto Scale sử dụng KEDA và Prometheus
FPT Kubernetes Engine with GPU
- FPT Cloud Portal
- FPT Kubernetes Engine with GPU
FPT Kubernetes Engine with GPU FPT Cloud cung cấp Kubernetes sử dụng GPU NVIDIA có các tính năng chính sau:
- Cấu hình GPU linh hoạt với nhiều loại GPU, bộ nhớ GPU tùy chọn, áp dụng theo từng Worker Group.
- Quản lý và cấp phát tài nguyên GPU trong Kubernetes tự động với NVIDIA Operator
- Trực quan hóa và giám sát GPU bằng NVIDIA DCGM.
- Tự động tăng/giảm Container/Node với Autoscaler khi ứng dụng yêu cầu sử dụng tài nguyên GPU tăng lên/giảm đi.
- Hỗ trợ GPU sharing với cơ chế Multi-Instance, giúp tối ưu hóa tài nguyên và chi phí sử dụng GPU.
FPT Cloud sử dụng NVIDIA GPU Operator cung cấp công cụ tự động quản lý tất cả các thành phần phần mềm cần thiết để sử dụng GPU trên Kubernetes. GPU Operator cho phép người dùng sử dụng tài nguyên GPU giống như sử dụng CPU trong cụm Kubernetes. Các thành phần của Operator bao gồm:
- NVIDIA Drivers (CUDA, MIG,…)
- NVIDIA Device Plugin
- NVIDIA Container Toolkit
- NVIDIA GPU Feature Discovery
- NVIDIA Data Center GPU Manager (Monitoring)
Trên region Hanoi và Saigon , FPT Cloud hiện tại đang hỗ trợ Kubernetes sử dụng GPU Nvidia A30 với các MIG profile sau:
| No. | GPU A30 Profile | Strategy | Number instance | Instance resource |
|---|---|---|---|---|
| 1 | all-1g.6gb | single | 4 | 1g.6gb |
| 2 | all-2g.12gb | single | 2 | 2g.12gb |
| 3 | all-balanced | mixed | 2 | 1g.6gb |
| 4 | 1 | 2g.12gb | ||
| 5 | none (no label) | none | 0 | 0 (Entire) |
| Trên region Hanoi 2 và Japan, FPT Cloud hiện tại đang hỗ trợ Kubernetes sử dụng GPU Nvidia H100 và GPU Nvidia H200 | ||||
| No. | GPU H100 SXM5 | Strategy | Number instance | Instance resource |
| --- | --- | --- | --- | --- |
| 1 | all-1g.10gb | single | 7 | 1g.10gb |
| 2 | all-1g.20gb | single | 4 | 1g.20gb |
| 3 | all-2g.20gb | single | 3 | 2g.20gb |
| 4 | all-3g.40gb | single | 2 | 3g.40gb |
| 5 | all-4g.40gb | single | 1 | 4g.40gb |
| 6 | all-7g.80gb | single | 1 | 7g.80gb |
| 7 | all-balanced | mixed | 2 | |
| 1 | ||||
| 1 | 1g.10gb | |||
| 2g.20gb | ||||
| 3g.40gb | ||||
| 8 | none (no label) | none | 0 | 0 (Entire) |
| No. | GPU H200 SXM5 | Strategy | Number instance | Instance resource |
| --- | --- | --- | --- | --- |
| 1 | all-1g.18gb | single | 7 | 1g.18gb |
| 2 | all-1g.35gb | single | 4 | 1g.35gb |
| 3 | all-2g.25gb | single | 3 | 2g.25gb |
| 4 | all-3g.71gb | single | 2 | 3g.71gb |
| 5 | all-4g.71gb | single | 1 | 4g.71gb |
| 6 | all-7g.141gb | single | 1 | 7g.141gb |
| 7 | all-balanced | mixed | 2 | |
| 1 | ||||
| 1 | 1g.18gb | |||
| 2g.35gb | ||||
| 3g.71gb | ||||
| 8 | none (no label) | none | 0 | 0 (Entire) |
| Ví dụ: | ||||
| 👉 Nếu chọn cấu hình strategy single: all-1g.6gb, card GPU A30 trên worker được chia nhỏ thành 4 mig-devices có tài nguyên gpu logic (bằng ¼ GPU vật lý) và 6GB GPU RAM. | ||||
| 👉 Nếu chọn cấu hình strategy single: all-1g.10gb, card GPU H100 trên worker được chia nhỏ thành 7 mig-devices có tài nguyên gpu logic (bằng 1⁄7 GPU vật lý) và 10GB GPU RAM. | ||||
| Chú ý: | ||||
| MIG config áp dụng cho tất cả các card gắn trên worker. MIG strategy trên các worker group của cùng cluster phải cùng 1 loại (single/mixed/none). |
Trang chủ
01Hướng dẫn sử dụng
- Tổng quan dịch vụ GPU trên Kubernetes FPT Cloud
- Cài đặt và khởi tạo Cluster Kubernetes sử dụng GPU
- Thay đổi Worker Group sử dụng GPU
- Triển khai ứng dụng sử dụng GPU trên Kubernetes
- Hướng dẫn sử dụng GPU Telemetry
- Hướng dẫn sử dụng Autoscaler với GPU
- Hướng dẫn sử dụng các chế độ GPU sharing
- Tăng thêm Worker Group sử dụng GPU
- Hướng dẫn cài đặt GPU Driver trên Kubernetes
- Hướng dẫn cấu hình Auto Scale sử dụng GPU Custom Metric
- Hướng dẫn cấu hình Auto Scale sử dụng KEDA và Prometheus
Hotline:1900 638 399
Địa chỉ:
Hà Nội:FPT Tower, Số 10 Phạm Văn Bạch, Phường Cầu Giấy
TP. Hồ Chí Minh: Tòa nhà PJICO, 186 Điện Biên Phủ, Phường Xuân Hòa
Tokyo: 33F, Sumitomo Fudosan Tokyo Mita Garden Tower, 3-5-19 Mita, Minato-ku
Email: support@fptcloud.com
Dịch vụ
- FPT Cloud Server
- FPT Backup Service
- FPT Disaster Recovery Services
- FPT Object storage
- FPT Kubernetes Engine
- FPT Monitoring
- FPT Load Balancer
- FPT Next-Gen Firewall
- FPT Cloud Desktop
Điều khoản & Chính sách
- Điều Khoản Sử dụng
- Chính sách Bảo vệ quyền riêng tư
- Báo cáo lỗ hổng bảo mật hoặc quyền riêng tư
- Chính sách Bảo vệ Dữ liệu Cá nhân
- Biểu mẫu Báo Cáo Rủi Ro hoặc Vi Phạm
Đăng ký nhận tin Gửi
- Liên hệ Email
Chúng tôi quan tâm đến sự riêng tư của bạn Trang web này sử dụng cookie để cải thiện trải nghiệm người dùng. Bằng cách sử dụng trang web của chúng tôi, bạn đồng ý với tất cả cookie theo Chính sách bảo mật của chúng tôi Chỉ những cookie cần thiết Cài đặt Tôi đồng ý