駕馭京東云的全球最大規(guī)模Docker集群、最大規(guī)模Kubernetes集群,如同要讓大象學(xué)會跳舞,以龐大身軀跳出輕盈優(yōu)雅的舞步。
容器編排、負(fù)載均衡、集群擴(kuò)縮容......當(dāng)資源調(diào)度的各項內(nèi)容被冠以“超大規(guī)模集群”后,簡單的調(diào)度分配資源算法已經(jīng)無法滿足復(fù)雜的調(diào)度需求,阿基米德調(diào)度系統(tǒng)應(yīng)運而生。
01撬動數(shù)據(jù)中心的支點
在行業(yè)首個混合云操作系統(tǒng)云艦中,阿基米德作為核心調(diào)度系統(tǒng),是資源交付的基石,負(fù)責(zé)整個京東數(shù)據(jù)中心的資源調(diào)度,是撬動整個數(shù)據(jù)中心的支點。
舉例最直觀的的感知:京東的電商場景中,購物車、訂單、詳情等,涉及到的每一臺容器分布,包括容器編排、單機(jī)計算資源、內(nèi)存資源,均由阿基米德分配和調(diào)度,特別是618、11.11的超大流量場景下,少數(shù)容器編排錯誤都有可能給業(yè)務(wù)帶來致命影響,調(diào)度器需負(fù)責(zé)把控峰值時每一臺容器計算的質(zhì)量,其重要性可想而知。
經(jīng)歷京東體系復(fù)雜場景的多年磨練,阿基米德可實現(xiàn)最優(yōu)的集群全局調(diào)度、最優(yōu)的一次作業(yè)調(diào)度,不僅能確保全局資源編排和成本最優(yōu)、資源運行最穩(wěn)定,還能在集群內(nèi)選擇最合適的宿主機(jī),以最佳的資源使用、最少的相互干擾(如 CPU 分布、IO 爭搶),來運行提交的計算作業(yè)。
2025-05-29 23:14
2025-05-29 23:14
2025-05-29 23:13
2025-05-29 23:13
2025-05-29 23:12
2025-05-29 23:12
2025-05-29 23:11
2025-05-29 23:11
2025-05-29 23:10
2025-05-29 23:09