檢視次數:
設定檔適用性:等級 2
處於降級狀態的節點是未知數,因此可能構成安全風險。
Kubernetes Engine 的節點自動修復功能可協助您保持叢集中的節點處於正常運行狀態。啟動後,Kubernetes Engine 會定期檢查叢集中每個節點的健康狀態。如果某個節點在延長的時間範圍內連續未通過健康檢查,Kubernetes Engine 會啟動該節點的修復過程。
注意
注意
節點自動修復預設已啟動。

影響

如果多個節點需要修復,Kubernetes 引擎可能會同時修復它們。Kubernetes 引擎會根據叢集的大小(較大的叢集有較高的限制)和叢集中損壞節點的數量(如果有許多節點損壞,限制會降低)來限制修復的數量。節點自動修復在 Alpha 叢集上不可用。

稽核

使用 Google Cloud 主控台:
  1. 前往 Kubernetes Engine,請造訪:Google Cloud Console Kubernetes Engine 頁面
  2. 從叢集列表中選擇所需的叢集。
  3. 對於每個節點池,查看節點池詳細資訊窗格,並確保在管理標題下,自動修復已設置為已啟動。
使用命令列:
要檢查現有叢集的節點池是否存在自動修復功能,首先定義節點池、叢集名稱、位置資訊和專案的4個變數,然後執行以下命令:
gcloud container node-pools describe $POOL_NAME --cluster $CLUSTER_NAME --location $LOCATION --project $PROJECT_ID --format json | jq '.management'
確保上述命令的輸出中,JSON 鍵屬性 autoRepair 設定為 true:
{ "autoRepair": true }

補救

使用 Google Cloud 主控台:
  1. 前往 Kubernetes Engine,請造訪:Google Cloud Console Kubernetes Engine 頁面
  2. 選擇包含已停用自動修復的節點池的 Kubernetes 叢集。
  3. 透過點擊資源池名稱來選擇節點資源池。
  4. 導航至節點池詳細資訊窗格並點擊編輯。
  5. 在管理標題下,勾選啟用自動修復方框。
  6. 點擊儲存。
  7. 對於每個已停用自動修復的叢集和節點池,重複步驟 2-6。
使用命令列:
要為現有叢集的節點池啟用節點自動修復:
gcloud container node-pools update <node_pool_name> --cluster <cluster_name> --location <location> --enable-autorepair