substratusai · alpe · Feb 6, 2024 · Feb 6, 2024 · Feb 7, 2024 · alpe
diff --git a/pkg/autoscaler/autoscaler.go b/pkg/autoscaler/autoscaler.go
@@ -71,6 +71,7 @@ func (r *Autoscaler) Reconcile(ctx context.Context, req ctrl.Request) (ctrl.Resu
 }
 
 func (a *Autoscaler) Start() {
+	a.LeaderElection.AfterOnStoppedLeading(a.Deployments.StopScalers)
 	for range time.Tick(a.Interval) {
 		if !a.LeaderElection.IsLeader.Load() {
 			log.Println("Not leader, doing nothing")

diff --git a/pkg/deployments/manager.go b/pkg/deployments/manager.go
@@ -115,6 +115,7 @@ func getModelsFromAnnotation(ann map[string]string) []string {
 }
 
 func (r *Manager) removeDeployment(req ctrl.Request) {
+	r.getScaler(req.Name).Stop()
 	r.scalersMtx.Lock()
 	delete(r.scalers, req.Name)
 	r.scalersMtx.Unlock()
@@ -229,6 +230,15 @@ func (r *Manager) ReadinessChecker(_ *http.Request) error {
 	return nil
 }
 
+// StopScalers stops all scheduled scale down processes and resets desired state
+func (r *Manager) StopScalers() {
+	r.scalersMtx.Lock()
+	defer r.scalersMtx.Unlock()
+	for _, s := range r.scalers {
+		s.Stop()
+	}
+}
+
 func getAnnotationInt32(ann map[string]string, key string, defaultValue int32) int32 {
 	if ann == nil {
 		return defaultValue

diff --git a/pkg/deployments/manager_test.go b/pkg/deployments/manager_test.go
@@ -4,6 +4,11 @@ import (
 	"context"
 	"reflect"
 	"testing"
+	"time"
+
+	"k8s.io/apimachinery/pkg/types"
+
+	"sigs.k8s.io/controller-runtime/pkg/reconcile"
 
 	appsv1 "k8s.io/api/apps/v1"
 	autoscalingv1 "k8s.io/api/autoscaling/v1"
@@ -136,6 +141,73 @@ func TestAddDeployment(t *testing.T) {
 	}
 }
 
+func TestRemoveDeployment(t *testing.T) {
+	const myDeployment = "myDeployment"
+	specs := map[string]struct {
+		setup      func(t *testing.T, m *Manager)
+		delay      time.Duration
+		expScalers map[string]scale
+	}{
+		"single model deployment": {
+			setup: func(t *testing.T, m *Manager) {
+				m.setModelMapping("model1", myDeployment)
+				m.getScaler(myDeployment)
+			},
+			expScalers: map[string]scale{},
+		},
+		"multi model deployment": {
+			setup: func(t *testing.T, m *Manager) {
+				m.setModelMapping("model1", myDeployment)
+				m.setModelMapping("model2", myDeployment)
+				m.setModelMapping("other", "other")
+				m.getScaler(myDeployment)
+				m.getScaler("other")
+			},
+			expScalers: map[string]scale{"other": {Current: -1}},
+		},
+		"unknown deployment - ignored": {
+			setup: func(t *testing.T, m *Manager) {
+				m.setModelMapping("other", "other")
+				m.getScaler("other")
+			},
+			expScalers: map[string]scale{"other": {Current: -1}},
+		},
+		"scale down timer stopped": {
+			setup: func(t *testing.T, m *Manager) {
+				m.setModelMapping("model1", myDeployment)
+				s := m.getScaler(myDeployment)
+				s.scaleDownDelay = 50 * time.Millisecond
+				s.scaleFunc = func(n int32, atLeastOne bool) error {
+					t.Fatal("scale down timer not stopped")
+					return nil
+				}
+				s.UpdateState(1, 0, 1)
+				s.SetDesiredScale(0)
+				require.True(t, s.scaleDownStarted)
+			},
+			delay:      80 * time.Millisecond,
+			expScalers: map[string]scale{},
+		},
+	}
+	for name, spec := range specs {
+		t.Run(name, func(t *testing.T) {
+			m := &Manager{
+				scalers:           make(map[string]*scaler),
+				modelToDeployment: make(map[string]string),
+			}
+			spec.setup(t, m)
+			req := reconcile.Request{NamespacedName: types.NamespacedName{Name: myDeployment}}
+			// when
+			m.removeDeployment(req)
+			time.Sleep(spec.delay) // let scale down timer run
+			// then
+			_, exists := m.ResolveDeployment(myDeployment)
+			assert.False(t, exists)
+			assert.Equal(t, spec.expScalers, m.getScalesSnapshot())
+		})
+	}
+}
+
 type partialFakeClient struct {
 	client.Client
 	subRes client.Object

diff --git a/pkg/deployments/scaler.go b/pkg/deployments/scaler.go
@@ -89,19 +89,22 @@ func (s *scaler) compareScales(current, desired int32) {
 	if s.desiredScale > s.currentScale {
 		// Scale up immediately.
 		go s.scaleFunc(s.desiredScale, false)
-		s.scaleDownStarted = false
+		s.stopScaleDown()
 	} else if s.desiredScale == s.currentScale {
 		// Do nothing, schedule nothing.
-		if s.scaleDownTimer != nil {
-			s.scaleDownTimer.Stop()
-		}
-		s.scaleDownStarted = false
+		s.stopScaleDown()
 	} else {
 		// Schedule a scale down.
-
 		if s.scaleDownTimer == nil {
 			s.scaleDownTimer = time.AfterFunc(s.scaleDownDelay, func() {
-				if err := s.scaleFunc(s.desiredScale, false); err != nil {
+				s.mtx.Lock()
+				s.scaleDownStarted = false // mark completed already
+				desiredScale, currentScale := s.desiredScale, s.currentScale
+				s.mtx.Unlock()
+				if desiredScale == -1 || desiredScale == currentScale {
+					return
+				}
+				if err := s.scaleFunc(desiredScale, false); err != nil {
 					log.Printf("task: run error: %v", err)
 				} else {
 					s.scaleDownStarted = false
@@ -116,6 +119,21 @@ func (s *scaler) compareScales(current, desired int32) {
 	}
 }
 
+// Stop stops the scale down process for the scaler and unsets the desired scale
+func (s *scaler) Stop() {
+	s.mtx.Lock()
+	defer s.mtx.Unlock()
+	s.stopScaleDown()
+	s.desiredScale = -1
+}
+
+func (s *scaler) stopScaleDown() {
+	if s.scaleDownTimer != nil && s.scaleDownStarted {
+		s.scaleDownTimer.Stop()
+	}
+	s.scaleDownStarted = false
+}
+
 type scale struct {
 	Current, Min, Max int32
 }

diff --git a/pkg/leader/election.go b/pkg/leader/election.go
@@ -3,6 +3,7 @@ package leader
 import (
 	"context"
 	"log"
+	"sync"
 	"sync/atomic"
 	"time"
 
@@ -25,8 +26,11 @@ func NewElection(clientset kubernetes.Interface, id, namespace string) *Election
 		},
 	}
 
-	isLeader := &atomic.Bool{}
-
+	var (
+		isLeader = &atomic.Bool{}
+		hooksMtx sync.RWMutex
+		hooks    []func()
+	)
 	config := leaderelection.LeaderElectionConfig{
 		Lock: lock,
 		// TODO: Set to true after ensuring autoscaling is done before cancel:
@@ -42,6 +46,11 @@ func NewElection(clientset kubernetes.Interface, id, namespace string) *Election
 			OnStoppedLeading: func() {
 				log.Printf("%q stopped leading", id)
 				isLeader.Store(false)
+				hooksMtx.RLock()
+				defer hooksMtx.RUnlock()
+				for _, hook := range hooks {
+					hook()
+				}
 			},
 			OnNewLeader: func(identity string) {
 				if identity == id {
@@ -56,13 +65,17 @@ func NewElection(clientset kubernetes.Interface, id, namespace string) *Election
 		IsLeader: isLeader,
 		config:   config,
 		ID:       id,
+		hooksMtx: &hooksMtx,
+		hooks:    &hooks,
 	}
 }
 
 type Election struct {
 	config   leaderelection.LeaderElectionConfig
 	IsLeader *atomic.Bool
 	ID       string
+	hooks    *[]func()
+	hooksMtx *sync.RWMutex
 }
 
 func (le *Election) Start(ctx context.Context) error {
@@ -80,3 +93,10 @@ func (le *Election) Start(ctx context.Context) error {
 		}
 	}
 }
+
+func (le *Election) AfterOnStoppedLeading(f func()) {
+	le.hooksMtx.Lock()
+	defer le.hooksMtx.Unlock()
+
+	*le.hooks = append(*le.hooks, f)
+}