공부하고 기록하는, 경제학과 출신 개발자의 노트

keda 4

KEDA HTTP Add on 코드분석

KEDA http-add-on Autoscaling 로직 파악하기작성시간 기준, KEDA add on의 가장 최신버전인 v0.9.0 기준으로 작성.https://github.com/kedacore/http-add-on/blob/v0.9.0/docs/design.mdDesign외부에서 HTTP 요청이 오면, Ingress가 k8s svc로 트래픽을 전달해준다.keda-add-ons-http-interceptor-proxy 라는 k8s svc에서 트래픽을 받아서, interceptor 컴포넌트로 트래픽을 전달한다.interceptor는 scale zero인 deployment의 pod가 올라올 때까지 HTTP request를 pending하고, 트래픽을 전달할 수 있는 상태가 되었을 때 routing하는 역..

KubeCon2024 - Scaling New Heights with KEDA: Performance, Extensions, and Beyond

https://youtu.be/_5_njiPr5vg?si=W0MJDjYMbLMRYPU5 발표자Jorge Turrado: SCRM에서 SRE 담당. KEDA maintainerZbynek Roubalik: Kedify CTO, Knative TOC, KEDA maintainerEnterprise Autoscaling platform for our customers. Data Processing 관점에서, 한번에 데이터 처리가 많이 필요한 경우 / 그렇지 않은 경우가 있다. 리소스 효율화를 위해서라도, 필요한 순간에만 애플리케이션이 실행되면 좋을 것 같다.HPA: target workload의 CPU / Memory 확인해서 autoscale. 단, 리소스 사용량과 Actual Need이 다른 경우 사용하기..

KubeCon2022 - KEDA - Real Time and Serverless Scaling in Kubernetes

https://youtu.be/vjKLbfEZ7MU?si=X_RLkD6Ww5ij7MJp   발표자Jeff Hollan: Snowflake Product Director. 그전엔 MS에서 Azure Function Lead로 10년 정도 일했었고, KEDA founding memeber.Zbynek Roubalik: RedHat Engineer. KEDA founding member. Knative maintainer. 예컨대 KubeCon에 참여한 모든 사람들에게 피자를 제공해야 한다고 하자.Strategy 1: 피자가 부족할 때마다 한 판씩 주문한다.Strategy 2: 참여자가 얼마나 있는지 확인해서, 예상되는 양을 미리 주문한다.Strategy 1을 쓰면, KubeCon 참가자가 많을 경우 뒷사람은..

Kubernetes Autoscaling: HPA, VPA, KEDA, CA, Karpenter, Fargate

https://youtu.be/hsJ2qtwoWZw?si=K1sRyOkeJotnkdh5     k8s는 run application at scale이 가능함. built-in으로 제공되는 autoscaler / 추가로 설치하는 것까지 종류가 다양하다.낮에 트래픽 많고 밤에는 적은 이커머스 사이트라거나ETL 수행이 끝나면, 작업에 사용한 리소스를 반납해서 비용을 줄인다거나 일반적으로는 scale을 위해 pod를 증가시키는데, k8s 클러스터 리소스에 여유가 없을 경우 node를 증가시켜야 한다.따라서 autoscale할 대상이 pod인지 node인지 구분해서 설명한다.HPA k8s CRD 방식으로 구현. k8s Controller plane을 사용함.CPU / Memory 사용량에 따라 Deployment..