공부하고 기록하는, 경제학과 출신 개발자의 노트

분류 전체보기 559

KubeCon2024 - Which GPU Sharing Strategy Is Right for You? A Comprehensive Benchmark Study Using DRA

https://youtu.be/nOgxv_R13Dg?si=PxCxfv_F0NCCAkRB Which GPU Sharing Strategy Is Right for You? A Comprehensive Benchmark Study Using DRASpace vs Time PartitioningHardware vs Software Based Space PartitioningLayering StrategiesGPU Sharing in Kubernetes todayDedicatedtime slicingMPSMIGtime slicingMPSLimitationControl the Fraction of GPUGPU Sharing With DRA (Dynamic Resource Allocation)DedicatedShar..

학습일지/AI 2025.05.28

Scaling AI Workloads with kubernetes: Sharing GPU Resources Across Multiple Containers

https://youtu.be/t68ayhtaUQ8?si=GdmoGCpO6qdBQqur Scaling AI Workloads with kubernetes: Sharing GPU Resources Across Multiple ContainersUnderstanding GPU Resource ManagementMIG: GPU instance PartitioningTime-SlicingMIG vs Time-SlicingManaging GPU Resources in kubernetesSharing GPU between ContainersTechniques for Optimizing Deep Learning WorkloadsSummaryQ&A AI는 GPU를 많이 사용하지만, GPU는 비싸다. 따라서, 한 번 받..

학습일지/AI 2025.05.22

Kakao 메시지 API + MCP Server로 '나에게 메시지 보내기' 기능 만들기

개발 결과. 자세한 사용법은 아래 링크의 README를 참고하면 된다.https://github.com/inspirit941/kakao-bot-mcp-server GitHub - inspirit941/kakao-bot-mcp-server: MCP Server Implementation on Kakao Developers API to connect an AI AgentMCP Server Implementation on Kakao Developers API to connect an AI Agent - inspirit941/kakao-bot-mcp-servergithub.com 최근 라인에서 AI Agent가 라인 메시지 API를 호출할 수 있도록 해주는 MCP Server를 공개했다.https://git..

Python FastAPI vs Go Web Application 성능테스트 비교 영상 정리

https://youtu.be/CdkAMceuoBg?si=G2AxWUA9v1wIiuydFastAPI와 Go standard Library로 만든 Web Application의 성능 비교. 소스코드:https://github.com/antonputra/tutorials/tree/231/lessons/231 tutorials/lessons/231 at 231 · antonputra/tutorialsDevOps Tutorials. Contribute to antonputra/tutorials development by creating an account on GitHub.github.com Test 1. Baseline하드코딩으로 간단한 Objects를 만들어서 json으로 응답하는 예시.측정 항목clie..

당신은 사업가입니까

‘당신이 사업하면 안 되는 이유’를 집요하게 소개하는 책.사업은 경영 능력이 제일 중요하고, 기회비용을 고려한 전략적인 판단이 필요하다.‘직장 때려치고 사업이나 해 볼까’ 정도의 생각을 가진 사람을 독자로 상정한 책으로, 사업을 진지하게 준비하는 사람에게는 아무런 도움이 안 되는 내용.이 책에서 유일하게 통찰력 있던 부분은 ‘내가 사업가가 될 수 있을까? 라고 묻지 말고, 내가 사업가가 되어야 하는가? 라고 질문해라’ 라는 부분이다. ‘될 수 있는가?’ 라는 질문은 ‘누구나 사업가가 될 수 있다’는 오해를 낳기 때문이라고. 저자는 ‘사업가에 적격인 사람이 성공한다’를 책에서 일관적으로 주장하며, 사업에 뛰어들 생각을 하는 독자에게 다양한 이유를 들어가며 만류한다.기본적으로 저자는 사업가를 ‘자신의 열정에..

세줄요약 독서 2025.04.21

CKS 자격증 합격 후기 (with istio)

https://training.linuxfoundation.org/certification/certified-kubernetes-security-specialist/ 시험 준비기간 : Udemy 강의 완강에만 4개월. 문제풀이는 3일.Coming Soon: The current CKS Competency “Implement Pod-to-Pod encryption using Cilium” will be updated to “Implement Pod-to-Pod encryption (Cilium, Istio)” on April 8, 2025, at 00:00 UTC. 시험 보기 일주일 전에, Pod-to-Pod Encryption 커리큘럼에 istio가 추가됐었다. istio를 실제 업무에서 쓰고 있었기 ..

일상 속 생각 2025.04.14

DAN24 - 인공지능의 마법으로 실시간 라이브 인코딩에 날개를 달다

https://tv.naver.com/v/67446801 플레이 네이버(PLAY NAVER)[팀네이버 컨퍼런스 DAN 24] 인공지능의 마법으로 실시간 라이브 인코딩에 날개를 달다tv.naver.com   AI 인코딩 최적화가 필요한 이유 네이버tv, 스포츠, 치지직, 클립 등 다양한 서비스에서 VOD 사용: 비약적인 비용 증가 네이버 클라우드에서의 VOD 처리 절차다양한 기기에서 VOD 영상 업로드CODEC, container 등의 변환CDN으로 다양한 환경에서 재생 지원.이 중 가장 많은 서버자원, 시간, 리소스가 필요한 부분은 Encoding. 고해상도, 고화질 영상일수록 증가. 따라서자체 분산인코더 개발CDN, storage 비용 개선을 위한 인코딩 용량 줄여서 저장 / 전송 최적화를 연구중일반적..

학습일지/AI 2025.02.14

소득혁명

돈 주고 살 필요 전혀 없는 책. 책 내용이 궁금하면, 유튜브에 검색해서 나오는 책 홍보영상만 보면 된다. 그 이상의 내용이 하나도 없다.시간과 노동력 투입과 소득이 정비례해서는 안 된다. 한 번 구축해두면 시간을 들이지 않아도 되는 자동소득원을 구축해라.이 분야에 수많은 시행착오를 거쳤던 전문가의 조언을 따르는 게 좋다. 저자 본인은 에어비앤비 기반 임대 자동화로 시간의 자유를 얻었고, 노하우를 온라인 마케팅으로 홍보하고 온라인 강의 / 책 등으로 수입원을 다각화했다.본인 웹페이지와 강의를 책에서 노골적으로 홍보하면서, 정작 책 자체에는 깊이 있는 내용이 하나도 없다. 저자의 메시지는 매우 간단명료하다.  시간과 노동력을 투자해서 더 높은 소득을 올리는 방식에는 한계가 뚜렷하다. 당신의 시간과 노동력은..

세줄요약 독서 2025.02.09

EnvoyCon 2023 - Envoy Gateway: An In-Depth Guide of its benefits, Use cases, and Features

https://youtu.be/06ylMQrj0jU?si=Lcb1DcxyO0OPNC8B    Envoy Gateway: gateway which is actually managing envoy proxies.xDS Control Plane to dynamically manage a fleet of Envoysprovides "Batteries included" envoy proxy experience.Extensibility to support a multitude of application gateway usecases.mesh 형태의 기능도 지원할 예정이라고 함.본인들이 꼽는 장점Application Gateway에 필요한 usecase 대부분이 가능High Performance, Extensibil..

KEDA HTTP Add on 코드분석

KEDA http-add-on Autoscaling 로직 파악하기작성시간 기준, KEDA add on의 가장 최신버전인 v0.9.0 기준으로 작성.https://github.com/kedacore/http-add-on/blob/v0.9.0/docs/design.mdDesign외부에서 HTTP 요청이 오면, Ingress가 k8s svc로 트래픽을 전달해준다.keda-add-ons-http-interceptor-proxy 라는 k8s svc에서 트래픽을 받아서, interceptor 컴포넌트로 트래픽을 전달한다.interceptor는 scale zero인 deployment의 pod가 올라올 때까지 HTTP request를 pending하고, 트래픽을 전달할 수 있는 상태가 되었을 때 routing하는 역..