SK Tech Summit 2023 - 비즈니스에 실제로 활용 가능한 LLM 서비스 만들기

학습일지/AI

inspirit941 2024. 2. 17. 00:18

비즈니스에 실제로 활용 가능한 LLM 서비스 만들기

SKT Data Application팀 김찬호님

스크린샷 2024-02-16 오후 4 11 39

스크린샷 2024-02-16 오후 4 22 00

chatGPT 출시 전인 22년 9월 / 출시 이후인 23년 9월에 세콰이어 캐피털에 올라온 글.

스크린샷 2024-02-16 오후 4 25 25

GPT-4한테 요약시킨 결과

스크린샷 2024-02-16 오후 4 27 22

22.09: foundation 모델 열거하고, 도메인 예시만 짤막하게 썼던 반면
23.09: Stack 구조를 소개함. 도메인별 foundation 모델 / serving, management tool / framework / application / monitoring 등 다양한 부분이 발전했음

Production Level에서 가치를 창출하는 '적용 사례' / Challenge?

스크린샷 2024-02-16 오후 4 37 20

미디어에서 한창 겁주던 시절의 대표적인 보도예시.

스크린샷 2024-02-16 오후 4 42 31

Azure Cloud에서 제공하는 OpenAI를 선택했었는데

스크린샷 2024-02-16 오후 4 44 56

public OpenAI는 서비스 품질개선이나 악의적인 공격 방지를 위해 데이터를 일정 기간 수집하고, 필요시 human access가 가능하다는 점을 명시함.
Azure OpenAI의 경우, 서비스 시작할 때부터 opt-out 옵션을 제공했음.

OpenAI vs Azure OpenAI: 앱 특징, 타겟 고객 특징, 인프라 요구사항에 맞춰서 선택하면 된다.

스크린샷 2024-02-16 오후 4 49 18 스크린샷 2024-02-16 오후 4 50 02

23년 2월, Bard가 오답을 내놓은 사례.

스크린샷 2024-02-16 오후 4 51 12

대부분의 LLM에서는 temperature / top P 등의 옵션을 제공함.
결국 LLM은 '다음에 나올 단어 예측' 모델이므로, 특정 단어 다음에 어떤 단어가 나올지 확률을 계산할 수 있다.

top P

기준이 되는 확률값을 정의한 뒤, 개별 단어의 확률 총합이 기준 확률에 도달할 때까지 후보군을 수집한다.
후보군에서 랜덤으로 하나 고르는 식.
- i.e. 오른쪽 예시의 경우 top P가 0.5라면, 개별 등장확률이 0.08 미만인 thougth, knew, had... 등 다양한 단어가 후보군에 올라간다.
- 계산 편하게 대충 0.08 확률이라고 치면, 0.5에 근접할 때까지 확률을 더하다 보면 6~7개 단어가 후보군에 포함됨.
- 그 6~7개 단어 중에서 랜덤으로 하나 뽑는다
만약 왼쪽 예시처럼 단어 하나가 0.8로 높은 확률이라면, 그 단어 하나만 뽑아도 top P 기준치였던 0.5를 초과함. 따라서 단어 선택지는 하나밖에 안 나온다.

temperature: scaling parameter

확률 간 절대값 차이를 줄여주는 옵션.
좀전의 예시에서 0.8 확률의 단어는 이론의 여지 없이 그냥 선택됨. temperature 값을 주면, 0.8이었던 가중치가 예컨대 0.5 이하로 내려가도록 scale을 조정한다.
- 조정되면, 랜덤 샘플링에서 선택할 수 있는 단어의 선택지가 많아질 수 있다.

스크린샷 2024-02-16 오후 5 06 13

RAG 기법 / 아키텍처로 응답에 필요한 레퍼런스 지식을 전달할 수 있다. Cache 아키텍처를 좀더 보자면

Ask Question -> Embedding -> Vector Space에서 relevant Docs를 가져온다 -> LLM에 전달
여기서, 자주 호출될 것 같은 query는 long-term memory에 저장해두고, cache hit할 경우 LLM 거치지 않고 바로 응답하도록 한다.
- controllability 향상. 내가 의도한 답변을 전달할 수 있기 때문.

스크린샷 2024-02-16 오후 5 52 14