[LLM] Foundation Models 논문 모음

대용량 언어 모델(LLM)

기반 모델 및 응용 분야

순환 신경망(RNN) 및 합성곱 신경망(CNN)

자연어 처리(NLP) 및 컴퓨터 비전(CV)

셀프 어텐션(Self Attention) 및 트랜스포머(Transformers)

효율적인 트랜스포머

매개변수 효율적 튜닝

언어 모델 사전 학습

대용량 언어 모델

스케일링 법칙(Scaling Law)

지시 튜닝(Instruction Tuning) 및 인간 피드백 기반 강화학습(RLHF)

효율적인 대용량 언어모델 학습

효율적인 대용량 언어모델 추론

대용량 언어 모델 압축과 희소화

대용량 언어 모델 프롬프팅(Prompting)

비전 트랜스포머

디퓨전(Diffusion) 모델

이미지 생성

멀티모달 모델 사전학습

대용량 멀티모달 모델

도구(Tool) 증강

검색(Retrieval) 증강

열심히 읽자!