대용량 언어 모델(LLM)

기반 모델(Foundation Models) 관련 논문 모음

1. 기반 모델

기반 모델 및 응용 분야

순환 신경망(RNN) 및 합성곱 신경망(CNN)

자연어 처리(NLP) 및 컴퓨터 비전(CV)

2. 트랜스포머(Transformers) 아키텍쳐

셀프 어텐션(Self Attention) 및 트랜스포머(Transformers)

효율적인 트랜스포머

매개변수 효율적 튜닝

언어 모델 사전 학습

3. 대용량 언어 모델

대용량 언어 모델

스케일링 법칙(Scaling Law)

지시 튜닝(Instruction Tuning) 및 인간 피드백 기반 강화학습(RLHF)

효율적인 대용량 언어모델 학습

효율적인 대용량 언어모델 추론

대용량 언어 모델 압축과 희소화

대용량 언어 모델 프롬프팅(Prompting)

4. 멀티모달(Multimodal) 모델

비전 트랜스포머

디퓨전(Diffusion) 모델

이미지 생성

멀티모달 모델 사전학습

대용량 멀티모달 모델

5. 증강(Augmentation) 기반 모델

도구(Tool) 증강

검색(Retrieval) 증강

열심히 읽자!