논문리뷰2 표기법 (Notation) p. iii [책], p. 4 [PDF]Foundations of Large Language Models에서 사용되는 수학적 기호와 표기법에 관한 설명이다.Notation (표기법)Meaning (의미)Translated Meaning (한국어 의미)$a$variable변수$\mathbf{a}$row vector or matrix행 백터 또는 행렬$f(a)$function of $a$$a$의 함수$\max f(a)$maximum value of $f(a)$$f(a)$의 최대값 $\arg\max_{a} f(a)$value of $a$ that maximizes $f(a)$$f(a)$를 최대화하는 $a$의 값$\mathbf{x}$input token sequence to a model모델 입력 토큰 시퀀스$.. 2025. 5. 9. 소개글 (Introduction) 소개2025년 1월 16일, arXiv에 “Foundations of Large Language Models”라는 논문이 업로드되었다.LLM(Large Language Models)의 핵심 개념을 체계적으로 정리한 231페이지 분량의 책인데,LLM의 구조와 학습 방식에 대한 기초를 정리하고 싶은 대학생, 연구자, 실무자가 LLM의 기초를 다지는 데 도움이 될 것으로 보인다.원문과 함께 이 블로그 글을 통해 많은 분들이 아리송하거나 어려워하는 기초를 배울 수 있기를 희망한다.목차이 책은 총 4개의 장으로 구성되어 있으며, 각 장은 다음과 같은 내용을 다룬다.1. Pre-training (사전 학습)LLM의 기반이 되는 사전 학습 기법과 모델 아키텍처 소개Transformer 구조 및 대규모 데이터로부터 지.. 2025. 5. 7. 이전 1 다음