2. 선형대수(Linear Algebra)
·
AI/딥러닝
2.1 스칼라, 벡터, 행렬 및 텐서(Scalars, Vectors, Matrices and Tensors)스칼라 : 단순히 단일 숫자, 여러 숫자의 배열인 다른 선형대수 객체들과 대조됌.벡터 : 숫자의 배열, 열이 한개 혹은 행이 한개인 행렬이라고 볼수도 있음행렬 : 2차원 숫자의 배열텐서 : 2차원 이상(가변적인 수의 축을 가진)의 배열 전치 : i, j를 바꿔주는 행위(아래 그림 참조)2.2 행렬과 벡터의 곱셈(Multiplying Matrices and Vectors)A×B : 그 특이한 곱셈 방법 [원소별 곱셈(element-wise product), 하닷마르 곱(Hadamard product)]A⊙B : 위치 별로 곱하기 [스칼라곱 (Dot product)] 2.3 항등 행렬과 역행렬(Iden..
0. 책 소개와 링크 정리
·
AI/딥러닝
딥러닝 교과서 소개 – Deep Learning (Ian Goodfellow, Yoshua Bengio, Aaron Courville)취업 준비를 하던 도중, 기초적인 머신러닝 이론 지식을 정리하는데 좋은 서적을 추천받아 읽으면서 정리하고자한다.아래 링크를 통해 HTML 웹버전의 도서를 무료로 볼 수 있다.책 소개제목: Deep Learning저자: Ian Goodfellow, Yoshua Bengio, Aaron Courville출판사: MIT Press (2016)형태: 온라인 HTML 버전 무료 공개 + 인쇄본(구매 가능)링크: deeplearningbook.org이 책은 단순히 딥러닝 기법을 나열하는 것이 아니라,수학적 기초 (선형대수, 확률, 최적화 등)실무적 활용 (CNN, RNN, 최적화, ..
모델 평가 지표
·
AI/모델별 정리
좋은 모델을 만들기 위한 첫걸음은 올바른 평가 지표를 선택하는 것이다. 모델이 얼마나 잘 작동하는지를 판단하려면, 단순히 하나의 숫자에만 의존해서는 안 됩니다. 예를 들어, 가장 흔히 떠올리는 평가 지표인 ‘정확도(Accuracy)’는 예측이 얼마나 맞았는지를 직관적으로 보여주는 장점이 있지만, 모든 상황에 적합하지는 않습니다. 특히 한쪽 클래스가 월등히 많은 불균형 데이터셋에서는 정확도가 오히려 모델의 문제점을 가릴 수 있습니다. 실제로 전체 인구의 0.1%만이 특정 질병을 앓고 있는 상황에서, 모든 사람이 건강하다고 예측해도 99.9%의 정확도를 얻을 수 있습니다. 하지만 그 모델이 실제로 질병을 찾아내는 데 거의 무용하다는 건 명백하죠. 이렇듯 모델의 종류, 사용 목적, 데이터의 특성에 따..
KNN : K-Nearest Neighbors (k-최근접 이웃)
·
AI/모델별 정리
1. 개념클래스가 알려지 데이터 셋 안에서, 새로운 데이터가 가장 유사한 k개의 샘플을 선정하여가장 많이 나온 클래스를 새로운 데이터의 클래스로 결정. 학습이 이뤄지지 않고, 예측 과정에서 연산이 이뤄짐. (게으른 모델)! 그만큼 Feature 엔지니어링과 설계가 매우 중요Q0. '유사하다'의 의미가 무엇인가?A0. 수치형 데이터의 경우 직관적으로 좌표 평면 위에 나타냈을때, 가깝다를 기준으로 한다. Q1-1. 좌표 평면에 어떻게 나타낼 것인가?A1-1. 가깝다, 즉 거리를 기준으로 하기 때문에 데이터 특성(Feature) 사이 차원의 영향을 제거하기 위해 표준화 혹은 정규화를 진행해서 사용. Q1-2. 가깝다의 정의는 어떻게 할 것인가?A1-2. 일반적으로 유클리드 거리 혹은 멘해튼 거리를 사용한다...
ROC Curve와 AUC
·
AI/데이터 분석과 모델 학습
ROC Curve는 이진 분류 모델의 임계값(threshold)을 변화시켜가며 모델의 민감도/재현율(TPR : True Positive Rate)와 오탐률(FPR : False Positive Rate)를 시각화한 그래프. AUC는 ROC 곡선 아래 영역의 넓이를 의미 ROC : Receiver Operating CharacteristicAUC : Area Under the Curve AUC가 1에 가까울수록 좋은 모델.