[인공지능 기초 지식] Loss Function 손실 함수

혜밍s 2024. 5. 6. 10:42

2024. 5. 6. 10:42

모델의 예측값과 실제값 사이의 차이를 수치화하는 함수입니다.

모델 학습의 목표는 손실함수의 값을 최소화하는 파라미터를 찾는 것입니다. 손실함수의 값이 작을수록 모델의 예측이 실제 데이터와 더 가깝다는 것을 의미하기 때문입니다.

손실 함수는 주로 회귀 문제의 손실 함수와 분류 문제의 손실 함수로 나뉩니다.

회귀는 연속된 값을 예측하는 것을 의미합니다.

1. 평균 제곱 오차(Mean Squared Error, MSE)

예측값과 실제값의 차이를 제곱하여 평균을 낸 것입니다. 오차가 클수록 손실이 기하급수적으로 증가해 큰 오차를 더 중요하게 다루게 합니다.

2. 평균 절대 오차(Mean Absolute Error, MAE)

예측값과 실제값의 차이의 절대값을 평균으로 낸 것입니다. 모든 오차를 동일하게 취급하며 이상치에 대해 MSE보다 덜 민감합니다.

분류는 카테고리를 예측하는 것을 의미합니다.

1. 이진 크로스 엔트로피(Binary Cross-Entropy)

이진 분류에서 사용하는 손실 함수입니다. 이진 분류는 어떤 사진이 주어졌을 때, 사진이 고양이인지 강아지인지 분류하는 것과 같이 카테고리가 2개인 분류 문제를 의미합니다.

2. Categorical Cross-Entropy

다중 분류에서 사용합니다.

입력 데이터 형태: 원-핫 인코딩된 벡터
예: 각 클래스에 대한 확률 분포를 나타내는 벡터를 예측값으로 받습니다. 예를 들어, 3개의 클래스가 있고 첫번째 클래스가 정답일 경우, 실제 벡터값은 [1, 0, 0]이고 모델의 예측값은 [0.8, 0.1, 0.1]과 같습니다. 이때 모델의 예측값을 구할 때 softmax를 사용합니다.

2. Sparse Cross-Entropy

Categorical Cross-Entropy와 같이 다중 분류에서 사용하지만 입력 데이터의 형태가 다릅니다.

입력 데이터 형태: 정수 레이블
예: 각 데이터 포인트에 대한 정답 클래스의 인덱스를 받습니다. 예를 들어, 3개의 클래스가 있고 첫 번째 클래스가 정답일 경우, 실제값은 0이 됩니다.

728x90

지도학습 vs 비지도학습 (0)	2024.05.31
[인공지능 기초 지식] 평가지표 (0)	2024.05.20
[인공지능 기초 지식] Activation Function 활성화 함수 (0)	2024.05.13
[인공지능 기초 지식] 경사하강법 (0)	2024.04.29
[Text-to-speech(TTS)] 데이터셋 (1)	2024.04.18

기록 모음집