티스토리 뷰

머신러닝

machine learning 기초 용어 - error와 generalization

홍게 2017. 10. 31. 14:45

generaliztion, training error, test error

머신러닝의 기본용어인 generaliztion, test error, training error 에 대해서 소개하려고 합니다.

1.generalization

머신러닝의 목표는 학습데이터에 대해 잘 작동하는 것이 아닌 새로운, 보지 못 했던 데이터에 대해 잘 작동하는 것입니다. 관측하지 못한 데이터(unobserved inputs)에 대해 잘 작동하는 능력을 “generalization”이라고 합니다.

2.error

학습데이터에서 측정한 error를 우리는 training error라고 합니다. 관측하지 못한 새로운 input에 대한 error의 기댓값(expectation)을 우리는 generaliztion error=test error라고 부릅니다. generaliztion error를 최소화하는 것이 머신러닝의 궁극적인 목적이라고 할 수 있습니다.

3.현실에서 test error는 추정으로 구할 수 밖에 없다.

generaliztion error(test error)는 새로운 input에 대한 expectation이기 때문에 정확한 값은 구할 수 없습니다! 저는 착각하고 있던 사실인데요… “test error가 0.3이다“이런식의 표현은 test error의 실제 값을 구한 것이 아니라 ”추정” 한 것입니다.

generaliztion error(test error)는 test set의 error로 추정되며 test set은 training set와 분리된 학습시킬 때 제외된 데이터입니다.

'머신러닝' 카테고리의 다른 글

T-SNE 정리(1/2) Stochastic neighborhood embedding SNE 요약 정리 (0)	2018.10.14

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

ML