티스토리 툴바


먼저 위 그림과 같은 분포를 가지는 true function이 있다고 하자. 이 true function에서 noise가 포함된 sample을
추출하면 다음 그림과 같은 sample들이 뽑힌다.
추출된 data sets은 총 2개 이며 빨간 점들이 한 set, 주황색 점들이 한 set 이렇게 2개의 set 이다.
위 그림은 모델의 order = 1 인 경우를 나타낸다. 각 data set 마다 추정된 모델이 해당 점과 같은 색의 실선으로 표현되었다.
이 추정모델들의 평균이 파란색 실선으로 나타난다. 각 추정모델 사이의 간격이 좁기 때문에 파란색 확률분포의 종모양이
좁게 나타난다. 결국 variance값이 작다는 말

그리고 true function의 확률 분포인 녹색 확률분포의 mean과 추정 모델인 파란색 확률분포의 mean 과의 간격이 크기 때문에
bias가 크다.
위 그림은 order가 증가 했을 때의 모습이다. order = 1인 경우와는 반대로 각 추정 모델 사이의 간격이 더 넓어 졌기 때문에
추정모델의 평균인 파란색 확률분포의 종모양도 넓게 퍼져서 나타난다. variance가 큼
녹색 확률분포의 mean과 파란색 확률분포의 mean 사이의 간격은 작으므로 bias는 작아진다.


출처 : http://lsujang.egloos.com/

저작자 표시 비영리 변경 금지

'Machine Learning' 카테고리의 다른 글

Dendrogram  (0) 2009/09/07
Majorization  (0) 2009/09/04
군집화  (0) 2009/09/04
Gibbs Sampling algorithm  (0) 2009/06/23
Support Vector Machine(SVM)  (0) 2009/03/12
Bias-variance dilemma  (0) 2009/03/12
Posted by Jason Park
이전버튼 1 ... 90 91 92 93 94 95 96 97 98 ... 119 이전버튼