트리의 앙상블¶ 정형 데이터와 비정형 데이터¶ 정형 데이터: CSV, 데이터베이스, 엑셀에 저장하기 쉬운 데이터 정형 데이터에 대해 가장 뛰어난 성과를 내는 알고리즘이 바로 앙상블 학습이다. 비정형 데이터: 텍스트, 사진, 음악 등 데이터베이스나 엑셀로 표현하기 어려운 데이터 비정형 데이터에 대해서는 신경망 알고리즘이 가장 뛰어난 성과를 낸다. 랜덤 포레스트¶ 랜덤 포레스트는 앙상블 학습의 대표 주자 중 하나로 안정적인 성능 덕에 널리 사용된다. 랜덤 포레스트의 학습 방법은 아래와 같다. 입력한 훈련 데이터에서 랜덤하게 추출하여 트리 훈련을 위한 데이터를 준비한다. 이 때 한 샘플이 중복되어 추출될 수 있으며, 이렇게 만들어진 샘플을 부트스트랩 샘플(Bootstrap sample)이라고 한다. 기본적으로..