팀 목표: 강화학습 공부하기

개인 목표: segmentation에 대해 알아보기

Segmentation

segmentation은 이미지 내에서 픽셀 단위로 객체를 분류해내는 작업을 말함. 여기서 객체란 Object 즉, 사람, 자동차, 나무, 자전거 등을 말하며 Deep learning 에서는 이를 class 라고 표현함.

Segmentation의 장점은 Detection과 Classification을 동시에 할 수 있다는 점임.

스크린샷 2024-08-11 오후 4.49.15.png

위의 예제에서 침대에 해당하는 픽셀들은 '침대'클래스로 분류되며, 벽에 해당하는 픽셀들은 '벽' 클래스로 분류되어 각각이 서로 다른 라벨이 붙게 됨.

좀 더 자세히 말하자면, 우리의 목표는 HW3 크기(3은 RGB 3가지 색을 말함.)의 이미지를 받아서 전체 픽셀의 예측 클래스를 담고 있는 H*W 배열을 생성하는 것임.

보통 여러 객체들을 담고 있는 이미지에서 우리는 특정 픽셀이 어느 객체 종류에 속하는지를 알고 싶어함. 예를 들어 야외 이미지에서 우리는 하늘, 땅, 나무들, 사람들 등을 분석해 낼 수 있음.

Image Segmentation은 이미지 주변에 감싸는 박스를 생성하는 이미지 인식(Object Detection)과는 다른 문제임. 다시 말해 우리는 같은 클래스에 속하는 서로 다른 개체들을 분류할 필요가 없음. 예를 들어 같은 '차'라는 라벨을 가진 픽셀안에서도 여러 종류의 차를 분류하는 것이 object detection이라면 그냥 차라면 모아서 여러 객체들 중 다른 하나의 객체로 구분하는 것이 Image Segmentation임.