오늘의 목표

  1. 4차시 내용의 심화된 내용으로 컴퓨터 비전 공부하기
  2. 동아리 프로젝트가 시작될 때 바로 참여할 수 있도록 실력 키기

오늘의 내용 및 결과

  1. 기술의 주요 목표
    1. Object Recognition: 이미지나 동영상에서 특정 객체를 식별하는 작업 -> 자동차, 고양이, 사람들 구분
    2. Image Classification: 이미지를 카테고리로 분류하는 작업 -> 학습된 데이터셋을 기반함
    3. Image Sementation: 이미지를 여러 개의 의미 있는 영역으로 나누는 과정 -> 사람, 신호등, 차 등을 윤곽선으로 구분
    4. Action Recognition: 동영상에서 사람의 동작을 인식하는 기술
  2. 주요 기술
    1. Deep Learining: 주로 CNN를 활용해 이미지와 동영상 데이터를 분석함. CNN은 이미지의 공간적 계층 구를 학습하여 패턴 인식 능력을 향상시킴.
    2. Machin Learning: 대량의 데이터로부터 학습하여 패턴을 인식하고 예측하는 기술. 지도학습(supervised learning), 비지도 학습(unsupervised learning)에 많이 사용됨.
    3. Image Preprocessing: 성능을 높이기 위해 전처리하는 기술. 필터링, 윤곽선 검출, 노이즈 제거 등이 포함
    4. 3D Vision: 3D 공간에서 객체를 인식하고 추적하는 기수ㄹ. 자율 주행 차량이나 로봇에 주로 사용됨.
  3. CNN: 입력 이미지에서 특징을 추출하는 합성곱층(convolutional layers)과 이를 바탕으로 클래스 또는 카테고리로 분류하는 완전 연결층(fully connected layers)으로 구성됨
    1. 합성곱층 (Convolutional Layers): 이미지의 공간적 패턴을 인식하는 역할. 필터(커널)를 통해 이미지에서 특징을 추출하며, 각 필터는 특정한 패턴(예: 가장자리, 색상, 텍스처 등)을 감지함
    2. 풀링층 (Pooling Layers): 공간적 차원을 줄여 데이터를 압축하고, 계산 복잡성을 낮추면서도 중요한 정보는 유지. 주로 Max Pooling이 사용되며, 이는 특정 영역에서 가장 큰 값을 선택하는 방식.
    3. 정규화 및 활성화 함수: ReLU(Rectified Linear Unit)와 같은 활성화 함수가 신경망에 비선형성을 부여해 더 복잡한 모델링이 가능하게 하며, 배치 정규화(batch normalization) 등이 학습 과정에서 안정성을 높여줌.
  4. 객체 탐지 알고리즘
    1. R-CNN (Regions with CNN): 이미지 내에서 후보 영역을 찾고, 이를 CNN을 통해 분류 및 경계 상자를 예측하는 방법. R-CNN의 변형으로는 Fast R-CNN, Faster R-CNN 등이 있음. Faster R-CNN은 객체를 빠르고 정확하게 탐지할 수 있는 기법으로 널리 사용되고 있음.
    2. YOLO (You Only Look Once): 이미지 전체를 한 번에 분석해 객체를 탐지하는 방법. YOLO는 실시간 객체 탐지에 강력한 성능을 발휘하며, 빠른 처리 속도가 특징.
    3. SSD (Single Shot Multibox Detector): YOLO와 유사하게 한 번의 분석으로 객체 탐지를 수행하지만, 다양한 크기의 객체에 대해 더 나은 성능을 지님.