목록AI Learner/Computer Vision (3)
Adore__

Source: Boost Course 'DL기초 다지기' Computer Vision에서 주로 사용하는 모델은 CNN이다. CNN은 정말 다양하게 사용되는데, 그 중 Sementic Segmentation과 Object Detection에 대해 알아보자 Semantic Segmentation Semantic Segmentation은 dense classification이라고도 불리지만, 정확히는 classification과는 다르다. 보통 일반적인 분류 문제는 이미지 1장이 주어질 때, 이게 강아지인지 고양이인지 labeling 하는 것을 말한다. 하지만 Semantic Segmentation은 한 이미지 안에서 '모든' pixel마다 분류한다. 위 사진에서 보면 각 pixel별로 '도로'인지, '사람'..

Source: Boost Course 'Computer Vision의 모든 것' ▪️ What is Classifier? 입력이 '영상'으로 들어오면 출력이 그 영상에 해당하는 'class'로 나오게 만든다. 즉, 영상 속에 어떤 물체가 들어있는지 분류해주는 mapping을 말한다. ▪️ 구현 방법? 가상 이상적인 분류 모델? 이 세상의 모든 데이터를 다 갖고 있다고 가정하면, 입력으로 들어온 이미지와 가장 비슷한 사진을 찾으면 된다. 이 상황에 가장 적합한 방법은 k-NN이 될 것이다. 하지만 데이터가 너무 많아지면 Time complexity와 Memory complextiy 문제가 있기때문에 현실적이지 않다. 또한 knn을 사용하려면 영상간의 유사도를 정의해야 하는데, 그 기준이 모호해서 쉬운 일이..

Source: Boost Course 'Computer Vision의 모든 것' Course Overview 유아시절 인간을 자세히 관찰해 보면, 지능 습득에 있어서 지각능력획득이 첫번째이자 가장 중요한 것을 알 수 있다. 이 중, 시각 지각 능력이 가장 중요하다고 생각한다. 우리는 비교적 시각에 더 많이 의존하여 살아가고, 뇌에서 대부분 처리하는 정보가 시각정보라는 주장도 있다. 따라서 인공지능에 있어서도 시각 지각 능력 구현이 매우 중요하다고 말할 수 있다. 인간의 뇌가 시각정보를 인지하고 뇌에서 처리하는 과정을 컴퓨터에 적용해보자. 우선 카메라로 영상을 찍어서 이미지를 인지한다. 이후 어떤 알고리즘을 통해 GPU에 올려서 장면에 대한 분석이 이루어진다. 이 출력문은 컴퓨터가 다루기 쉬우면서도 사람..