히스토그램 평활화는 히스토그램을 이용하여 이미지의 명암 대비를 개선시키는 방법입니다. 그레이스케일 영상의 경우 픽셀이 가질 수 있는 값의 범위는 0 ~ 255 사이의 값입니다. 이미지 상에서 픽셀값이 0인 갯수, 픽셀값이 1인 갯수, ... , 픽셀값이 255인 갯수를 세어서 배열에 저장한 것이 히스토그램입니다. 왼쪽 이미지에 대해 히스토그램을 구하여 그래프로 그려보면 중앙의 좁은 범위에 픽셀들이 몰려있는 것을 볼 수 있습니다. 그래프에서 x축은 0~255사이의 픽셀값 범위이며 y축은 픽셀 갯수입니다. 히스토그램 평활화를 적용시키면 이미지의 픽셀값이 0~255 범위내에 골고루 분산되어 이미지의 명암대비가 개선됩니다. 구현 과정1. 입력 영상에 대한 히스토그램과 누적 히스토그램을 계산합니다. 누적 히스토그..
직선 y = mx + b을 매개변수식으로 바꾸면 r = xcosθ + ysinθ이다. 여기서 r은 원점으로부터 직선까지의 수직거리이며 θ는 이 직선과 수직인 직선과 x축 사이의 각도를 시계 반대방향으로 측정한 값이다. 좌표 (300,300)을 지나는 모든 직선에 대한 r과 θ를 구해서 극좌표계에 그려보면 사인곡선이 그려진다. 식 r = xcosθ + ysinθ에 좌표 (300,300)을 대입하고 θ를 0에서 180까지 증가시키면서 r값을 구한 결과이다. 좌표(100,100), (200,200), (300,300) 세 점을 지나는 모든 직선에 대한 r과 θ를 구하여 극좌표계에 그려보면 세 개의 사인곡선이 그려지는데 한 점에서 만나는 것을 확인할 수 있다. 교차점의 r,θ 값을 구하여 직선의 방정식으로 변환..
계속 내용을 보완하고 추가할 예정입니다. 기준 마커(fiducial marker)는 일정한 포맷으로 만들어진 인공적인 랜드마크입니다. 증강 현실(Augmented Reality)을 구현하데 이용할 수 있습니다. 영상에서 마커를 검출하여 마커의 4개의 코너를 구하면 카메라 자세 추정(camera pose estimation)을 할 수 있는데. 카메라 자세 추정이란 3차원 공간상에서의 카메라의 위치와 방향을 구하는 것입니다. 이 정보를 바탕으로 마커의 자세를 추정하여 마커 위에 가상의 사물을 띄웁니다. 이 방법을 사용하면 마커를 손에 들고 움직이더라도 항상 마커 위에 가상 사물을 띄울 수 있습니다. ArUco marker는 기준 마커 중 한가지로 n x n 크기의 2차원 비트 패턴과 이를 둘러싸고 있는 검은..
이진화는 가장 간단한 세그멘테이션(segmentation) 방법이다. 세그멘테이션이란 이미지를 분할하여 원하는 부분 혹은 물체를 검출하는데 많이 사용되는 기법이다. 이진화는 원본 영상을 그레이 영상으로 변환한 후, threshold값을 이용하여 배경과 물체를 분리해낸다. 아래 화면은 책상 위에 빨간색 공이 놓여있는 컬러 이미지를 그레이스케일 이미지로 변환한 후, 이진화를 통해 빨간색 공 영역을 분리해낸 결과이다. 가장 단순한 이진화 방법은 이미지 전체에 고정된 전역 threahold값을 사용하는 것이다.그레이 영상을 입력으로 받아서 영상 전체를 스캔하면서 픽셀값이 threshlod값보다 크면 결과 영상의 같은 위치의 픽셀값을 흰색(1 또는 255)으로 하고, 픽셀값이 threshold값보다 작으면 검은색..
마우스 왼쪽 버튼으로 이미지상의 특정 위치를 클릭하였을 때 (x,y)로 좌표를 출력하도록 프로그램 코드를 작성하였습니다. 아래 이미지를 크게 보려면 클릭해서 확인하세요.. 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253#include #include #include using namespace cv;using namespace std; void CallBackFunc(int event, int x, int y, int flags, void* userdata){ if (event == EVENT_LBUTTONDOWN) { cout
웹캠으로 부터 입력된 영상을 wxwidgets의 panel에 출력해주는 프로그램을 참고에 있는 소스코드를 참고하여 구현했습니다. 컴파일을 하려면.. $ g++ -o main main.cpp ` wx-config --cflags --libs` `pkg-config opencv --libs --cflags` 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111..
RANSAC 자료만 보고는 이해하기 힘들어서 어떻게 구현했는지 분석해보려고 RANSAC을 구현해놓은 소스코드와 이를 이용해서 line fitting까지 구현해놓은 곳을 찾았습니다.. https://github.com/srinath1905/GRANSAC/tree/e9ab74001a3f1a23f40629b57b1f4e38f9344a96 마우스로 클릭할때 마다 다시 계산해서 선을 그려주도록 바꾸어보고는.... 당분간 소스 코드를 분석해봐야 할듯합니다..
예전엔 소스코드가 지금거 보다 더 길었던거 같은데.. 좀더 간결하게 작성된 파이썬 코드를 찾았습니다.. 1234567891011121314151617181920212223242526272829303132333435363738394041424344import wximport cv2 class ShowCapture(wx.Panel): def __init__(self, parent, capture, fps=15): wx.Panel.__init__(self, parent) self.capture = capture ret, frame = self.capture.read() height, width = frame.shape[:2] parent.SetSize((width, height)) frame = cv2.cvt..
두번째 예제에 있던 오타 및 오류를 잡았습니다. 테스트에 사용한 이미지입니다. openCV 3.0부터 라벨링 알고리즘이 추가되었습니다.. 이미지를 라벨링하고 원하는 라벨을 색으로 표현한다든가.. 각각의 영역들을 박스치는 것등이 쉽게되네요.. 해당 영역의 크기도 각각 계산되서 나옵니다.. 자세한건 아래 소스코드를 읽어 보세요... 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162#include #include #include #include #include using namespace cv; using namespace std; int main() {..
허프변환에 대해 좀더 알고 싶으시면 아래 글을 참고하세요...[그래픽스&컴퓨터비전/구현한 것들] - Hough Line Transform 구현 #include #include #include #include using namespace cv; using namespace std; int main(int argc, char**argv ) { Mat img_original = imread("indoor1.jpg", IMREAD_COLOR ); Mat img_edge, img_gray; //그레이 스케일 영상으로 변환 한후. cvtColor( img_original, img_gray, COLOR_BGR2GRAY); //캐니에지를 이용하여 에지 성분을 검출합니다. Canny( img_gray, img_edge,..