본문 바로가기
Artificial Intelligence/Basic

용어 정리 (인공지능, 머신러닝, 컴퓨터비전 분야)

by SuperMemi 2022. 1. 17.
반응형

A

analytical : 분석적. 일반적인 고등학교 다항식의 해를 구할때 많이 사용하는 것이 분석적 방법.

B

binary image : 이진 영상. 이미지를 0과 1로만 나타낸 이미지를 말한다. 

C

class : 부류. 개냐 고양이냐 할때 개와 고양이를 각각 하나의 class로 간주함.

 

classification : 분류. 주어진 데이터가 어떤 부류(class)에 속하는지 판단하는 행위. 

 

color image : 컬러영상. 한 픽셀이 R,G,B 세개의 값을 갖는다. 

 

computer graphics : 컴퓨터그래픽스. 컴퓨터 비전과 반대 과정. 입력된 고급 묘사를 바탕으로 영상을 생성하거나 합성하는 것. 

 

computer vision : 컴퓨터비전. 영상을 입력 받아, 분석 및 해석하여 고급 묘사를 출력한다. 

 

cone : 추상체. 사람의 시각(망막)에서 색에 반응하는 시각세포.

 

confusion matrix : 혼동 행렬. 일반적인 예시로는 부류가 2개인 예시가 많음. 세밀한 분석이 가능. 예를들어 긍정(99%)과 부정(1%)이 심한 불균형을 이룬 경우 모델이 학습하지않고 모든 답을 긍정이라고 하더라도 정인식률은 99%가 나오기 때문에 제대로된 성능평과가 어렵다. 대신 confusion matrix를 활용하면 precision, recall 뿐만 아니라 FPR, FNR, TPR, TNR 등을 알 수 있다.

 

correct recognition rate : 정인식률 = 제대로 판단한 개수(c) / 전체 샘플 개수(N)

D

E

error rate : 오류율. 틀린 샘플의 수(e) / 전체 샘플의 수(N)

F

false negative rate : 거짓부정률. FNR = False Negative / (True Positive + False Negative). positive 정답 데이터 중에 모델이 찾은 negative 예측 비율. 예를 들어 검출 모델에서, 찾아야 할 것을 제대로 찾지 못하는 경우. 문제가 심각.

 

false positive rate : 거짓긍정률. FTR = False Positive / (True Negative + False Positive). negative 정답 데이터 중에 모델이 찾은 positive 예측 비율. 예를 들어 검출 모델에서, 찾지 않아야 할 것을 찾은 경우, 암이아닌데 암이라고 검출.

 

F-measure : F-측정. F_beta = (1+beta^2) * (precision * recall) / (beta^2 * precision + recall). beta = 1 이라면, F_1 = (2 * precision * recall) / (precision + recall). 만약 beta가 1보다 크면, 정확률 보다 재현율에 더 큰 비중을 두는 셈이다.

G

geometric transformation : 기하학적 변환. (ex> 크기 변환, 회전, 투영 등)

 

ground truth : 데이터의 표지. 정답. label, bounding box, segmentation map 등이 ground truth가 될 수 있음. 

H

heuristic : 휴리스틱. 불확실한 상황에서 감각적으로 선택하는 것. 

 

histogram backprojection : 히스토그램 역투영. 물체의 모양은 무시하고 단순히 컬러 분포만으로 물체를 검출하는 방법으로 사용되기도 한다. (ex. RGB 색공간을 HSI공간으로 변환한 다음 H,S채널만 사용함. H,S채널을 0~255 값을 가지는 2차원 히스토그램으로 나타내보자. 2차원 히스토그램의 칸 수는 256*256 = 65,536 개가 된다. 원래 이미지가 100x100이미지라고 할때 10,000개의 픽셀을 65,536개의 칸을 가진 2차원 히스토 그램에 뿌리는 것이기 때문에 대부분의 칸이 0을 갖는 매우 희소한 공간이 된다. 이때, 256 단계를  적은 단계로 줄이는 것이 좋다. 새로운 이미지가 들어왔을때 위의 과정을 동일하게 진행하여 비교했을때 높은 값을 가진다면 유사한 색 분포를 가졌다고 볼 수 있다. 이때 높은 신뢰도 맵(confidence map)을 표현하면 유사한 색상의 것만 뽑아낼 수 있다. 장점 : 이동,회전,가려진 경우에 잘 작동. 배경을 균일하게 꾸밀 수 있는 상황이라면 잘 작동한다. 단점 : 색정보만 이용했기 때문에 원하지 않는 부분일지라도 유사한 색을 가졌으면 반응함.) 

 

histogram equalization : 히스토그램 평활화. 히스토그램 평활화를 적용하면 이미지에서 다양한 범위의 명암을 고르게 사용하기 때문에 영상이 이전보다 선명해 진다. 즉, 동적 범위 (dynamic range)가 늘어난다. 누적 히스토그램에 (L-1)을 곱하고 결과를 반올림하면된다. 

 

histogram for computer vision : 컴퓨터 비전에서 히스토그램은 영상의 특성을 파악하기 위해서 많이 사용된다. 예를들어, 히스토그램이 왼쪽으로 치우쳐져 있으면 어두운 영상이 되고, 두 개의 봉우리가 선명하게 나타난 영상의 경우 이진 영상으로 변환하기가 용이하다. 

 

HSI : Hue(색상),Saturation(채도), Intensity(명암) 으로 이미지를 표현할 수 있다. <-> RGB이미지를 HSI공간으로 표현가능. 

I

ill-posed problem : 문제의 답이 유일하지 않은 문제.

 

image : 영상. 예시) 2차원 영상 좌표계의 경우 원점이 왼쪽 위에 위치하고, 좌표를 벡터로 표기가능하다. ( X = (y,x) ) 영상은 두 개의 매개변수를 가진 일종의 함수이며 f(X)로 나타낼 수 있다. 

 

image processing : 영상철. 영상을 입력으로 받아 주어진 목적을 달성하는데 적합한 형태로 처리하여 새로운 영상으로 출력하는 과정.

J

K

L

label : 데이터의 속성값. 예를들어 손글씨 데이터 MNIST 에서 손으로쓴 0이미지 데이터의 label값은 0 이 된다.

M

N

normalized histogram : 정규 히스토그램. 히스토그램의 모든 칸을 더하면 1.0이 되도록 히스토그램을 정규화한 형태.

 

numerical : 수치적. 초기 해를 설정하고 최적해에 조금씩 접근하는 방법. 수치적 방법.

O

objective function : 목적함수. 최적화 알고리즘에서 점수를 계산하는 데 사용하는 함수를 목적 함수라한다. 

optimal solution : 최적해.

P

pattern recognition : 패턴인식. 얼굴이나 문자처럼 영상으로 표현되는 패턴 뿐만 아니라, 음성, 날씨, 시계열 데이터 등 다양한 데이터를 패턴으로 간주하고 분석과 분류 작업을 수행하는 것. 즉 특징 추출기가 입력 패턴에서 특징을 추출하여 특징 벡터로 표현하면, 신경망이나 SVM과 같은 분류기가 특징 벡터를 분류하여 부류를 출력한다. 

 

pixel : 픽셀.화소. 영상(이미지)에서 (j,i) 또는 (y,x)로 지정되는 한 점을 말한다. 

 

precision : 정확률. True Positive / (True Positive + False Positive). 모델이 예측한 positive 데이터 중 실제 정답이 positive인 비율.

Q

quantization : 양자화. 아날로그 신호를 컴퓨터가 인식할 수 있는 범위의 숫자로 바꾸는 과정을 말함. 일반적으로 컴퓨터 비전에서 이미지의 밝기 값은 0~255 (1 byte) 사이의 정수값 사용된다. 

R

recall : 재현율. True Positive / (True Positive + False Negative). positive 정답 데이터 중에 모델이 찾은 positive 예측 비율. 참긍정률(TPR)과 동일.

 

rejection rate : 기각률. 기각하는 샘플의 개수(r) / 전체 샘플의 수(N). 모델 예측 정도가 확신이 되지 않는 경우 클래스 분류를 포기하는 경우가 있음.

 

resolution : 해상도. 영상(이미지)의 경우 많은 수의 픽셀의 밝기 값으로 구성되어 있다. 해상도는 이 영상의 크기를 말한다. 영상의 크기는 이 세로(M), 가로(N) 픽셀 수로 표현가능하다. (M X N). resolution이 높을 수록 동일한 영상을 더욱 세밀하게 표현할 수 있다. 

 

robust : 강건하다. 시스템이 작동하는 외부 환경이 변할 때 성능을 얼마나 잘 유지하는지를 나타낸다. 또 수학적으로는 어떠한 변환 또는 함수가 어떤 특성을 그대로 유지할 경우 그 함수가 그 특성에 대해 강건하다라고 할 수 있다. 즉, 어떤 변화에도 동일하게 좋은 성능을 낸다면 그변화에 강건하다고 할 수 있다. 

 

rod : 간상체. 사람의 눈(망막)에서 밝기에 반응하는 시각 세포

 

RGB : Red, Green, Blue 값으로 이미지 픽셀을 채우면 컬러이미지를 만들 수 있다.

S

solution spae : 해공간. 가능한 모든 후보 해가 이루는 공간을 해 공간 이라 부른다.

 

smoothing : 스무딩. 전체적으로 흐릿한 이미지를 만들어내는 과정이다. 잡음(noise)을 줄일 수 있다.

 

suboptimal solution : 부 최적해. 최적해에 가까운 값.

 

T

test set : 완성된 시스템의 성능을 평가하는 데 사용할 데이터 집합

 

training set : 학습과정에서 사용되는 데이터 집합

 

true negative rate : 참부정률. TNR = True Negative / (True Negative + False Positive). negative 정답 데이터 중에 모델이 찾은 negative 예측 비율. 

 

true positive rate : 참긍정률. TPR = True Positive / (True Positive + False Negative). positive 정답 데이터 중에 모델이 찾은 positive 예측 비율. 재현율(recall)과 동일.

 

U

V

W

X

Y

Z

 

반응형