▶ 기타 팁

데이터 라벨링이란 무엇일까?

아보카도 2022. 12. 21. 03:39
728x90
반응형

 

 

 

 

새로운 부업을 찾다보니 데이터 라벨링이란 직무를 알게됐습니다.

 

현재는 크라우드웍스에서 AIDE 2급 자격증을 취득한 상태인데,

내년 상반기까지는 일거리가 없는 비수기라합니다.

 

그래서 내년 상반기까지 AIDE 1급 자격증을 취득 목표로 준비하려합니다.

 

간단하게 데이터 라벨링에 관해 알아보겠습니다.

 

 

1. 데이터 라벨링이란 무엇인가?

 

AIDE 2급 풀 패키지

 

우리가 흔히 아는 인공지능(AI)의 고도화를 위해서는 다양한 데이터를 주입해야합니다.
AI는 사람이 사용하는 문서나 사진 등의 데이터를 식별할 수 없기 때문에

AI가 스스로 학습할 수 있는 형태로 데이터를 가공해야하는데,
이러한 작업을 데이터 라벨링이라고 합니다.
즉, 데이터 라벨링을 하는 사람을 데이터 라벨러라고 부릅니다.

데이터 라벨링의 예를 들어보자면.

 

 

어도비스톡 무료이미지

 

(이미지 라벨링 기법 중 가장 기본적인 바운딩 입니다.)

 

바운딩은 이미지에서 추출하고자 하는 대상을 네모난 박스로 표시하는 

라벨링 기법입니다.

 

바운딩 박스라고도 불리우는데요.

위 사진에서 인공지능이 학습할 수 있는 형태로 라벨링 작업을 진행합니다.

'강아지'의 라벨링 작업을 위해 강아지만 네모박스 표시를 해줍니다.

 

당연하지만, 여기서 사람은 제외됩니다.

 

 

크라우드웍스 이미지 발췌

 

 

인공지능이 학습되어 실행되기까지 총 4단계의 과정을 거치게 됩니다.

 

1. 데이터 수집

 

AI 서비스를 제공하기 위해서는 가장 먼저 그에 맞는 데이터를 수집하게 됩니다.

데이터는 주로 사물인터넷, 모바일, 사진, 영상, 텍스트, M2M 등을 통해 수집하게 되는데 

M2M은 'machine to machine'의 약자로 디바이스와 기계 간의 자동적으로 주고받는 통신을 의미합니다.

 

2. 데이터가공(전처리)

 

두번째로는 인공지능(AI)가 학습할 수 있도록 데이터라벨러가 직접 데이터를 확인해

인공지능(AI)이 학습 할 수 있는 형태로 가공하는 작업을 진행합니다.

 

데이터가공(전처리)에는 라벨링, 구분, 선별, 포맷 변경, 결합, 변형 등이 있습니다.

 

 

3. 모델링(모델 생성)

 

세번째로는 모델링 단계입니다. 이 때부터는 본격적인 개발 단계가 시작됩니다.

 모델생성과정은 '모델개발 → 데이터입력 → 데이터학습 → 모델수정'을 거치며

학습을 반복해 AI품질을 높입니다.

 

데이터 라벨링의 품질은 인공지능의 성능을 좌우하는 중요한 요소로,

머신러닝(ML) - 지도학습, 비지도학습, 강화학습 3가지의 종류가 있습니다.

 

 

4. 실시간 서비스(API)

네번째로 마지막 단계입니다. 실시간 서비스 단계는 우리의 삶에 실시간으로 실용적인 서비스를 제공하는 단계입니다.

반응형

 

현재 데이터 라벨라는 2022년 고용노동부 직업 사전에 등재되었으며 4차 AI산업의 신생 직업으로 인정받았습니다.

작업으로는 바운딩, OCR, 모션키포인트, 수집 프로젝드 다양한 작업의 종류가 있습니다.

 

무엇보다도 내가 원하는 시간, 장소에서 작업할 수 있으며 진입장벽이 작다는게 장점인거 같습니다.

 

매년 하반기에 프로젝트가 많이 몰리게 되는데 우선 선별자로 선발되기 위해서 AIDE 1급 자격증 준비와

데이터 라벨링에 대해 지속적으로 공부할 예정입니다.

 

728x90
반응형