아르바이트정보

데이터 라벨링에 대해서 알아보자

로미쓰 2022. 12. 12.

 혹시 데이터 라벨링에 대해서 한번 들어보셨나요? 오늘은 데이터 라벨링에 대해서 알아보는 시간을 가져보겠습니다. 사람들이 데이터 라벨링이라는 알바에 관심을 갖게 된 이유는 데이터 라벨링 작업은 온라인으로 하는 단순노동으로 누구나 쉽게 할 수 있는 부업입니다. 또한 금리 인상 문제로 물가도 많이 상승한 시점에서 월급만으로는 부족한 생활이 되기 시작했습니다. 그러면서 사람들은 다양한 부업에 관심을 가지게 되었고 직장인들도 그나마 퇴근하고 간단하게 할 수 있는 데이터 라벨링에 대해서 알아보겠습니다. 우선 데이터 라벨링의 정의에 대해서 알아보겠습니다.

data
data

 

1. 데이터라벨링이란?

 유튜브를 보면 집에서 앉아서 돈을 벌 수 있다? 이런 광고들이 나오게 됩니다. 그러면 직장인들 입장에서는 앉아서 돈을 벌 수 있다고? 또 컴퓨터만 있다면 돈을  벌 수 있다고? 이런 생각을 많이 하게 됩니다. 이러면서 저도 당연스럽게 데이터 라벨링에데해서 접하게 되었습니다. 

 

 광고들을 보면 AI 어쩌고 저쩌고 하면서 어려운 일이 것 같기도 하고 전문직 같은 느낌도 많이 나는데 사실은 시작도 누구나 쉽게 할 수 있고 간단하게 교육만 듣게 되면 누구나 수익을 올릴 수 있는 온라인으로 하는 간단한 부업입니다. 이런 간단한 부업의 의미에 대해서 알아보겠습니다.

데이터 라벨링(Data Labeling)
인공지능의 학습을 위해 라벨을 달아주는 작업

  데이터 라벨링의 정의만 들어도 머리가 어질어질할 것입니다. 더 쉽게 말하면 부모님들이 어린아이를 위해서 사과를 보고 이것은 사과야 배를 보고 이것은 배야 이렇게 알려주는 데이터를 수집을 해서 인공지능에게 입히는 역할을 하는 것입니다. 인공지능을 처음 만들게 되면 당연히 데이터가 없기 때문에 판단을 할 수 없습니다. 그래서 작업자들이 작업을 해서 정보를 수집을 하게 되고 이것을 인공지능에게 입혀서 성장을 시키는 역할을 합니다. 그러나 인공지능에게 이런 정보를 넣어도 도움이 될지 의문이 들것입니다. 대표적인 예시로 설명을 하면 전 세계를 놀라게 했던 이세돌 고수님과 구글에서 만든 알파고의 세기의 바둑 대국을 떠올리시면 될 것 같습니다. 

알파고는 날 때부터 천재 바둑 신동이 아니라 인터 네세에서 둔 바둑기보 16만 건을 학습하고, 3000만 개의 가능성에 대해서 분석을 하게  되었습니다. 그러면서 자체적으로 해결책을 구축을 하게 되었습니다. 그러면서 결국에는 알파고가 이세돌을 이기게 되었습니다. 

 이렇게 인공지능에게 구축을 할 수 있는 데이터를 가공해서 수집을 하는 작업이 바로 데이터 라벨링입니다.

 

2.  데이터 라벨링 유형

데이터 라벨링이라고 말하면 아주 심오하고 코딩을 할 것 같은 느낌이 들지만 실제로는 그렇지 않습니다. 인공지능을 구축을 할 때는 사실 전문적인 프로그래밍도 필요하겠지만 일상생활에서 찍은 사진 원하는 키워드 이런 것들도 충분히 데이터 라벨링을 위한 분석 자료가 될 수 있습니다. 이런 라벨링 작업은 크게 수집과 가공, 검수로 구분을 할 수 있습니다. 

수집: 이미지나 영상, 음성 등의 자료를 모으는 업무
가공업무(바운딩, 스켈레톤, 감정 태깅, 문장생성 등) 다양한 작업
마지막 단계로는 검수

 앞에서 나온 것처럼 수집은 여러 데이터를 모으는 작업도 가공업무 중 바운딩은 만약에 키워드가 주어지면 사진에서 데이터를 맞춰서 박스를 그려서 태깅을 하는 작업이다. 이것이 AI에게 이것은 뭐다라고 알려주는 작업이라고 보시면 됩니다. 가공도 마감기간에 맞추서 작업을 하면 됩니다. 또한 PC나 태블릿을 이용해서 충분히 할 수 있기 때문에 시간과 장소에 구애를 받지 않고 누구나 쉽게 할 수 있는 부업입니다. 사진에서 눈, 코, 입, 관절 부의 점을 찍어서 관련 정보를 알려주는 스켈레톤, 사진 속 사람의 표정을 보거나 문장을 읽었을 때 느끼는 감정을 선택하는 감정 태깅, 가이드라인에 맞춰서 문장을 만드는 문장생성 등 이런 것들이 바로 가공 업무입니다. 

 

 가공업무가 끝나면 바로 AI에게  주입을 하는 것도 아닙니다. 그 마지막 단계에서 바로 검수라는 작업도 있습니다. 검수가 끝나면 최종적으로 AI에게 정보가 들어가게 됩니다. 


 오늘은 클라우드 웍스에서 중요한 부분인 데이터 라벨링에 대해서 알아보고 영어로 된 표현이라 익숙하지 않지만 쉽게 말해서 인공지능에게 학습을 위해서 사람이 가공을 하는 단순 작업이라고 보시는 것이 편합니다. 클라우드 워커에 관심이 많으신 분들은 대부분 하시는 작업이 데이터 라벨링 작업일 것입니다. 데이터 라벨링을 통해서 부업처럼 알바처럼 수익을 내는 작업을 하시면 됩니다. 

 

댓글