본문 바로가기
IT 정보 꿀팁

AIDE 2급 기출 예상 이론 정리 ① (데이러 라벨링 자격증 시험 준비)

by 청춘23 2023. 4. 30.

AIDE(Artificial Intelligence Data Expert)은 '데이터 라벨러'의 전문성을 인증하기 위한 자격증입니다. AIDE 2급은 인공지능의 기초 이론과 전문 데이터 라벨러로서 능력을 인증받기 위한 자격증으로 '인공지능데이터전문가 2급'이라고도 합니다. AIDE 2급 자격증 취득을 위한 기출 예상 이론만 공부하여 정리하겠습니다. 꼼꼼하게 공부하면 이론 부분은 충분히 합격하실 수 있을 것입니다!

이번 포스팅에서는 AIDE 2급 기출 예상 이론 중 '[1] 4차 산업과 인공지능, [2] 인공지능 서비스, [3] 인공지능의 원리, [4] 인공지능의 장법론(인공지능의 분류), [5] 빅데이터'에 대해 정리해 보겠습니다.

 

 

<목차>
[1] 4차 산업과 인공지능
[2] 인공지능 서비스
[3] 인공지능의 원리
[4] 인공지능의 장법론(인공지능의 분류)
[5] 빅데이터

 

 

[1] 4차 산업과 인공지능

 

1. 4차 산업혁명 : 인공지능( AI )과 정보(빅데이터)의 발전을 통한 산업혁명

· 4차 산업혁명 : 21C 초~, 인공지능, 빅데이터, 사물인터넷, 3D프린팅, 로봇, 공유경제, 드론

· 19~20C 초 : 전기에너지, 대량생산혁명

· 3차 산업혁명 : 20C 후반 컴퓨터, 인터넷, 지식정보혁명

 

 

 

[2] 인공지능 서비스

 

2. 인공지능 서비스 개발의 4단계

⓵데이터 획득 ➞ ( ⓶데이터 가공(전처리) ) ➞ ⓷모델생성 ➞ ⓸서비스 개발(API 개발)

 

3. 데이터 획득

IoT, Mobile, M2M(Machine To Machine)을 통한 데이터(이미지, 영상, 텍스트 등) 수집 과정

 

4. M2M

· M2M(Machine To Machine)이란 IoT사물(지능) 통신을 의미. 기계간의 통신 및 사람이 조작하는 디바이스와 기계간의 통신. 인간의 개입 없는 무인화, 지능화 서비스

· 인공지능서비스 개발 단계 중 ( 데이터 획득 )에 해당

 

5. 데이터 가공(전처리)

· 수집된 데이터를 인공 지능이 학습할 수 있는 형태의 데이터로 변화시켜주는 과정

· 데이터 가공 작업 : ⓵데이터 라벨링, ⓶구분·선별, ⓷포맷변경, ⓸결합·변형

· 인공지능이 학습할 수 있는 형태로 데이터를 만드는 작업을 ( 데이터 라벨링 )이라고 함

· 데이터를 가공하는 작업은 ( ⓵데이터 라벨링 )과 데이터를 ⓶구분·선별하고 데이터 ⓷포맷을 변경하는 과정, 데이터의 ⓸결합·변형 등 과정을 거쳐서 데이터를 가공

 

6. 모델 생성

· 인공지능 모델 생성 과정 : ⓵모델개발 ➞ ⓶데이터입력⓷데이터학습 ➞ ⓸모델수정 (반복)

 

7 머신러닝(Machine Leaning, ML)

· 지능형 에이전트, 행동협업지능, 추론 지식표현, 상황감정이해, 시각언어, 청각기능을 활용하는 모델

· 머신러닝(ML) 학습 종류 (3가지) : 지도학습, 비지도학습, 강화학습

 

8. 인공지능 발전 : 1단계(AI 개념) ➞ 2단계(전문가시스템) ➞ 3단계(머신러닝, 딥러닝)

· 1차 AI붐(AI 개념)

- 1960-1970년대, 앨련 튜링(인공지능의 아버지)이 인공지능 제기

- 인공지능의 시작, 기계가 생각할 수 있는지 테스트하는 방법, 지능적 기계의 개발 가능성 연구

 

· 2차 AI붐(전문가 시스템)

- 1980년-1990년대, 전문가가 지식을 입력 & 규칙을 만들어 동작하는 시스템

- 문제 : 수백개의 소규모 시스템 만들어짐-비효율적, 대규모 시스템-개발비, 유지비가 높음

 

· 3차 AI붐(머신러닝, 딥러닝)

- 2000년대 초반~, 컴퓨터가 스스로 학습

- AI의 진화 (머신러닝과 딥러닝을 이용한 빅데이터 및 데이터 처리 기술 확산)

 

 

 

[3] 인공지능의 원리

 

9. 인공지능(AI)

사람의 뇌를 흉내 내는 ( 인공신경망 )과 다양한 ( 머신러닝 ) 알고리즘을 통해 구현

 

10. 퍼셉트론 (Perceptron)

· 사람의 뉴런 구조를 컴퓨터로 그대로 구현하여 만든 컴퓨터 프로그램

· 1957년 ( 프랑크 로젠블라트 )가 고안한 알고리즘

· 신경망(딥러닝)의 기원이 되는 알고리즘

 

11. 인공신경망 (ANN: Artificial Neural Network)

· 생물학의 신경망에서 영감을 얻은 학습 알고리즘

· 신경망(인공신경망)은 ( 입력층 ), ( 은닉층 ), ( 출력층 )으로 구성

 

⓵ 입력층(input layer) : 학습하고 데이터를 입력하는 층

⓶ 은닉층(hidden layer) : 입력된 데이터를 여러 단계로 처리하는 층

⓷ 출력층(output layer) : 처리된 결과를 출력하는 층

 

 

 

[4] 인공지능의 장법론(인공지능의 분류)

 

12. 인공지능(AI), 머신러닝(ML), 딥러닝(DL)

· 인공지능(Artificial Intelligence, AI) : 인간의 지적능력을 컴퓨터를 통해 구현하는 단계 (최종목적)

· 머신러닝(Machine Learning, ML) : 스스로 학습하여 인공지능 성능을 향상. 데이터의 여러 특징을 사람이 직접 분석/판단

· 딥러닝(Deep Learning, DL) : 인간의 뉴런과 비슷한 인공신경망을 기반으로 기계를 학습하는 기술, 머신러닝의 한계를 넘어서는 기술, 기계가 자동으로 학습하여 데이터에서 특징 추출

· 머신러닝과 딥러닝의 차이? 기계의 자기학습여부

 

13. 머신러닝의 학습방법

· 머신러닝의 학습 방법에는 ( 지도학습 ), ( 비지도학습 ), ( 강화학습 )이 있음

지도학습(Supervised Learning) : 문제와 정답과 답을 알려주고 학습. (예측, 분류, 회귀), 가장 중요. but 많은 시간과 비용

비지도학습(Unsupervised Learning) : 답을 가르쳐주지 않고 학습 (연관규칙, 군집)

강화학습 (Reinforcement Learning) : 보상을 통해 학습하는 방식 (보상)

※ 머신러닝 학습방법 3가지 중, 딥러닝은 어디에 해당? 지도학습

 

 

[5] 빅데이터

 

14. 빅데이터(Big Data)

· 대량의 정형, 비정형 데이터로부터 가치를 추출하는 기술

· 기존의 정형데이터에서 비정형데이터로 대량의 데이터 발생

 

15. 빅데이터 3V

규모(Volume) : 데이터 양의 증가, 수십테라규모, 레코드, 트랙젝션

속도(Velocity) : 실시간처리, 실시간분석, 스트림

다양성(Variety) : 데이터의 다양성, 정형데이터, 비정형데이터, 반정형데이터

 

※ 빅데이터 4V

규모(Volume)

속도(Velocity)

다양성(Variety)

+ 정확성(Veracity)

 

※ 빅데이터 5V

규모(Volume)

속도(Velocity)

다양성(Variety)

정확성(Veracity)

+ 가치(Value)

 

16. 데이터의 종류

정형(Structure) 데이터

· 구조화된 데이터, 고정된 필드에 저장된 데이터. ex) 데이터베이스, 엑셀, CSV, 수치화 가능 데이터

 

반정형(Semi-Structured) 데이터

· 고정된 필드는 아니지만 스키마를 포함, 연산불가. ex) XML, HTML, JSON 등

 

비정형(Unstructured 데이터

· 고정되지 않은 데이터, 연산불가, 형태없음. ex) 소셜데이터, 영상, 음성, 이미지

 

* 인공지능의 성능 향상을 위해서는 양질의 ( 데이터 )가 충분히 제공되어야 함

 

17. 데이터 라벨링(Data Labeling)

· 인공지능 모델 학습을 위해 기계가 학습할 수 있는 형태로 데이터를 가공하는 것

 

18. 데이터셋(Dataset)

· 인공지능 학습을 위해 필요한 데이터를 관련성 있게 모아 놓은 자료의 집합

· (원천 데이터)와 (라벨링 데이터)를 모아놓은 자료의 집합

· 인공지능 학습에 필요한 데이터는 ( 라벨링 ) 작업을 통해, 원천 데이터와 함께 ( 데이터셋 ) 형태로 제공

 

19. 학습용 데이터 구축 과정 : 수집 ➞ 정제 ➞ 라벨링 ➞ 검수

 

20. 데이터 수집

· 작업 대상과 기준에 맞도록 사진, 영상을 촬영하여 업로드, 음성을 녹음하여 바로 업로드 하는 형태

 

21. 데이터 정제

· 인공지능이 학습할 수 있는 형태로 바꿔주는 과정

· 데이터의 오류 제거, 필요한 형식이나 크기에 맞게 변형, 불필요한 데이터 제거, 개인정보 비식별화 처리

 

22. 데이터 라벨링

· 수집한 데이터에서 의미있는 데이터를 찾아 각각의 위치, 크기, 대상에 대한 정보 등을 달아주는 작업

 

23. 데이터 검수

· 데이터에 잘못된 라벨이 부작되어 있을 경우 잘못된 학습 결과 발생, 올바른 학습과 좋은 품질의 학습 데이터를 위해 꼭 필요한 작업

 

 

 

 

 

다음 포스팅에서는 AIDE 2급 기출 예상의 나머지 이론인 '[6] 유형별 데이터 라벨링 방법, [7] 인공지능 알고리즘, [8] 인공지능 객채검출 방법, [9] 핵심 딥러닝 알고리즘'에 대해 알아보겠습니다.

 내용이 궁긍하시다면 아래 글을 클릭해 주세요!

 

2023.05.02 - [IT 정보 꿀팁] - AIDE 2급 기출 예상 이론 정리 ② (데이러 라벨링 자격증 시험 준비)

 

AIDE 2급 기출 예상 이론 정리 ② (데이러 라벨링 자격증 시험 준비)

AIDE 2급은 인공지능의 기초 이론과 전문 데이터 라벨러로서 능력을 인증받기 위한 자격증으로 '인공지능데이터전문가 2급'이라고도 합니다. AIDE 2급 자격증 취득을 위한 기출 예상 이론만 공부하

young23.linkwe.kr

 

 

 

AIDE 1급 자격증 기출 예상 이론 정리도 확인해 보세요!

2023.02.27 - [IT 정보 꿀팁] - AIDE 1급 자격증 기출 예상 이론 정리 (데이러 라벨링 자격증 시험 준비)

 

AIDE 1급 자격증 기출 예상 이론 정리 (데이러 라벨링 자격증 시험 준비)

인공지능(AI) 시대, 인공지능이 보다 정확하고 숙력된 기술을 학습할 수 있기 위해서는 '데이터 라벨링' 작업이 정말 중요합니다. 데이터 라벨링의 중요성이 커지면서 '데이터 라벨러'의 전문성

young23.linkwe.kr

 

 

 

 데이터 라벨러 입장에서 정의한 데이터 라벨링의 개념 - '데이터 라벨링(Data Labeling)이 뭔가요?'

2023.03.16 - [IT 정보 꿀팁] - 데이터 라벨링(Data Labeling)이 뭔가요?

 

데이터 라벨링(Data Labeling)이 뭔가요?

'정말 시대가 변하고 있구나, 다른 세상이 오는구나.' 데이터 라벨링(Data Labeling)을 처음 알았을 때 들었던 생각입니다. 생소하기도 하면서 다른 세계가 열렸는데도 '나는 우물 안 개구리처럼 사

young23.linkwe.kr

 

 

 

 

댓글