DX과정은 조직 내 데이터를 활용해서 새로운 기술과 결합하고 유의미한 전략과 결정을 내리도록 돕는 과정이다.
그렇기에 데이터를 정제하고 유의미한 결과를 도출하여 시각화 하는 능력이 중요하다.
현업 DX 파트에서 종사하는 지인에게 물어보니 실무에서 이런 업무를 수행하기 위해서는 기본적인 코딩능력 외에도 전처리되지 않은 자료를 수집하거나, 시각화시켜서 팀원과 협업하는 등의 작업이 더욱 중요할 수 있다고 한다.
예전에 잠깐 들었던 빅데이터 수업에서는 대부분 코딩 수업만을 진행했는데, 에이블스쿨에서는 다행히 실제 사용 가능한 통계, 발표스킬, 비정형 자료 전처리 과정 등의 수업도 진행하는 것 같다.
1. Data Science란 무엇인가?
다양한 산업체의 빅데이터를 가공하고, 분석하고, 활용하는 것을 말한다.
Data Scientist와 더불어 최근 Citizen Data Scientist라는 새로운 용어가 등장했다고 하는데, 크게 복잡한 개념은 아니고 특정 분야의 정보 소화력이 뛰어난 사람이라기 보다 일반 Data Scientist를 일컫는 개념인 듯 하다.
(특정 도메인 내 빅데이터를 활용하고 본인의 비즈니스 영역 결과를 개선한다는 설명이 있다.)
결국, 데이터를 기반으로 새로운 인사이트를 도출해내는 것이 데이터 사이언스라고 할 수 있겠다.
2. Data Science 발전 과정
6V로 나타낼 수 있다.
- Technology, Hardware, Infra관점에서는
Volume(크기) = 데이터의 방대한 양
Veloocity(속도) = 일반적으로 분석하기만 했던 데이터를 실시간으로 처리하는 과정
Variety(다양성) = 정형, 비정형, 반정형 데이터를 취급
- Business, Software, Analytics관점에서는
Veracity(진실성) = 수집하고 가공한 데이터들의 신뢰성
Value(가치) = 궁극적인 비즈니스 가치창출
Visualization(시각화) = 복잡한 결과의 시각화 표현
으로 말이다.
이는 과거 내부&정형&정적 데이터만 활용하던 방법에서 새로운 AI 기반 환경에서 개발하게 되며 발전하게 된 것으로, 향후 머신러닝과 딥러닝을 통해 학습 할 계획이다.
3. 상세 분석 프로세스
1) 분석 전문가의 분석 준비(경영진 및 실무자의 요구사항 수집)
2) AS-IS 분석 = 어느 정보를 분석할지 전략 수립
TO-BE 도출 = 주제별 포인트와 방향성을 분석
3) 분석 대상 수집 및 처리 = 데이터를 정의한다(주제별 데이터 정의와 데이터 품질 및 체크)
탐색적 데이터 분석 = 주제별 EDA수령 & 유의미한 인사이트를 도출한다.
고극 데이터 분석 = 최종 타겟 모델을 개발한다(모델 적합성 검증 및 시각화)
[이후 상세 분석 프로세스의 반복을 통해서 결과에 기반한 활용방안을 제안한다.]
대략 정리해보니 코딩능력은 기본이고 특정한 정보를 다룰 수 있는 시야를 넓히는 것이 중요한 것 같다. 에이블스쿨에서는 3번 과정 상세 분석 프로젝트를 상세하게 다룰 예정이라고 한다.
수업자료를 그대로 가져오는건 저작권에 걸릴 것 같아 나름 정리를 해봤는데 오히려 도움이 될지도 모르겠다는 생각이 든다.
물론, 아직 블로그를 꾸미는건 많이 힘들다.
'AIVLE_School' 카테고리의 다른 글
에이블스쿨 DX커리큘럼 - 데이터 전처리 (0) | 2023.03.28 |
---|---|
에이블스쿨 DX커리큘럼 - DataFrame 수정 (0) | 2023.03.28 |
에이블스쿨 DX커리큘럼 - Pandas (0) | 2023.03.10 |
에이블스쿨 DX커리큘럼 - 1주차 정리 (0) | 2023.02.21 |
AIVLE SCHOOL - DX커리큘럼 합격 후기(뒷뒷뒷북.ver) (2) | 2023.02.21 |