TIL (Today I Learn)

TIL [내배캠] 1일차

dataguard 2025. 2. 17. 21:46

본 캠프를 시작하는 첫 날이니만큼, 미리 세워놨던 계획대로 진행했다.

ADsP 시험을 5일 밖에 남겨두지 않은 시점에서, 이제는 다른 곳에 한눈을 팔 여유가 없다.

팀 스터디에 관한 것들을 어느 정도 정리해두고, 바로 ADsP 강의를 듣기 시작했다.

 

 

 

두달 전에 한번 훑고 지나간 적이 있지만, 시험을 앞둔 이 시점에서 암기과목이라 할 수 있는,

1과목과 2과목은 다시금 짚어줄 필요가 있었다.

 

 

 

 

 

오늘은 일단, 1과목을 다 훑는 데까진 성공했다.

이 강의의 숙제가 빈 종이에 이해한 것들을 쭉 써내려 가는 느낌이라, 기억을 되살리기에 좋다.

 

 

 


 

 

 

 

데이터란 저장되기 쉬운 형태로 가공된 정보를 의미하고,

성질을 띄고 있는 정성적 데이터, 숫자의 정보를 가지고 있는 정량적 데이터가 있다.

데이터를 정리하는 틀과 연산의 가능성 유무를 가지고, 정형 데이터·비정형 데이터·반정형 데이터로 나눌 수 있다.

개인이 터특한 공유되지 않은 정보를 암묵지, 그것을 정형화 시켜서 글이나 책자 등으로 제작 배포 하면 형식지가 된다.

데이터의 발전과정인 DIKW는 데이터 > 정보 > 지식 > 지혜 순으로 진행된다.

 

 

DB(데이터베이스)는 데이터들을 체계적으로 수집·축적한 집합체를 말하며, DBMS는 그것을 다루는 소프트웨어를 말한다.

RDB는 데이터 간의 관계를 나타내는 테이블 형식의 데이터베이스 이며, SQL 이 대표적이다.

No-SQL은 SQL이 아닌 형태의 데이터베이스를 의미하며, 비정형 데이터와 대용량 데이터에 주로 사용된다.

데이터 베이스의 특징으로는 통합성, 저장성, 공용성, 변화성 등이 있다.

데이터 베이스가 활용된 시스템 종류에는 OLTP, OLAP, CRM, SCM, BI, ERP, RTE, EAI, EDW 등이 있다.

 

 

빅데이터는 일반적인 범위를 넘어서는 규모의 데이터이다.

가트너 그룹의 더 그래니의 3V 정의에 따르면, Volume / Variety / Velocity 이다.

빅데이터의 출연 배경으로는 고객 데이터 축적, 거대 데이터 활용 과학 확산, 기술의 발달 등이 있다.

빅데이터는 '산업혁명의 철, 석탄' , '21세기의 석유' , '생물학의 렌즈', '플랫폼'에 비유된다.

빅데이터의 등장 이후로, 사전처리→사후처리, 표본조사→전수조사, 질→, 인과분석→상관분석으로 변화하고 있다.

빅데이터는 데이터를 활용하는 방식이 다양해 활용법 파악이 힘들고, 기존에 없던 새로운 가치를 창출하고,

새로운 분석기법의 발전으로 인해서 가치가 없던 데이터도 중요도가 올라갈 수 있기에, 가치산정이 어렵다.

빅데이터로 인해서, 생활이 전반적으로 스마트화 된다.

빅데이터 활용에 필요한 3요소는 데이터, 기술, 인력 이다.

빅데이터 활용 기본 테크닉으로는

'연관 규칙 학습', '유형 분석', '유전 알고리즘', '머신러닝', '회귀 분석', '감정 분석', '사회관계망 분석'이 있다.

빅데이터의 위기요인으로는 사생활 침해, 책임 원칙 훼손, 데이터 오용 등이 있다.

위기요인 통제방안으로는 동의에서 책임으로, 결과 기반 책임 원칙 고수, 알고리즘 접근권 허용/인증 등이 있다.

빅데이터를 분석 시에 중요한 것은, 데이터의 양이 아니라 데이터에서 찾아내는 인사이트이다.

데이터 사이언티스트의 핵심 구성요소로는 분석적 영역, IT 영역, 비즈니스 영역이 있다.(하드스킬 / 소프트스킬)

 

 

 

오늘 배운 내용들을 다시금 복습해봤다.

암기가 필요한 과목이니 만큼, 반복학습으로 머리에 새겨야겠다.

 

 

'TIL (Today I Learn)' 카테고리의 다른 글

TIL [내배캠] 3일차  (0) 2025.02.19
TIL [내배캠] 2일차  (0) 2025.02.18
TIL [사전캠프] 5일차  (0) 2025.02.14
TIL [사전캠프] 4일차  (0) 2025.02.13
TIL [사전캠프] 3일차  (0) 2025.02.12