카테고리 없음

adsp 1

jojoon2786 2024. 9. 30. 21:16

1. 데이터의 특성

  • 존재적 특성 + 당위적 특성
  1. 존재적 특성 : 있는 그대로의 객관적 사실
  2. 당위적 특성 - 추론, 예측, 전망, 추정을 위한 근거
  • 데이터는 축적되어 사용되며, 객관적 사실로서의 개별 데이터는 중요하지 않음

2. 데이터의 유형

  • 정성데이터 : 언어, 문자 등으로 표현
  • 정량데이터 : 수치, 기호, 도형으로 표시
  1. 정형(structured) 데이터 - 고정된 틀이 있으며 연산이 가능 (ex CSV, 엑셀 등)
  2. 비정형(unstructured) 데이터 - 고정된 틀이 없으며 연산이 불가능 (ex 영상, 음성 등)
  3. 반정형(semi - structured) 데이터 - 고정된 틀을 가지고 있지만 연산이 불가능 (ex HTML, JSON 등)

암묵지와 형식지

  • 지식을 구분하는 방법중에는 대표적으로 '암묵지', '형식지'가 있음.

암묵지란 ?

→ 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식

→ 외부로 표출되지 않기 때문에 공유와 전달의 어려움이 있음

 

형식지란 ?

→ 교과서, 메뉴얼 등 형상화된 지식

→ 문서처럼 형식화되어 있기에 공유와 전달에 용이

 

 

DIKW 피라미드

  • 데이터에서 지혜를 얻어내는 과정을 계층구조로 설명

→ 데이터(Data) : 존재형식을 불문하고 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호를 의미

→ 정보(Information) : 데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터

→ 지식(Knowledge) : 상호 연결된 정보 패턴을 이해하여 이를 토대로 추론한 것

→ 지혜(Wisdom) : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어 (예측)

 

 

3. 데이터베이스

DB vs DBMS

  • DB : 필요로 하는 정보를 체계적으로 수집/축적하여 제공하는 정보의 집합체
  • DBMS : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어

데이터베이스의 종류

  • 데이터베이스 종류에는 계층형, 네트워크형, 관계형, NoSQL 등이 있음

관계형 데이터베이스(Relational Database) - 표형태

  • 데이터를 행과 열로 표현된 표형식으로 저장하며 데이터 간의 관계를 나타내는 테이블을 사용
  • 관계형 데이터베이스는 SQL을 사용하여 데이터를 조작하고 검색
  • Oracle, MySQL, MariaDB, SQLite, Postgresql 등

→ 비관계형 데이터베이스(NoSQL)

  • Not Only SQL 또는 Non-SQL 의 약자로, 관계형 데이터베이스가 아닌 다른 형태의 데이터베이스 관리 시스템을 나타내는 용어
  • 관계형 데이터베이스와는 다른 데이터 모델과 기술을 사용하여 데이터를 저장, 검색 및 관리
  • 비정형 데이터와 대용량의 데이터 분석 및 분산 처리에 용이
  • MongoDB, ElasticSearch, Redis, Dynamo 등

데이터베이스의 일반적인 특징

 

통합된 데이터(Integrated data)

  • 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미
  • 데이터 중복은 관리상의 복잡한 부작용을 초래

저장된 데이터(stored data)

  • 컴퓨터 기술을 바탕으로 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미

공용 데이터(shared data)

  • 다수의 사용자가 다양한 목적으로 데이터를 이용한다는 것을 의미
  • 대용량화되고 구조가 복잡한 것이 일반적

변화되는 데이터(changable data)

  • 데이터의 삽입, 삭제, 갱신으로 변화하면서도 항상 정확한 데이터 상태를 유지

데이터베이스의 다양한 측면에서의 특징

 

1. 정보의 축적 및 전달 측면

→ 기계가독성 : 대량의 정보를 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있음

→ 검색가능성 : 다양한 방법으로 필요한 정보를 검색 가능

→ 원격조작성 : 정보통신망을 통해 원거리에서도 온라인 이용 가능

 

2. 정보 이용 측면(유저 측면)

다양한 정보를 신속하게 획득

→ 원하는 정보를 정확하고 경제적으로 찾아낼 수 있음

 

3. 정보 관리 측면

→ 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신에 용이

 

4. 정보기술 발전의 측면

→ 정보처리 기술 발전을 견인할 수 있다

 

5. 경제, 산업적 측면

→ 다양한 정보를 필요에 따라 신속하게 제공하고 이용할 수 있는 인프라의 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 제고하고 국민의 편의를 증진하는 수단으로서의 의미를 가진다

 

기업 내부 데이터베이스

1. OLTP (Online Transaction Processing) : 정보시스템

→ 데이터베이스의 데이터를 수시로 갱신하는 프로세싱
→ 데이터 갱신 위주

 

2. OLAP (Online Analytical Processing) : 분석 중심의 시스템
→ 데이터 조회 위주 -> 모아둔 데이터에 초점
ex 복잡한 데이터를 분석하여 제품의 판매 추이, 구매 성향 파악 등을 프로세싱

 

*OLTP --> OLAP 추세

 

참고)

CRM(Consumer Relationship Management, 고객관계 관리) : 고객의 구매이력을 분석하여 고객에 대한 이해도를 높여 그를 바탕으로 마케팅
ERP(Enterprise Resource Planning) : 기업이 보유한 자원을 효율적인 활용과 분배를 위한 목적