'데이터분석준전문가' 태그의 글 목록 (2 Page)
본문 바로가기
728x90

데이터분석준전문가8

[데이터 분석 준전문가 ADsP] R과 R 스튜디오 1. R 1.1 다른 데이터 분석 도구와의 비교 R SAS SPSS 비용 무료 (오픈소스) 유료 (고가) 유료 (고가) 용량 저용량 고용량 고용량 모듈 지원 여부 X X O 최근 알고리즘 및 기술 반영 매우 빠름 느림 다소 느림 학습 자료 무료 자료 공개 유료 자료 위주 유료 자료 위주 커뮤니티 O X X 1.2 R의 특징 1) 오픈소스 프로그램으로 커뮤니티가 공개이며 패키지가 수시로 업데이트 된다. 2) 프로그램의 기능이 다양한 방면으로 상용 프로그램과 동등하거나 뛰어나다. 3) 세션마다 데이터가 시스템에 저장되므로 매번 데이터를 로딩할 필요가 없고 명령어도 저장 가능하다. 4) 모든 운영체제에서 사용 가능하다. (윈도우, 맥, 리눅스) 5) 통계 전문가들 사시에서 사실상 표준 플랫폼이다. 6) 객체지.. 2023. 1. 3.
[데이터 분석 준전문가 ADsP] 데이터과 빅데이터 관련 기술 1. 데이터 관련 기술 1.1 개인정보 비식별 기술 데이터셋에서 개인을 식별할 수 있는 요소의 전부 또는 일부를 삭제, 대체 등을 하는 기술을 말한다. 1) 데이터 마스킹 -데이터의 길이, 유형, 형식과 같은 속성을 유지한 상태로 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술이다. -예: 홍길동, 20세, 서울 거주, 서울대 재학 → 홍**, **세, ** 거주, **대 재학 2) 가명처리 -개인정보 주체의 이름을 다른 이름으로 변경하는 기술이다. 이 때, 일정한 규칙이 노출되지 않도록 주의해야 한다. -예: 홍길동, 20세, 서울 거주, 서울대 재학 → 임꺽정, 19세, 서울 거주, 국내대 재학 3) 총계처리 -데이터의 총합 값을 보여줌으로서 개별 데이터의 값을 노출하지 않도록 하는 기술이다. 이 .. 2022. 3. 18.
[데이터 분석 준전문가 ADsP] DBMS와 SQL 1. DBMS (Data Base Management System) 1.1 정의 DBMS는 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어다. 데이터 검색을 효율적으로 할 수 있게 하며 저장 기능 등을 제공한다. 예로는 액세스, 익포믹스, 오라클이 있다. 1.2 종류 1) 관계형 DBMS 데이터를 행과 열을 이루는 하나 이상의 테이블로 정리하며 고유키가 각 행을 식별한다. -테이블은 하나의 엔티티를 대표한다. -행은 레코드 또는 튜플로 부르며 엔티티 종류의 인스턴스를 대표한다. -열은 인스턴스의 속성이 되는 값들을 대표한다. 2) 객체지향 DBMS 정보를 객체 형태로 표현한다. 관계형 DBMS 객체지향 DBMS 테이블 클래스 행 객체 테이블 정의.. 2022. 3. 17.
[데이터 분석 준전문가 ADsP] 데이터 사이언스와 전략 인사이트 1. 빅데이터에 대한 열풍이 있으나 회의론도 있다. 1.1 회의론 이유 1) 과거의 부정적 학습효과: 도입하면 모든 문제를 한 번에 해결할 거라 기대했으나, 거액 투자에도 불구하고 활용 및 가치 창출 방법을 잘 알지 못했다. 2) 성공 사례이라 해도 기존 분석 프로젝트가 포함되어 있음: 빅데이터 분석이 필요없었거나 성공을 빅데이터 분석 덕분으로 생각했다. 그러므로 빅데이터에 포커스를 두지 말고, 데이터 분석을 통한 가치/통찰/인사이트 창출에 집중해야 한다. 2. 일차원적 분석이 아닌 전략도출을 위한 가치기반 분석이 필요하다. 또한 단순히 분석을 많이 사용하는 '일차원적 분석'이 아닌, 전략적인 통찰력을 가지고 핵심 비즈니스 이슈에 집중한 '전략도출을 위한 가치기반 분석'이 필요하다. 2.1 일차원적 분석.. 2022. 3. 12.
728x90