일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 방화벽
- HTTP
- SQL 테이블 삭제
- AWS
- dns
- batch
- 배치파일
- SQL
- Data Analysis
- 맵차트
- Network
- Linear models
- MySQL
- https
- map차트
- 클라우드
- 테이블만들기
- SSL
- tableau
- 파이썬
- 하드웨어
- 날짜 함수
- SSO
- 태블로
- SSO인증
- >>
- 색상코드
- SAML
- 선형회귀
- Today
- Total
목록Data analysis (5)
SeaForest

빅데이터를 지탱하는 기술 리뷰 (1) 데이터 분야에서 너무 유명하기도 하고 추천도 받아서 이 책을 읽게 되었다. 데이터 엔지니어로 일을 하고 있는건 아니지만 데이터 엔지니어쪽 공부를 하고 싶다는 생각을 항상 하고 있었기에 seaforest76.tistory.com 3. 빅데이터의 분산 처리 3-1. 대규모 분산 처리의 프레임워크 구조화 데이터와 비구조화 데이터 스키마 : 테이블의 컬럼 명과 데이터형, 테이블 간의 관계 구조화된 데이터 : 스키마가 명확하게 정의된 데이터 ex. 테이블 비구조화 데이터 : 스키마가 없는 데이터 ex. 텍스트 데이터, 이미지 등 Hadoop 분산 데이터 처리의 공통 플랫폼 단일 소프트웨어가 아니라 분산 시스템을 구성하는 다수의 소프트웨어로 이루어진 집합체 기본 구성 요소 HD..

데이터 분야에서 너무 유명하기도 하고 추천도 받아서 이 책을 읽게 되었다. 데이터 엔지니어로 일을 하고 있는건 아니지만 데이터 엔지니어쪽 공부를 하고 싶다는 생각을 항상 하고 있었기에 이 책을 바로 읽게 되었다. 0. 들어가기 전 주제 : 자동화된 데이터 처리 ('데이터 활용 방법' 보다는 '데이터 처리 시스템화') 데이터를 이용하는 목적 (이 책에서는 2가지만 언급) 비즈니스 인텔리전스 : 기업의 업적 등을 수집해서 경영상의 의사결정에 도움 데이터 마이닝 : 통계 분석과 머신러닝 등의 알고리즘을 사용하여 데이터로부터 가치 있는 정보 발견 1. 빅데이터의 기초 지식 1-1. [배경] 빅데이터의 정착 빅데이터의 취급이 어려운 이유 데이터의 분석 방법을 모름 데이터 처리에 수고와 시간이 걸림 Hadoop 다..

'데이터 분석을 하는 실무자들이 참고하면 좋은 추천 도서 모음' 을 통해 이 책을 접하게 되었고, 평상시에 데이터 분석은 어떻게 해야 하는지에 대해 궁금했었기에 이 책을 선택해서 읽게 되었다. https://lbm.oopy.io/data-link-book-list 데이터 분석을 하는 실무자들이 참고하면 좋은 링크, 추천 도서 모음 (23.05.17 업데이트) lbm.oopy.io ■ 데이터 문해력이란 스스로 정답에 대해 고민하고 데이터를 무기로 합리적으로 결론을 도출하고 논하는 능력 → 데이터에서 찾아낸 인사이트를 자신의 결론으로 이끄는 이야기로 만드는 능력 ■ 올바른 데이터 분석의 최종 결론 '데이터를 활용한다'란 '결과'가 아니라 '결론'을 도출하는 것 결과 결론 XXX와 YYY는 차이가 있습니다. ..

1. Linear Models(=선형 회귀)란? - 종속변수 y와 독립변수 x와의 선형 상관관계를 모델링하는 회귀분석 기법 - 단순선형회귀 : 한개의 독립변수에 기반한 경우 - 다중선형회귀 : 둘 이상의 독립변수에 기반한 경우 2. OLS(=최소자승법,Ordinary Linear Squares)란? - 오차를 최소화 시키는 방법으로 회귀 계수를 추정하는 기법 3. R-squared (=결정계수) - 독립변수가 종속변수를 얼마만큼 설명해 주는지를 가리키는 지표 - 결정계수가 높을수록 독립변수가 종속변수를 많이 설명한다는 의미 - 독립변수의 수가 증가하면 상승함 >> 그래서 종속변수를 잘 설명하지 못하는 독립변수가 추가되면, 독립변수의 수가 증가해서 결정계수도 같이 증가하기 때문에 결정계수 만으로는 회귀모델..
항공 통계 > https://www.airportal.go.kr/knowledge/statsnew/main.jsp# KT 통신 빅데이터 플랫폼 > https://bdp.kt.co.kr/invoke/SOKBP0000/ 서울시 공공데이터 > http://data.seoul.go.kr/dataList/datasetList.do 캐글(kaggle) > https://www.kaggle.com/ data.world > https://data.world/makeovermonday?entryTypeLabel=dataset&tab=resources 통계청 > https://kosis.kr/index/index.do e-나라지표 > https://www.index.go.kr/main.do 기상자료개방포털 > https:..