Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- SSL
- SSO인증
- SQL 테이블 삭제
- HTTP
- Linear models
- 색상코드
- 파이썬
- SSO
- 테이블만들기
- Network
- 태블로
- https
- AWS
- 클라우드
- >>
- SAML
- 방화벽
- 하드웨어
- dns
- map차트
- 선형회귀
- batch
- SQL
- 배치파일
- 맵차트
- Data Analysis
- tableau
- MySQL
- 날짜 함수
Archives
- Today
- Total
SeaForest
[Data Analysis] Linear Models, 선형 회귀 모델 본문
1. Linear Models(=선형 회귀)란?
- 종속변수 y와 독립변수 x와의 선형 상관관계를 모델링하는 회귀분석 기법
- 단순선형회귀 : 한개의 독립변수에 기반한 경우
- 다중선형회귀 : 둘 이상의 독립변수에 기반한 경우
2. OLS(=최소자승법,Ordinary Linear Squares)란?
- 오차를 최소화 시키는 방법으로 회귀 계수를 추정하는 기법

3. R-squared (=결정계수)
- 독립변수가 종속변수를 얼마만큼 설명해 주는지를 가리키는 지표
- 결정계수가 높을수록 독립변수가 종속변수를 많이 설명한다는 의미
- 독립변수의 수가 증가하면 상승함
>> 그래서 종속변수를 잘 설명하지 못하는 독립변수가 추가되면, 독립변수의 수가 증가해서 결정계수도 같이 증가하기 때문에 결정계수 만으로는 회귀모델의 유용성을 판단하기에는 문제가 있음
4. Overfitting (=과적합)

- 변수를 너무 많이 추가하여 정확도가 떨어지거나 부적절한 회귀 모형을 만드는 경우
- 너무 복잡한 모델을 생성하는 바람에 학습 데이터에는 잘 맞지만 새로운 데이터에는 잘 맞지 않는 현상
- overfitting을 피하기 위해서는 계수에 대한 표준 오차를 확인해야함
- 작은 표준오차는 모형을 추정하기에 충분한 데이터가 있음을 의미함
'Data analysis' 카테고리의 다른 글
빅데이터를 지탱하는 기술 리뷰 (2) (0) | 2024.03.03 |
---|---|
빅데이터를 지탱하는 기술 리뷰 (1) (0) | 2023.07.02 |
빅데이터 시대, 성과를 이끌어내는 데이터 문해력 리뷰 (0) | 2023.06.16 |
[Data] 데이터 제공 사이트 리스트 (0) | 2022.01.01 |