전체 글 (28) 썸네일형 리스트형 [ section1 - 2 / 통계(Statistics) ] 3. 샘플링 방법의 종류 ※ 여러가지 샘플링 방법 1. Simple Random Sampling 모집단에서 sampling을 무작위로 하는 방법 2. Systematic Sampling 모집단에서 sampling을 할 때 규칙을 가지고 추출하는 방법 ex) 1, 6, 11, 16, ... 번째의 데이터를 선택 3. Stratified Random Sampling 모집단을 미리 여러 그룹으로 나누고, 그 그룹별로 무작위 추출을 수행하는 방법 ex) 여론 조사를 위해 사람을 나이대 별로 나누고, 해당 그룹안에서 무작위 추출 4. Cluster Sampling 모집단을 미리 여러 그룹으로 나누고, 이후 특정 그룹을 무작위로 선택하는 방법 [ section1 - 2 / 통계(Statistics) ] 4. NumPy 난수 생성 (무작위 추출/Random 모듈) # np.random.rand() : 무작위 샘플 추출(난수 생성)을 위한 메서드 낮은 (포함)에서 높은 (제외) 까지 임의의 정수를 반환 NumPy 패키지의 random 모듈 (numpy.random)에 대해 소개합니다. random 모듈의 다양한 함수를 사용해서 특정 범위, 개수, 형태를 갖는 난수 생성에 활용할 수 있습니다. import numpy as np v = np.random.randint(0, 100, 20) pd.DataFrame(v).describe() >>> Population Parameter Statistic Estimator Standard Deviation Standard Error https://codetorial.net/numpy/random.html 참고해서 마저적기 df.describe() : 데이터 요약을 위한 메서드 # df.describe() : 데이터 요약을 위한 메서드 DataFrame.describe(percentiles=None, include=None, exclude=None, datetime_is_numeric=False) - 기술 통계에는 NaN값을 제외 / 데이터 세트 분포의 중심 경향, 분산 및 모양을 요약하는 통계가 포함 - 숫자 및 개체 계열 DataFrame과 혼합 데이터 유형의 열 집합을 모두 분석 import pandas as pd df = pd.DataFrame({'a': [1,2,3,4,5], 'b': [2,4,6,8,10]}) df.describe() >>> Mean / Median / Mode Range Var / SD Kurtosis Skewness [ section1 - 2 / 통계(Statistics) ] 1. 기술통계와 추리통계 개념정리 9/17(금), 부트캠프를 시작하면서 쫓아가고 적응하느라 정신없는 1주를 보내고, 이대로 밀리면 머릿속에 남는게 없을 것 같아서 추석연휴시작에 용기내 드디어 첫 블로그를 남긴다. [section2의 n121] * 통계학(Statistics) - 통계는 데이터를 다루는 목적에 따라 크게 두 가지(기술통계 / 추리통계)로 분류로 나눌 수 있다. 1) 기술통계 (Descriptive statistics) 수집한 데이터를 요약 묘사 설명하는 통계 기법 기술통계는 한 집단의 특성을 수리적으로 요약, 기술해주는 방법이다. 즉 얻어진 자료를 분석하여 그 자료를 구성하는 대상들의 속성만을 설명하는 통계이다. 그러므로 모집단의 속성을 유추하지 않는 특징을 지니고있다. 이 분류에 속하는 통계치는 집중경향치, 변산도, 상관.. 이전 1 2 3 4 다음