본문 바로가기

전체 글

(27)
[ section1 - 2 / 통계(Statistics) ] 4. NumPy 난수 생성 (무작위 추출/Random 모듈) # np.random.rand() : 무작위 샘플 추출(난수 생성)을 위한 메서드 낮은 (포함)에서 높은 (제외) 까지 임의의 정수를 반환 NumPy 패키지의 random 모듈 (numpy.random)에 대해 소개합니다. random 모듈의 다양한 함수를 사용해서 특정 범위, 개수, 형태를 갖는 난수 생성에 활용할 수 있습니다. import numpy as np v = np.random.randint(0, 100, 20) pd.DataFrame(v).describe() >>> Population Parameter Statistic Estimator Standard Deviation Standard Error https://codetorial.net/numpy/random.html 참고해서 마저적기
df.describe() : 데이터 요약을 위한 메서드 # df.describe() : 데이터 요약을 위한 메서드 DataFrame.describe(percentiles=None, include=None, exclude=None, datetime_is_numeric=False) - 기술 통계에는 NaN값을 제외 / 데이터 세트 분포의 중심 경향, 분산 및 모양을 요약하는 통계가 포함 - 숫자 및 개체 계열 DataFrame과 혼합 데이터 유형의 열 집합을 모두 분석 import pandas as pd df = pd.DataFrame({'a': [1,2,3,4,5], 'b': [2,4,6,8,10]}) df.describe() >>> Mean / Median / Mode Range Var / SD Kurtosis Skewness
[ section1 - 2 / 통계(Statistics) ] 1. 기술통계와 추리통계 개념정리 9/17(금), 부트캠프를 시작하면서 쫓아가고 적응하느라 정신없는 1주를 보내고, 이대로 밀리면 머릿속에 남는게 없을 것 같아서 추석연휴시작에 용기내 드디어 첫 블로그를 남긴다. [section2의 n121] * 통계학(Statistics) - 통계는 데이터를 다루는 목적에 따라 크게 두 가지(기술통계 / 추리통계)로 분류로 나눌 수 있다. 1) 기술통계 (Descriptive statistics) 수집한 데이터를 요약 묘사 설명하는 통계 기법 기술통계는 한 집단의 특성을 수리적으로 요약, 기술해주는 방법이다. 즉 얻어진 자료를 분석하여 그 자료를 구성하는 대상들의 속성만을 설명하는 통계이다. 그러므로 모집단의 속성을 유추하지 않는 특징을 지니고있다. 이 분류에 속하는 통계치는 집중경향치, 변산도, 상관..