전체 글
-
이후 내용들도 티스토리 대신 노션에 정리중카테고리 없음 2024. 4. 9. 10:50
https://typical-elk-8a6.notion.site/8ddef28667a44cf18b3e7d5beddc321c?pvs=4 학생용 대시보드 | Notion ↓ 강의 카드를 클릭해 강의 노트, 과제, 강의 정보 등을 확인할 수 있습니다. 새 강의 템플릿을 활용해 새로운 강의를 추가하세요. typical-elk-8a6.notion.site 노션은 토글을 사용해서 숨길수가 있어서 밑으로 계속 넘기는것 보다 훨씬 깔끔하게 작성가능하더라구요 매일매일 코딩왕 되는중
-
240226 코딩왕 되기카테고리 없음 2024. 2. 27. 09:32
** 추론 1. 추론 통계 1) 개요 ⇒ 기술 통계가 주어진 데이터의 분포나 빈도, 평균 등의 통계량을 이용해서 데이터를 설명하기 위한 목적인 반면 추론 통계의 목적은 주어진 데이터(샘플링)를 이용해서 모집단의 특성을 추론 하는 것 ⇒ 제한된 데이터로 주어진 실험 결과를 더 큰 과정 또는 모집단에 적용하려는 의도를 반영하는 것을 추론(Inference) 이라고 합니다. 2) 추론 과정 ⇒ 가설을 세움 ⇒ 실험을 설계 ⇒ 데이터를 수집 ⇒ 추론 및 결론을 도출 3) 확률 분포의 추정 ⇒ 분석할 데이터는 어떤 확률 분포 변수로부터 실현된 표본이라는 가정을 하게되는데 이것이 데이터 분석의 첫번째 가정 ⇒확률론적인 관점에서 볼 때 데이터는 확률 변수의 분포를 알아내는데 사용하는 참고 자료일 뿐 4) 확률 분포의..
-
240222 기본카테고리 없음 2024. 2. 22. 09:37
import numpy as np import pandas as pd # distplot이나 histplot을 이용해서 분포 곡선과 그래프를 같이 그리기 위해 추가 import seaborn as sns # 통계 관련 패키지 import scipy as sp import scipy.stats # 시각화 패키지 import matplotlib.pyplot as plt #시각화에서 한글을 사용하기 위한 설정 import platform from matplotlib import font_manager, rc if platform.system() == 'Darwin': rc('font', family='AppleGothic') #윈도우의 경우 elif platform.system() == 'Windows': f..
-
240219 코딩왕 되기카테고리 없음 2024. 2. 21. 14:01
데이터 전처리 1.숫자 데이터 1) 이상치 처리 => 이상치 데이터를 삭제 => 이상치로 표시하고 이를 특성의 하나로 포함 : 드물게 발생하는 데이터가 영향을 많이 주는 경우! => 이상치의 영향이 줄어들도록 특성을 변환 : RobustScaler를 이용하는 것이 바람직 import numpy as np import pandas as pd houses = pd.DataFrame() houses['price'] = [534433, 392333, 293222, 4322032] houses['bedrooms'] = [2, 3.5, 2, 116] houses['square_feet'] = [1500, 2500, 1500, 480000] print( "처음 상태", houses ) #bedrooms이 20개 이상..
-
240208 코딩왕 되기카테고리 없음 2024. 2. 8. 16:27
요즘 코딩왕이 되자는 목표에 소홀한 나도 코딩왕입니다 꼭 왕이 되어서 제 국가를 잘 통치하도록 하겠습니다. 감사합니다. pandas를 이용한 데이터 수집 1. 클립보드의 내용을 읽어오기 pandas.read_clipboard() 2.자주 사용하는 데이터 셋 scikit-learn에서 제공하는 데이터 셋 load_digits() : 숫자 데이터 셋 - 분류에 사용 load_bostin() : 보스톤 주택 가격 데이터 - 회귀에 사용 load_iris() : 붓꽃 데이터 - 분류에 사용 load_diabetes() : 당뇨병 데이터 - 회귀에 사용 load_linnerud() : 체력 검사 데이터 - 회귀에 사용 load_wine() : 와인 품질 데이터 - 분류에 사용 load_breast_cancer()..
-
240206 코딩왕 되기카테고리 없음 2024. 2. 6. 17:46
**태블로 1. 기울기 차트 1) 개요 => 하나의 기간이나 상태로부터 다른 기간이나 상태로 값이 변화하는 것을 출력하는 차트 -> 2개의 기간을 이용하면 기울기 차트라고 하고 여러 개의 기간을 이용하면 범프 차트라고 부르는 경우가 많습니다. 2) Superstore.csv 파일의 데이터를 이용해서 2015년부터 2016년까지 West 지역 내 주(State)의 판매 순위 변화 출력 => Superstore.csv 파일을 불러오기 => 시트에서 판매 순위를 생성 - 계산된 필드 생성 Rank(Sum[Sales])) => 열에 [Order Date] 배치 => 필터에 [Order Date]를 배치하고 2개의 년도만 선택 => 필터에 [Region]를 배치하고 West만 선택 => State를 마크 선반의 ..
-
240205 코딩왕 되기카테고리 없음 2024. 2. 5. 17:50
**태블로 1. 태블로의 계산 1) 실습 준비 Car for tableau.xlsx 엑셀 파일을 열고 시트들을 Join Car order 시트에 Car_member, Car_OrderDetail, Car_Store를 JOIN하고 Car Product를 Car_OrderDetail에 JOIN 2) 기본 함수 => 함수: 데이터를 받아서 작업을 수행한 후 리턴해주는 코드의 묶음 =>프로그래밍 언어에서는 리턴할 때 데이터를 돌려주지 않을 수 있지만 프로그래밍 언어가 아닌곳에서는 함수는 반드시 데이터를 리턴해야 합니다. =>숫자 관련 함수 ABS MAX/MIN ZN : 데이터가 null이면 0을 반환하고 아니면 식을 반환 - ZN([매출액]) ROUND : 데이터와 자릿수를 받아서 반올림해주는 함수 =>문자 관..