분류 전체보기 (67) 썸네일형 리스트형 git 시작하기 !얄팍한 코딩사전을 참고하여 작성했습니다. git을 사용하는 이유? git은 코드를 버전별로 관리할 수 있다. 내가 실수를 해서 이전으로 되돌려야 하거나, 전이랑 뭐가 바꾸었는지 헷갈릴 때 되돌릴 수 있다! (매번 폴더를 압축해서 저장할 필요없이) 또 한 프로젝트의 코드를 여러 사람이 함께 작업할 수 있도록 도와주는 등 여러가지 이점이 있다. 사용법 git_test 폴더를 만들고 vs code로 열어준다 $ mkdir git_test #git_test 폴더 생성 $ code git_test #vs code로 열기 테스트로 cat, mouse 파일을 만들어준다 *맥에서 control + shift + ~ 를 누르면 vs code아래 터미널창 생긴다. git init 여기서 git init => 이 폴더가 .. tistory 수식 입력 body 사이에 아래 코드 입력 * 수식 기호 참고 www.codecogs.com/latex/eqneditor.php 정부 API로 josn 파싱하기 *API(Application Programming Interface) API(Application Programming Interface, 응용 프로그램 프로그래밍 인터페이스)는 응용 프로그램에서 사용할 수 있도록, 운영 체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있게 만든 인터페이스를 뜻한다. 주로 파일 제어, 창 제어, 화상 처리, 문자 제어 등을 위한 인터페이스를 제공한다. import csv import requests from decouple import config from datetime import timedelta, datetime from pprint import pprint # 정보를 담을 빈 딕셔너리 생성 result = {} # url을 호출 for i in range(.. 지수 표기 숫자로 변환하여 표현하기 data['audiAcc'].describe() > pd.options.display.float_format = '{:.5f}'.format data['audiAcc'].describe() > Sprint1_Logistic Regression log odds 개념 다시 보기 Logistic regression 독립변수의 선형 결합을 통해 사건의 발생 가능성을 예측하기 위해 사용되는 통계기법이다. 로지스틱 회귀의 목적은 일반적인 회귀 분석과 같이 종속변수와 독립변수간의 관계를 통해 향후 예측 모델에 사용한다. 하지만 일반적인 선형회귀 분석과는 다르게 종속 변수가 Categorical data를 대상으로 하며, 데이터가 주어졌을 때 결과가 특정 분류로 나뉘기 때문에 일종의 분류(classification)기법으로 볼 수 있다. 기준 모델 회귀 문제에서는 기준 모델을 평균으로 사용하지만, 분류문제에서는 최빈값을 기준 모델로 설정한다. Odds 승산(odds)은 사건 A가 발생하지 않을 확률 대비 일어날 확률의 비율을 의미함. p가 1에 가까울 수록.. Python으로 하는 EDA(Exploratory Data Analysis) import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import matplotlib.font_manager as fm import matplotlib as mpl import plotly.express as px from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator from PIL import Image from google.colab import drive drive.mount('/content/drive') 1. Check data (missing values, descriptive statistics) data = pd.rea.. 2021년 1월 19일 TIL 미래의 내 코드를 다시 볼 나를 위해 코드에 주석 잘 달아 놓읍시다. 데이터 사이언스 스쿨 정주행(datascienceschool.net/intro.html) Project 1. 일정 계획 1/20 : 데이터 전처리 1/21 : EDA 시각화, Feature engineering, 최소 요구 사항 1/22 : 가설 검정 및 정리 보완 1/23 : 영상 녹화 Sprint3_선형대수(Screeplot, clustering) Scree plots Scree plot은 탐색 적 요인 분석 (FA)에서 유지할 요인의 수 또는 주성분 분석(PCA)에서 유지할 주성분 의 수를 결정하는 데 사용된다. Scree 플롯을 사용하여 통계적으로 유의 한 요인 또는 구성 요소를 찾는 절차를 Scree 테스트 라고도 한다. (Wikipedia) Machine Learning : 데이터 학습 지도학습(Supervised Learning) : 데이터에 라벨이 있을 때 ex) 분류, 회귀 비지도학습(Unsupervised Learning) : 데이터에 라벨이 없을 때 ex) 클러스터링, 차원축소, 연관규칙학습, 강화학습 Clustering 비지도 학습으로 주어진 데이터들을 유사한 데이터끼리 그룹화 하는 것. 유사도는 거리 척도를 이용하여 정의된다. .. 이전 1 ··· 3 4 5 6 7 8 9 다음