https://hunkim.github.io/ml/Sung Kim 교수님의 모두를 위한 머신러닝/딥러닝을 정리한 것Linear Regression Linear Regression- data의 분포를 분석하였을 때 선형그래프로 정의될 수 있는 문제ex) 학생이 공부를 많이 할 수록 성적이 높아진다.집의 크기가 클 수록 가격이 높아진다. Hypothesis - model을 수학적으로 표현한 것- 선의 모양은 W와 b에 따라 결정된다.- 어떤 선이 더 좋은 가설인지 찾아 낼 수 있어야 한다. Cost Function(Loss Function)- 가설과 실제 데이터가 얼마나 다른가를 나타내는 함수- Hypothesis의 정확성을 판단하기 위해 사용 - 거리를 비교해서 가까우면 좋은 것거리(차이) : H(x) -..
https://hunkim.github.io/ml/Sung Kim 교수님의 모두를 위한 머신러닝/딥러닝을 정리한 것Machine Learning Basics Explicit Programming - 사용자의 입력을 기반- 데이터를 읽어서 보여준다.- 많은 rule 때문에 제한적 Machine Learning- 스스로 학습해서 능력을 기르게 한다. 1. 지도학습(Supervised Learning)- data에 대한 label이 주어진 상태에서 학습방법 2. 비지도학습(Unsupervised Learning)- label이 주어지지 않는 상태에서 data를 이용해 스스로 학습하는 방법- data의 숨겨진 feature나 structure를 발견하는데 사용 Training Data Set1. data set..
# DB insertion import pymysql import pandas as pd import time import csv class SQL: def __init__(self, param): """ :param param: Input parameter(host, user, pw, db, charset, query) :return None: - MySQL Connection 연결 - Initialize member vars """ host, user, pw, db, charset = param.values() self.conn = pymysql.connect(host=host, user=user, password=pw, db=db, charset=charset) self.curs = self.con..