경사 하강법이란? 저번 포스트에서 선형 회귀를 다루었다. 데이터에 가장 적합한 함수를 그려나갈 때 어떻게 데이터에 맞춰 나가며 그릴 것인가? 그에 대한 답 중 하나가 경사 하강법이다. 경사 하강법 적용 y = ax + b라는 식이 있다. 이 식을 데이터에 맞는 식으로 바꾸기 위해서는 a, b를 조정해야 한다. 우선 a, b를 임의의 값으로 초기화한다. 나는 모두 1이라 하겠다. a = 1.0 b = 1.0 첫 데이터를 x에 입력한다면 y값을 예측할 수 있다. (예측값 y를 k라 하자) 그다음 우리는 k와 y(실제 답)을 비교하여 얼마나 잘 예측했나 판단할 수 있다. 내가 임의로 초기화한 값이 바로 들어맞을 확률은 거의 0%라고 생각한다. 그럼 이제 a와 b값을 조정하여 더 잘 맞추는 모델을 만들어 보자...
딥러닝
데이터 불러오기(with pandas) import pandas as pd 데이터를 다루는데 유용한 기능을 제공하는 모듈이다. # save filepath to variable for easier access melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv' # read the data and store data in DataFrame titled melbourne_data melbourne_data = pd.read_csv(melbourne_file_path) # print a summary of the data in Melbourne data melbourne_data.describe() 이런 식으로 path를 지정하고..
https://www.kaggle.com/ Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. www.kaggle.com kaggle이라는 인공지능 및 데이터사이언스에 대한 좋은 사이트가 있다. 앞으로 여기 있는 코드를 무작정 따라해보고 이해하며 공부할 예정이다.
선형 회귀란? 선형 회귀는 특정 데이터를 모아 놓고 이에 맞는 함수를 찾아내는 과정이라 생각하면 된다. 1차 함수로 표현하면 쉽게 이해할 수 있다. y = ax + b라는 함수가 있다고 가정하자. 이 함수의 그래프는 다음과 같을 것이다. 이런 그래프가 있다면 우리는 a, b만 안다면 x에 대한 값을 예측할 수 있다. 하지만, 데이터가 함수에 딱 맞지 않는다면 어떻게 해야 할까?? 이런 데이터가 있다면, a값을 조절하여 점들의 위치로 그래프를 조정할 수 있다. 이렇게 평행이동으로 맞출 수 있는 데이터가 있다면, b값만 조정하면 맞출 수 있다. 우리는 y = ax + b라는 그래프에서 a, b값을 조정하여 데이터에 맞는 그래프를 그리려 노력했다. 이러한 과정이 선형 회귀라 할 수 있다.
인공지능이란? 인공지능(Artificial Intelligence)은 사람의 지능을 만들기 위한 시스템이나 프로그램을 말한다. 머신러닝, 딥러닝, 인공지능의 개념을 혼동하는 사람이 많이 있다. 쉽게 말해 머신러닝과 딥러닝은 인공지능에 포함되는 기술이고, 딥러닝은 머신러닝에 포함되는 기술이다. 다음 그림을 보면 쉽게 이해가 가능하다. 머신러닝이란? 머신러닝은 기계학습을 의미하며, 데이터의 규칙을 컴퓨터 스스로 찾아내는 것을 말한다. 기존 프로그래밍은 규칙을 사람이 직접 만들어 결과를 얻어내지만 머신러닝은 스스로 규칙을 찾아낸다. 머신러닝은 지도 학습(supervised learning), 비지도 학습(unsupervised learning)으로 나뉘다. 지도 학습은 많은 입력과 출력이 주어지면 규칙을 찾아..