728x90 반응형 파이썬/ai16 [Ai, Python] Linear Regression- 4 1. 선형 회귀 앞서도 계속 학교의 ai수업 중간고사를 준비하기 위해 수업의 내용을 정리하고 첨언하는 식으로 포스팅을 계속해가고 있다. 이번에 살펴볼 것은 Linear Regression학습 모델인데 여태까지 KNN이나 KNR처럼 자신의 주변의 사례들을 기반으로 새로운 데이터의 값을 예측하는 것은 사례기반 학습 LinearRegression처럼 기존의 데이터로 부터 함수를 만들어낸 뒤 그 함수를 통해 새로운 데이터의 값을 예측하는 것을 모델 학습이라고 한다. 앞선 포스팅에서 설명했듯이 LinearRegression은 그 모델 중 하나의 변수만을 고려하기 때문에 일차 함수의 형태를 띄고 우리는 여기서 y = ax + b에서 적절한 a와 b를 찾아내는 것이 목적이다. 이 a와 b를 모델 파라미터라고 한다. .. 파이썬/ai 2022. 4. 11. [Ai, python]KNN - Linear Regression3 1. Linear Regression 앞선 포스팅까지 행했던 것은 classification 즉 분류였다. 미리 몇 개의 집합을 설정해두고 데이터들에 대한 집합 정답지를 알려준 뒤 새로 들어온 데이터가 어떤 집합과 가까운 지 거리를 파악하고 가장 거리가 가까운 집합으로 분류를 하는 작업이었다. 하지만 이제 할 것은 Regression 즉 회귀이다. Regression이란 어떠한 데이터들을 학습시켜 새로운 데이터가 들어왔을 데이터에 대한 어떠한 값을 예측하는 문제를 말한다. 예를 들어 최근 10년간의 서울의 집 값 데이터를 모델에게 학습시킨 후 앞으로 1년 뒤의 서울의 집 값은 어떻게 되겠는가?라는 질문을 던졌을 때 예측치를 내놓는 것이 Regression이다. Regression 문제를 수행함에 있어 서.. 파이썬/ai 2022. 4. 11. [ai, python]KNN에서의 overFitting UnderFitting 1. KNN에 대한 overview 나는 지난번과 동일하게 kneighbors nearest라는 모델을 사용해서 학습을 시키고 있다. 사실 ai모델이라는 것은 거창한 것이 아니라 그저 수학적 모델을 기반으로 더 많은 데이터와 더 많은 예외 사항을 컴퓨터에게 알려주어 컴퓨터에게 다음부터는 이것도 고려해서 결과를 내! 라고 알려주는 일련의 과정이다. 그 중 내가 지금 사용하는 KNN이라는 모델은 아주 간단한 모델인데 쉽게 말해 모든 데이터들을 그래프 평면 상에 그렸을 때 나와 가장 가까운 점들에 의해 나의 집합이 결정된다는 것이다. 예시를 들면 다음과 같은 그래프에서 주황색 세모와 가장 가까운 점들은 초록 마름모 점들이다. 이 때 가장 가까운 점들의 개수, 즉 몇 개의 이웃을 우리는 고려할 것인가는 우리가 .. 파이썬/ai 2022. 4. 11. [Ai,Python] K-nearest neighbor-1(데이터 전처리 및 모델 학습) 우리가 흔히 아는 딥러닝이라고 하는 것은 많은 데이터를 컴퓨터에게 집어 넣어 미래의 예측 값을 보다 정확하게 추론해내는 일종의 통계학이다. 그러러면 우리는 일단 컴퓨터를 학습시킬 많은 데이터들을 필요로 하는데 우리의 생활 속에서 발생하는 데이터들은 일정한 형식의 format을 가지고 있지도 않고 매우 불규칙하게 생기고 발생한다. 그래서 우리는 엑셀, DBMS와 같이 데이터들을 관리하는 툴에서 데이터들을 추출해 컴퓨터에게 학습시키기 쉬운 형태의 데이터 형태로 바꿔주는 파이썬의 라이브러리들을 이용할 것이다. 다음과 같은 데이터 셋이 존재한다고 하자 우리는 두 가지 물고기의 길이와 무게 정보를 이용해서 새로운 물고기의 길이와 무게 정보가 들어왔을 때 이 물고기가 두 물고기 중 어떤 물고기인지 판별하는 프로그램.. 파이썬/ai 2022. 4. 5. 이전 1 2 다음 728x90 반응형