부동산 가격 예측
·
Machine Learning/Decision Tree
Random Forest로 부동산 가격 예측하기¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(2021) 1. Data¶ 이번 실습에서 사용할 데이터는 보스턴의 집 값을 예측하는 데이터입니다. 1.1 Data Load¶ 데이터는 sklearn.datasets의 load_boston를 통해 사용할 수 있습니다. In [2]: from sklearn.datasets import load_boston housing = load_boston() In [3]: data, target = housing["data"], housing["target"] 1.2 Data EDA¶ In [4]: pd..
Random Forest로 손글씨 분류하기
·
Machine Learning/Decision Tree
Random Forest로 손글씨 분류하기¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(2021) 1. Data¶ 1.1 Data Load¶ 손글씨 데이터는 0~9 까지의 숫자를 손으로 쓴 데이터입니다. 데이터는 sklearn.datasets의 load_digits 를 이용해 받을 수 있습니다. In [2]: from sklearn.datasets import load_digits digits = load_digits() In [3]: data, target = digits["data"], digits["target"] 1.2 Data EDA¶ 데이터는 각 픽셀의 값을 나타냅니다...
Decision Tree Regressor
·
Machine Learning/Decision Tree
샘플 데이터와 Decision Tree Regressor¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(2021) 1. Data¶ 1.1 Data Load¶ 예시에서 사용할 샘플 데이터를 생성합니다. In [37]: data = np.sort(np.random.uniform(low=0, high=5, size=(80, 1))) label = np.sin(data).ravel() label[::5] += 3 * (0.5 - np.random.uniform(0, 1, 16)) In [38]: data Out[38]: array([[4.98555781], [4.39531746], [4.0..
Iris 꽃 종류 분류
·
Machine Learning/Decision Tree
Iris 꽃 종류 분류¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(2021) 1. Data¶ 1.1 Data Load¶ 데이터는 sklearn.datasets 의 load_iris 함수를 이용해 받을 수 있습니다. In [2]: from sklearn.datasets import load_iris iris = load_iris() 데이터에서 사용되는 변수는 암술과 수술의 길이와 넓이입니다. sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) In [3]: iris["feature_names"] Out[3]:..
Decision Tree Classification 기초
·
Machine Learning/Decision Tree
샘플 데이터와 Decision Tree Classification¶ In [79]: import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(2021) 1. Data¶ 1.1 Sample Data¶ In [80]: data = { "value": [30, 120, 150, 390, 400, 300, 500], "label": [0, 0, 1, 0, 0, 1, 0] } In [81]: data = pd.DataFrame(data) In [82]: data Out[82]: value label 0 30 0 1 120 0 2 150 1 3 390 0 4 400 0 5 300 1 6 500 0 2. Decision ..