import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.read_csv("../DATA/AMES_Final_DF.csv")
df=df.drop('Unnamed: 0',axis=1)


df.head()


df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2925 entries, 0 to 2924
Columns: 274 entries, Lot Frontage to Sale Condition_Partial
dtypes: float64(11), int64(263)
memory usage: 6.1 MB


X=df.drop('SalePrice',axis=1)
y=df['SalePrice']


from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.1,random_state=101)


from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()
scaler.fit(X_train)
X_train=scaler.transform(X_train)
X_test=scaler.transform(X_test)


from sklearn.linear_model import ElasticNet


elastic_model=ElasticNet(max_iter = 100000)


# l1_ratio = 0 then it's L2 penalty
# L1_ratio = 1 then it's L1 penalty
# l1_ratio = range of values approaching 1 means we're doing CV with L1 penalty

pars={'alpha':[1,100],'l1_ratio':[.1, .5, .7, .9, .95, .99, 1]}


from sklearn.model_selection import GridSearchCV


grid_model=GridSearchCV(elastic_model,pars,scoring='neg_mean_squared_error')


grid_model.fit(X_train,y_train)

GridSearchCV(estimator=ElasticNet(max_iter=100000),
             param_grid={'alpha': [1, 100],
                         'l1_ratio': [0.1, 0.5, 0.7, 0.9, 0.95, 0.99, 1]},
             scoring='neg_mean_squared_error')


grid_model.best_params_

{'alpha': 100, 'l1_ratio': 1}


pred=grid_model.predict(X_test)


from sklearn.metrics import mean_squared_error , mean_absolute_error
MAE= mean_absolute_error(y_test,pred)
RMS=np.sqrt(mean_squared_error(y_test,pred))

MAE

14195.354900562172

RMS

20558.508566893164

	Lot Frontage	Lot Area	Overall Qual	Overall Cond	Year Built	Year Remod/Add	Mas Vnr Area	BsmtFin SF 1	BsmtFin SF 2	Bsmt Unf SF	...	Sale Type_WD	Sale Condition_Normal
0	141.0	31770	6	5	1960	1960	112.0	639.0	0.0	441.0	...	1	1
1	80.0	11622	5	6	1961	1961	0.0	468.0	144.0	270.0	...	1	1
2	81.0	14267	6	6	1958	1958	108.0	923.0	0.0	406.0	...	1	1
3	93.0	11160	7	5	1968	1968	0.0	1065.0	0.0	1045.0	...	1	1
4	74.0	13830	5	5	1997	1998	0.0	791.0	0.0	137.0	...	1	1

Linear Regression Project Exercise¶

Complete the tasks in bold¶

Imports¶

Data¶

Great work!¶