Python学习-线性回归和逻辑回归应用

程序员文章站 2024-02-15 21:51:35

...

线性回归原理：

线性回归实际上是寻找一组好的权重（向量W）用来与观测向量相成并获得近似目标值。

线性回归是利用误差平方和作为代价函数，最后求解出误差最小的W权重向量。

首先利用线性回归对波士顿房价数据进行预测

Python学习-线性回归和逻辑回归应用

Boston.data数据中为各房子的基本信息，target为房子价格

from sklearn .datasets import load_boston
boston=load_boston()
from sklearn.cross_validation import train_test_split
x_train,x_test,y_train,y_test=train_test_split(boston.data, boston.target, test_size=0.2, random_state=0)

from sklearn.linear_model import LinearRegression
regr=LinearRegression()
regr.fit(x_train,y_train)
y_pre=regr.predict(x_test)

from sklearn.metrics import mean_absolute_error
print(mean_absolute_error(y_test,y_pre))

结果为3.842810589450492

效果不是很好。

接下来利用逻辑回归对逻辑回归对一份信用卡异常数据进行预测

import pandas as pd
credit=pd.read_csv("D:\PythonPractice\credit\creditcard.csv")
credit=credit.drop(['Time','Amount'],axis=1)
g1=credit[ credit["Class"]==0]#对正常和异常数据进行分组
g2=credit[ credit["Class"]==1]
g1=pd.DataFrame.sample(g1,n=492)
#因正常数据样本远大于异常数据，所以对正常数据进行下采样，保留与异常数据相同的样本个数
df=g2.append(g1)

from sklearn.utils import shuffle
df = shuffle(df)#让新数据与异常数据拼接并打乱

x_train,x_test,y_train,y_test=train_test_split(df, df.Class, test_size=0.2, random_state=0)

from sklearn.linear_model import LogisticRegression
clf=LogisticRegression()
clf.fit(x_train,y_train)
y_pred=clf.predict(x_test)
x_test["pre"]=y_pred
print(mean_absolute_error(y_test,y_pred))

结果非常好，0.005076142131979695

197条数据只有个别预测错误

Python学习-线性回归和逻辑回归应用

上一篇： python web开发实战(6)--编写api接口

下一篇：使用swagger生成restful风格的接口文档

Python学习-线性回归和逻辑回归应用

Python学习-线性回归和逻辑回归应用

Spark ML机器学习算法svm，als，线性回归，逻辑回归简单试验

python实现机器学习之元线性回归

python实现机器学习之多元线性回归

机器学习个人笔记——（二）线性回归，最小二乘法和梯度下降

Python数据拟合与广义线性回归算法学习

Python编程实现线性回归和批量梯度下降法代码实例

PyTorch线性回归和逻辑回归实战示例

用python构建线性回归和决策树模型实现房价预测

python机器学习基础线性回归与岭回归算法详解