Kaggle心脏病数据集为例学习机器学习的可解释性分析
最近在B站看视频的时候,偶然看到同济子豪兄发的关于机器学习可解释性的视频,因为之前学习机器学习也是学习机器学习的算法以及调库、调参,而模型的内部还是感觉是一个黑箱子。从他的视频中开始了解了对模型的可解释性分析。需要安装的工具包pip install numpy pandas matplotlib s...
程序员文章站2024-03-25Kaggle:Titanic问题
Kaggle:Titanic问题相关库函数操作1.pandas的read_csv函数读取csv文件为DataFrame格式from pandas import DataFramedata_train = pd.read_csv("Titanic/train.csv")data_train输出结果:会...
程序员文章站2024-03-22Kaggle 回归问题之房价预测 Basic
没怎么做过kaggle的题目,对机器学习的套路还不是非常熟悉,然后前段时间碰到了一个回归的问题,竟然不知道如何下手,Kaggle上有一个房价预测的基础回归问题,机器学习回归就从这里开始好了。 学习资料:https://www.kaggle.com/marsggbo/kaggle 完整的机器学习算法解...
程序员文章站2024-03-22Kaggle&TianChi分类问题相关算法快速实现
全文共4438个字,6张图,预计阅读时间20分钟。导读无论是在TianChi,还是在Kaggle上,通常会出现类似0-1分类,多分类这样的问题,比如:Kaggle Competition Past SolutionsO2O优惠券使用预测移动推荐算法除此之外,在金融、风控、交通领域,也会有比较相近的分...
程序员文章站2024-03-22利用mask-rcnn解决kaggle目标检测问题
mask-rcnn简介 mask-rcnn是Kaiming He大佬提出的图像分割模型,它在对图像中的目标进行检测的同时还能对每一个目标给出一个分割结果。它在Faster R-CNN[1]基础之上进行扩展,并行地在bounding box recognition分支上添加一个用于预测目标掩模(ob...
程序员文章站2024-03-22基于python的kaggle练习(二)——员工离职预测
前沿目前社会上呈现出一种公司招不到人,大批失业人员的矛盾现象,且大部分公司的离职率居高不下,很多入职没多久就辞职,所花费的培训招聘等资源都浪费了。为了弄清楚公司员工离职原因,通过kaggle上某一家企业员工离职的真实数据来对离职率进行分析建模。一、初识数据1、数据来源 数据来源:https://...
程序员文章站2024-03-22kaggle:Costa Rican Household Poverty Level Prediction(2):Base line
接上篇,地址在简单的DEA之后,开始Training Model, 工具LightGBMimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inlin...
程序员文章站2024-03-22Kaggle: 房价预测
0.前言1.导入数据2.查看房价分布3.填充缺失数据4.建模5.提交结果0.前言本文对Kaggle房价的训练集和测试集进行分析,采用正则线性回归,对房价进行了预测.本人将思路记录下来,以供参考.如有不足之处,欢迎指正.1.导入数据import numpy as npimport pandas as ...
程序员文章站2024-03-22kaggle实战房价预测(二)
一、明确目的1.理解问题:观察分析每个特征对于目标变量的重要程度。2.目标(因)变量:明确研究的目标变量房价。3.其他(自)变量:研究其他(自)变量对于目标变量的影响以及自变量与因变量之间的关系。4.数据清理:对于缺失值和异常值以及分类数据的处理。二、房价预测数据描述训练数据一共有1460条,预测数...
程序员文章站2024-03-22ASHRAE KAGGLE大能源预测 比赛结束回顾大佬解决方案
文章目录1 概述2 处理思想学习2.1 移除异常值2.2 缺失值2.3 目标函数2.4 特征工程2.4.1 Savitzky-Golay filter2.4.2 Bayesian target encoding(python实现)2.5 models ensemble2.6 Why does pos...
程序员文章站2024-03-22简单kaggle房价预测
在kaggle入门项目中房价预测项目,是更加接近我们工作会遇到的项目,数据属性很多、属性和标签之前的关系需要研究、属性需要取舍、类别数据需要转为数值化数据等等。本练习按照如下几个步骤进行:研究主要特征:特征和房价之间的关系数据清除:对一些缺失数据、异常点和分类数据进行处理训练预测# 导入需要的模块i...
程序员文章站2024-03-22kaggle预测房价
kaggle房价预测比赛官方地址:https://www.kaggle.com/c/house-prices-advanced-regression-techniqueskaggle数据集描述:https://www.kaggle.com/c/house-prices-advanced-regres...
程序员文章站2024-03-22Kaggle - Titanic 生存预测
第一次参加Kaggle,以Titanic来入个门。本次竞赛的目的是根据Titanic的人员信息来预测最终的生存情况。采用Python3来完成本次竞赛。一、数据总览从Kaggle平台我们了解到,Training set一共有891条记录,Test set一共有418条记录。提供的相关变量有:Varia...
程序员文章站2024-03-22kaggle房价预测
文章目录数据预览数据预处理特征工程预测模型数据预览import pandas as pdimport warningswarnings.filterwarnings("ignore")train = pd.read_csv( 'https://labfile.oss.aliyuncs.com/...
程序员文章站2024-03-22Kaggle-房价预测
一. 数据观察又是一道Kaggle的经典题目。首先观察一下数据:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn import ensemble,...
程序员文章站2024-03-22kaggle示例1—研究生录取判断问题
问题描述:UCLA(加利福尼亚大学洛杉矶分校)研究生录取的二分类问题,数据来源:http://www.ats.ucla.edu/stat/data/binary.csv 使用的属性主要有下面四列(前三列为属性,最后一列为结果(类别能否被录用):gpagre分数rank表示本科生母校的声望admit则...
程序员文章站2024-03-22kaggle研究生招生(中)
上次将数据训练了模型由于数据中的大多数候选人都有70%以上的机会,许多不成功的候选人都没有很好的预测。df["Chance of Admit"].plot(kind = 'hist',bins = 200,figsize = (6,6))plt.title("Chance of Admit")plt...
程序员文章站2024-03-21kaggle入门之一
https://blog.csdn.net/u012162613/article/details/41929171近期带娃搞专利,没啥事,我想开始刷刷kaggle大数据竞赛平台——Kaggle 入门篇 这篇文章适合那些刚接触Kaggle、想尽快熟悉Kaggle并且独立完成一个竞赛项目的网友,对于已...
程序员文章站2024-03-18Kaggle教程 机器学习入门5 欠拟合与过拟合
转载请注明出处:https://leytton.blog.csdn.net/article/details/101199899如果本文对您有所帮助,请点个赞让我知道哦 ????在这一步的最后,您将了解欠拟合和过拟合的概念,并将能够应用这些概念使您的模型更加准确。1、尝试不同的模型现在您已经有了一种可...
程序员文章站2024-03-15Kaggle - Digit Recognizer 手写数字识别 -> KNN 和 neural network实现
Competition Add : https://www.kaggle.com/c/digit-recognizer此题目已经把每个图片向量化了。下载到的data里包含三个文件:数据文件train.csv和test.csv包含从0到9的手绘数字的灰度图像。每个图像的高度为28个像素,宽度为28个像...
程序员文章站2024-03-14