Kaggle入门系列:(二)Kaggle简介

Kaggle入门系列:(二)Kaggle简介

Kaggle是全球最大的数据分析在线平台,吸引了全球范围内数十万的顶级数据科学家,同时也是检测我们机器学习技能的最佳平台。

一、Kaggle简介

Kaggle成立于2010年,网址:kaggle.com/

Kaggle是全球范围内最大的数据众包平台。

企业或者研究者与Kaggle合作之后,可以将数据、问题描述、期望的指标发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案,类似于KDD-CUP(国际知识发现和数据挖掘竞赛)。

Kaggle上的参赛者将数据下载下来,分析数据,然后运用机器学习、数据挖掘等知识,建立算法模型,解决问题得出结果,最后将结果提交,如果提交的结果符合指标要求并且在参赛者中排名第一,将获得比赛丰厚的奖金。

二、参加Kaggle比赛的基本流程

1.选择一个比赛项目

2.加入竞赛,理解项目需求“Competition Details”

3.下载数据,训练模型,得出结果“Get the Data”


4.提交结果“Make a submission”

三、解题思路

模仿是最好的学习方式!

这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的三个经典练习项目,供大家学习。
1.Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾
英文教程:An Interactive Data Science Tutorial

2.House Prices: Advanced Regression Techniques(房价预测)
中文教程:Kaggle竞赛 — 2017年房价预测
英文教程:How to get to TOP 25% with Simple Model using sklearn

3.Digital Recognition(数字识别)
中文教程:大数据竞赛平台—Kaggle 入门
英文教程:Interactive Intro to Dimensionality Reduction


系列文章:

Kaggle入门系列:(一)机器学习环境搭建

Kaggle入门系列:(二)kaggle简介

Kaggle入门系列:(三)Titanic初试身手

欢迎关注微信公众号:kaggle数据分析

编辑于 2017-09-17

文章被以下专栏收录