kaggle介绍

Kaggle 主要为数据科学家、机器学习工程师、开发商以及数据科学爱好者等提供服务,是一个集机器学习竞赛、托管数据库、代码编写和分享等功能于一体的平台。

主要业务与功能

竞赛

  • 种类丰富:有 Featured、Getting Started、Playground、Research 等多种类型。Featured 是最主要的比赛类型,通常由公司、组织或政府赞助,奖金池大,竞争激烈;Getting Started 竞赛结构类似 Featured,但无奖金,数据集更简单;Playground 面向初学者,注重创意;Research 则侧重于解决科研界的前沿问题,实验性强,奖金少或无奖金。
  • 流程规范:竞赛主持人准备数据和问题描述,参与者通过不同方法实验以获得最优模型并提交,提交后会根据预测精度立即评分并在实时积分榜显示,截止时间后,竞赛主持人向获胜者支付奖金。

数据资源

拥有 43.8 万高质量公共数据集,内容涵盖从牛油果价格到视频游戏销售、国际足球比赛结果、170 多万篇 STEM 学术论文的 arXiv 数据集和元数据等各个领域,为数据科学研究和实践提供了丰富素材。

代码与模型分享

平台的 Kernels 功能允许用户分享代码和分析,方便用户之间交流学习,促进技术传播和创新,还有大量的公共 Notebooks 可供访问,用户能在强大的 Notebook 环境中进行代码编写和数据分析,且可免费使用 GPU 和 TPU。

学习资源

Kaggle Learn 是其在线课程平台,帮助用户学习数据科学和机器学习知识,无论初学者还是有一定经验的专业人员,都能在此找到适合自己的课程来提升技能。

社区互动

有活跃的社区和论坛,用户可在上面交流数据科学问题、分享经验、讨论技术难点、寻求帮助等,形成了良好的学术和技术交流氛围。

注册

作为这样一个大型竞赛平台,其提供了可以免费访问并可以在云端 GPU 进行深度学习训练的资源和环境。每个用户每周有30个小时的GPU额度。整个注册过程和手机验证过程都需要挂梯子,其详细使用过程如下:

注册账户

打开首页(https://www.kaggle.com/)

在这里插入图片描述

进去注册页面

在这里插入图片描述
在这里可以使用Google账号注册,也可以选择邮箱注册,QQ邮箱也可以。

填写注册信息

这里我们选择了邮箱注册,进去后需要挂梯子才可以看到【进行人机身份验证】
在这里插入图片描述

输入邮箱验证码

下一步查看邮件,并输入验证码
在这里插入图片描述
注册成功后进去如下界面:
在这里插入图片描述

验证手机

登录成功后,需要验证手机号才可以使用免费GPU,支持国内手机号。

点击右上角【头像】

在这里插入图片描述

选择【Settings】

在这里插入图片描述

点击【Phone verify】进行手机号验证

在这里插入图片描述

输入中国手机号

进去后需要挂梯子才可以看到【进行人机身份验证】
在这里插入图片描述

输入手机验证码

手机会收到google发过来的验证码
在这里插入图片描述
输入验证码,验证成功!
在这里插入图片描述
可以到settings 看到验证结果:
在这里插入图片描述

申请和使用GPU

新建notebook

在这里插入图片描述
创建成功后,添加代码:

print("hello world")

执行后可以看看结果
在这里插入图片描述

启动GPU

把右侧边栏各子项收起来,然后点击右侧边栏中的【Session options】
在这里插入图片描述
选择【ACCELERATOR】,在下拉框中可以选择你想使用的GPU,分别有:

  • GPU T4X2 : 每周免费使用30小时
    显存:16 GB GDDR6
    CUDA 核心:2560
    峰值性能(FP16):65 TFLOPS
    推荐应用场景:推理、视频处理和轻量模型训练。
    优势:T4 的性价比很高,功耗低,适合需要较高吞吐量的推理任务,是流行的推理 GPU,适合在线推理的成本优化需求。
    推荐用途:成本敏感的推理任务,例如小型到中型的深度学习模型推理。
  • GPU P100 : 每周免费使用30小时
    显存:16 GB HBM2
    CUDA 核心:3584
    峰值性能(FP16):18.7 TFLOPS
    推荐应用场景:基础的深度学习训练和推理。
    优势:P100 已不再是主流 GPU,性能较低,但在某些预算紧张的场景下依然可以用作训练任务推荐用途:预算有限的基础 A 训练或推理任务,适合处理中小规模模型,
  • TPU VM v3-8 : 每周免费使用20小时
    TPU VM v3-8 中的 “v3” 代表 TPU 的第三代架构,具有更先进的硬件设计和更高的性能。“8” 表示该虚拟机配置了 8 个 TPU 芯片,这些芯片通过高速互联技术连接,能够协同工作,提供强大的并行计算能力。
    在这里插入图片描述
    选择P100,然后再执行就可以看到GPU
    在这里插入图片描述

验证GPU

加入验证GPU的代码:

import torch
torch.cuda.is_available()

运行后:
在这里插入图片描述

查询GPU 余量

回到【Home】,点击【头像】进入【Settings】,滚动到【Quotas】,如下可以看到,总时长为30小时,已经使用5秒(每周30小时免费时长)

可以看出GPU是统一统计,可以创建多个不同notebook。

关闭GPU

在没使用的情况下,需要关闭GPU,然后会一直计时。
在这里插入图片描述
点左下角查看是否有脚本没关闭:
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐