おすすめしたいデータサイエンスコンペサイト5選!!
- そらまめ
- 2020年8月13日
- 読了時間: 4分
更新日:2020年8月27日

こんにちは、そらまめです。
今回はデータサイエンスを学ぶにあたって必須となるデータサイエンスコンペのサイトについて紹介していきます。
当ブログの紹介についてはブログ紹介を参照頂けたらと思います。
Kaggle
世界最大級のコンペサイトで約40万人ほどのデータサイエンティスト/機械学習エンジニアが切磋琢磨しているコミュニティとなっています。
日々数多くの「Competetion(コンペ)」が開催されており、そこで上位の成績を残すことで獲得できるExpartやMasterなどの称号を持つことでデータサイエンティストや機械学習エンジニア職での就活や転職のアピールに使うことができます。
・特徴
各コンペごとのコードやディスカッションが数多く共有されています
すべて英語で書かれているのでそこは注意!
kaggleコンペに提出するためのノウハウについて纏められた書籍も出始めているの で初心者にもオススメです
公式ページ
オススメのKaggleコンペ本
・データ分析をするなら必須といってもいいほどの名著。
前処理などのノウハウが揃っており一読の価値ありです!
・初心者にオススメ、実際にKaggleでコンペに参加するまでを説明してくれています。
順番的にはこの本を読んで上記の本を読むのが良いと思います。
SIGNATE
Kaggleの日本版として紹介されている日本最大級のコンペサイトです。
データセットの個数はKaggleに比べると少ないですが日本語のサイトということもあり、
英語に苦手意識を感じる人でも気軽に取り組むことが出来ます。
また最近では「SIGNATE Quest」という月額980円でPythonの文法からデータ分析の流れまでを学べるサービスを展開しています。
・特徴
SIGNATE QuestやUdemyでの動画教材など初心者でもデータサイエンスの勉強を始めやすい環境が整っています
会員同士のディスカッション用のページは存在するがKaggleに比べるとそこまで盛んではないです
公式ページ
SIGNATE Questの紹介ページ
probspace
参加者は上記2つのコンペに比べると少ないですが、参加者のレベルが高く、
またそれぞれのコンペの上位の手法が「トピック」として多く更新されているので、
1回は覗いておくべきサイトです!
・特徴
トピックのレベルが高くとても参考になります
それぞれのコンペで公式の「Tutorial」があるのでそのままコピペすることでコンペ自体には簡単に参加できます
規模はそんなに大きくないので上位も狙いやすいかも
公式ページ
Nishika
去年の11月からスタートしたコンペサイトで、「日本絵画の人物に描かれた顔分類」や
「Jリーグのプレイヤーの出場予測」など面白いデータを扱ったコンペが開催されています。
また、AI・データサイエンスに特化したQ&Aサイトもあり、気軽に質問を投げかけることができます。
・特徴
面白いデータを扱ったコンペが開催されています。
Q&Aサイトがあり、会員登録を行うだけで気軽に参加できます。
公式ページ
atma
データ解析・アルゴリズムソリューション・システム開発を行うatma株式会社が運営しているコンペで、他のコンペとは違いオンライン提出ではなく、会場に集まりリアルタイムでコンペを行なっています。
※最新のコンペ(2020年5月開催)はコロナの影響もあり、オンラインで行っていました。
・特徴
オンラインではなく対面で行うコンペです。
他のコンペとは違い人数制限があるので参加の際にはお早目に!
公式ページ
まとめ

今回はデータサイエンスに関するコンペについて纏めていきました。
データサイエンスに関して初心者の方には教材が整っているSIGNATEやトピックが充実しているprobspaceを勧めたいですね!
また英語に抵抗にない人にはKaggle、データサイエンスを勉強する人脈づくりには対面のatma 、Jリーグや浮世絵など個性的なデータを分析してみたい人にはNishikaなど自分の興味に合わせてを学習を進めていただければと思います。
ひとまずは以上です!
また他のコンペサイトを見つけ次第、順次追加紹介していきます!
2020/8/27追記
Quevico AI Competitionsというコンペサイトを新たに発見しました。
今年の4月からスタートしたコンペサイトですが、今まで自然言語処理や画像データ、テーブルデータと幅広いデータを扱ったコンペを開催しています。
公式サイト
コメント