大学院コンピュータサイエンス専攻の町田秀輔さんと守屋俊さんが「SIGNATE Student Cup 2020」で3位に入賞
2020年8月5日(水)~2020年9月4日(金)にSIGNATEと呼ばれるデータサイエンスティストコンペティションサイトで行われた「SIGNATE Student Cup 2020」において、柴田研究室所属大学院コンピュータサイエンス専攻修士1年の町田秀輔さんと修士2年の守屋俊さんが3位に入賞し、賞金3万円を獲得しました。
本コンペティションは学生限定で行われ、主な参加者は日本全国の大学、大学院生となっており、参加者は458名でした。
■町田秀輔さんと守屋俊さんのコメント:
今回、自分たちのチームは深層学習の技術を用いて入賞することができました。
RoBERTaと呼ばれる現在の自然言語処理技術の中で最先端な手法と文書のトピックを推定するトピックモデルと呼ばれる従来から用いられている手法を組み合わせて用いました。
■コンペティションの詳細:
コンペティションでは英語圏の求人情報に含まれるテキストデータから、
1.データサイエンティスト
2.機械学習エンジニア
3.ソフトウェアエンジニア
4.コンサルタント
のどの職種に属するかを分類するアルゴリズムを構築します。
コンペティションでは、モデルを学習するために用意された訓練用データとモデルの性能を評価するためのテストデータの2種類が用意されます。
まずはじめに、訓練用データを用い、テキストデータから職種を分類するようにモデル学習させます。
次にテキストから職種を分類するように学習されたモデルを使って、テストデータのテキストがどの職種に属するかをモデルによって分類させます。
最後に、モデルによって分類させたテストデータの職種と実際の結果の一致率からスコアを算出し、各チームとで競い合います。
■SIGNATE Student Cup 2020 WEB:
https://signate.jp/competitions/281/summary
■大学院コンピュータサイエンス専攻WEB:
/grad/cs/index.html