2025.02.13
柳井啓司研究室の山口廉斗さん(情報学専攻博士前期2年)らのチームが、2024年11月21日(木)〜 2025年1月31日(金)にオンラインで開催された世界的なデータ分析コンペティションプラットフォーム Kaggle の 「Santa 2024 - The Perplexity Permutation Puzzle」 にて金メダルを獲得しました。
本大会は、クリスマスに関連した英単語からなる文章を並び替えることで、大規模言語モデルにとって最も自然な文章を探索するという課題でした。 具体的には、Perplexity(困惑度)が低い文章を作るという課題で、大規模言語モデル(LLM)の挙動を読みにくいという困難があります。しかし全探索を行うと最大で100!(およそ10の158乗)の膨大な組み合わせとなるために効率的な探索が要求されるという難易度の高いコンペティションでした。山口さんのチームは、巡回セールスマン問題を参考に様々なヒューリスティック最適化の手法に取り組み、総合で 1514チーム(1720人)中13位の好成績を収め、Kaggle上で金メダルを獲得しました。
山口さんは 2023年から発足した新設の「デザイン思考・データサイエンスプログラム」の大学院第1期生であり、学習の中でさまざまな実習や海外インターンを経験しました。本プログラムで培ったリーダーシップ、エンジニアリング、新しい技術を学ぶ姿勢が、今回の成果へと繋がりました。
チームメンバーの原田慧教授(情報学専攻)は、同プログラム専任の実務家教員で、本成果によってKaggle Grandmasterに昇格しました。佐野遼太郎特任助教(データ教育センター)は、日頃の業務に加えて、山口さんの所属するサークル「データサイエンス研究会」の活動を支援しています。山口剛さん(コニカミノルタ)は、元々は他チームで参加していましたが、原田教授が講師をしている本学のデータアントレプレナーフェロープログラムの卒業生という縁でチームを組みました。
立場も年齢も違うメンバーでしたが、本学関係者ということもあって意気投合し、チームメンバーとして対等な関係で協力しあうことができました。
山口廉斗さんのコメント:
今回初めて最適化の問題に取り組み、原田教授らと協力しながら焼きなまし法や遺伝的アルゴリズムといった手法を新しく学びながら、その技術を駆使して金メダルを獲得することができました。数多くの議論と試行を重ねることで獲得できた金メダルだと感じます。チームメンバーの全員がスコア向上に寄与し、自分自身も多くの学びや貢献ができた事をとても嬉しく思います。
また、柳井研究室の豊富なGPUを使わせていただきました。このような環境に恵まれたことにも感謝したいと思います。
【受賞者】チーム代表者:山口 廉斗(情報学専攻博士前期2年)
チームメンバー:原田 慧(情報学専攻)、佐野 遼太郎(データ教育センター)、山口 剛(コニカミノルタ)