Preferred Networks

大規模言語モデルにおける推論の軽量化【2024年度インターン】

穴田 穂乃香
穴田さんトリミング後
参加年度:2024 年度 当時の学年:修士 1 年 テーマ:大規模言語モデルにおける推論の軽量化

自己紹介

東京大学大学院 情報理工学系研究科 コンピュータ科学専攻 修士 1 年の穴田穂乃香と申します。大学院では、連合学習における参加者の貢献度評価メカニズムなど、信頼性の高い連合学習システムの構築に関する研究に取り組んでいます。

インターンで取り組んだこと

インターンでは、「大規模言語モデルにおける推論の軽量化」というテーマのもと、比較的小規模な LLM を、より大規模な LLM からの知識蒸留によりファインチューニングするプロジェクトに取り組みました。

インターン参加のきっかけ

以前から PFN のことは耳にする機会が多く、技術力の高い人や、技術が好きな人が集まる会社という印象を持っていました。そうした環境で技術的な議論を交わしながら学べることに大きな魅力を感じたのが、応募した最大の理由です。

また、PFN は MN-Core に代表されるように、ハードウェアレベルから包括的に深層学習の研究開発を行っており、私自身も機械学習からハードウェア・システム開発まで幅広く関心を持っていたため、その点にも強く惹かれました。

インターンに参加して得たもの

インターンを通じて、これまで研究で取り組んできた機械学習とは異なる、大規模言語モデル(LLM)の開発に触れることができました。LLM については未経験でしたが、使用する技術や学習手法の違いに大きな衝撃を受けました。小規模な機械学習とはスケールもアプローチも大きく異なり、LLM の研究開発がどのように進められているのかを肌で感じられたことは、今後に生かせる非常に大きな収穫でした。

さらに、インターン中には他チームのエンジニアの方々と交流する機会も多くありました。PFN にはインフラ、深層学習向けコンパイラ、創薬など、多様なチームが存在しており、それぞれの最先端技術に触れられたことは非常に刺激的でした。こうした経験を通して、技術の広がりと奥深さを改めて実感しました。

こんな方には PFN インターンをおすすめします! 

PFN という、技術のフロンティアを切り拓く企業でインターンをすることは、大学での研究とは異なる観点での発見や学びを得られ、きっと貴重な経験になると思います。今取り組んでいる分野をさらに深めたい方はもちろん、新しいテーマに挑戦したい方にも、ぜひおすすめしたいです。


 

SHARE
XFacebookLinkedIn

よくある質問