■組織の役割
音楽、映画、ゲームなどエンターテイメント領域におけるコンテンツ生成・制作のための大規模生成AI技術を研究開発しているR&Dの組織です。生成AIなどの技術は、消費者のライフスタイルやプロのクリエイターのワークフローを変革する可能性を秘めており、今後音楽、映画、ゲーム業界で不可欠な要素になると期待されています。本チームは、これらの業界における世界をリードするエンターテインメントグループと直接連携できる機会を活かしながら、最先端の研究開発に取り組みソニーグループの事業へ貢献します。論文活動等については、https://sony.github.io/creativeai/ でご覧いただけます。
■担当予定の業務内容
・ テキストと音楽/音のマルチモーダルモデル、テキストと画像/動画と音楽/音のマルチモーダルモデルの研究開発(状況に応じて、論文レベルのコアリサーチから実用モデルまで)
・ 大規模なモデル学習
・ 合成データの開発
・ モデルの評価・ベンチマーク
・ 商用モデルの開発・リリース
■想定ポジション
本ポジションは、マルチモーダルモデルの研究開発を担います。テキストの生成や言語理解などTextモーダルに加えて、音楽/音のAudioモーダルや画像/動画といったVisionモーダルを理解するモデルにフォーカスしています。ソニーのエンターテイメント領域では、音楽・映画・ゲームといったコンテンツでこれらのモーダルが複合的に利用される機会があり、アセット検索やコンテンツクリエーションに貢献します。チームにはAI領域の博士研究者が在籍し、最先端のAI技術領域で専門性を磨くことができます。また、グローバルメンバも多く英語を日常的に使う環境です。
※本求人はジェネラル・エンプロイメント・コントラクト社員での採用となるため将来的に別の職務領域や技術領域に異動の可能性がございます。
合わせて、全国の支社、工場、営業所への転勤可能性がございます。