Platinum Data Blog by BrainPad ブレインパッド

本記事は、データサイエンティストが活躍するプロジェクトの一例を就活生の皆さんに具体的に理解してもらうことを目的に、ブレインパッドに新卒入社した若手データサイエンティストがインタビューを企画・執筆したものです。
今回は新卒入社3年目で、さまざまなプロジェクトで活躍する飯田さんに、データサイエンティストとしての業務についてお話ししてもらいました。プロジェクト遂行にはコミュニケーションスキル等のビジネススキルはもちろん、プロフェッショナルとしての高度な技術力も要求されます。今回はその中でも特に、画像データを扱うプロジェクトの魅力や必要となるスキルに焦点を当ててお伝えします。

プロジェクト紹介:新卒1年目から画像プロジェクトに従事

—早速ですが、これまで経験されたプロジェクトの概要を教えてください

新卒1年目の後半から画像データを扱うプロジェクト(以下「画像プロジェクト」と呼ぶ)に複数携わり、現在に至ります。画像プロジェクトにはこれまで約1年半取り組んできました。

画像プロジェクトの支援対象は歯科領域や、小売・製造など多岐に渡り、幅広い業界の課題解決を経験してきました。さらにいわゆる企業の課題解決だけでなく、産学連携による研究テーマの探索という最新技術の活用が不可欠な支援も担当していました。新卒同期入社の中でも、私が一番画像技術の経験を積んできた自信があります。

また、私が経験したプロジェクトでは、いずれもプロジェクトマネジャー1名とメンバー1名という比較的小規模な構成で進められており、私はメンバーとしてデータ分析の設計から実施、クライアントへの成果報告までを主に担当しました。

——プロジェクトで扱ったデータや技術についてお話しいただけますか?

これまで扱ってきた画像データは、一般的なグレー画像やカラー画像から始まり、例えばX線CTのような特殊な構造や形式のデータまで幅広く含まれていました。

また具体的な画像処理技術としては、古典的な画像処理から、深層学習による画像分類・物体検出、さらに比較的新しいSAM(Segment Anything Model)やマルチモーダル処理など、多様な技術を扱ってきました。

さらに、実際にプロジェクトへ参画してから分かったのですが、分析において必ずしも画像処理技術だけが求められるわけではなく、それ以外の技術が必要とされる場面も多くありました。これには当初苦労しながらキャッチアップしてきましたが、その点については後ほど詳しくお話しできればと思います。

——プロジェクト概要の説明ありがとうございます。そもそも、どういった経緯で画像プロジェクトを担当することになったのでしょうか?

私はもともと学生時代から画像解析を学んでおり、入社後も「これまでの画像解析に関する経験を活かせるプロジェクトに挑戦したい」と上司に相談していました。ちょうど新卒1年目の終わりごろに、社内公募で新たな画像プロジェクトが立ち上がることになり、立候補したのが最初です。

そのプロジェクトへの参画は3ヶ月で終了しましたが、そこでの働きを評価してもらい、以降は画像プロジェクトを任せてもらえており、これまで計3つの画像プロジェクトで経験を積むことができました。

画像プロジェクトの魅力:画像解析を軸にさまざまな技術を総動員する

——画像プロジェクトの面白さは、どんなところにありますか?

個人的には「結果を直感的に理解できる点」と「さまざまな技術を総動員しプロジェクトを推進する点」が面白いと思っています。

まず「結果を直感的に理解できる点」ですが、例えばテーブルデータでは、集計や分析結果をグラフに変換して解釈することが多いと思います。一方で、画像データでは処理結果そのものが画像として出力されるため、変化を視覚的に解釈できます。これにより、期待通りの結果かどうか、処理が不十分な部分はどこか、どこを改善すべきかといった点を具体的に把握しやすく、次のアクションを明確にしながら進められます。

例えば物体検出のタスクでは、どんな物体が検出されやすいか/漏れやすいかが一目で分かり、課題が「未検出が多いのか」「ノイズを誤検出しているのか」といった形で把握しやすい事があるかなと思います。

——画像は視覚的だからこそ、改善点も見つけやすいというさまざまなのは納得です。もう1つの面白さである「さまざまな技術を総動員して進める点」についても伺いたいです。

実は、過去の事例を見ても、画像プロジェクトのゴール達成に向けたアプローチが「分類」「検出」「セグメンテーション」といった典型的なタスクのみに当てはまることは少なく、むしろ複数の技術を組み合わせるケースが多いです。
実際の進め方としては、画像処理を軸にしつつ、機械学習や生成AIといったさまざまな技術をパーツのように組み合わせ、プロジェクトのゴールに向けて最適なアプローチを設計していきます。
このプロセスには唯一の正解があるわけではなく、試行錯誤の余地が多いことが、私にとって面白いと感じる点です。

具体例として、私が携わった小売業界のプロジェクトでは、クライアントから「画像内に写っている商品が何の商品かを認識してほしい」という依頼をいただきました。
一見すると、画像から商品を分類する、いわゆる「分類タスク」のように思えますが、クライアントの状況をヒアリングしていくと、商品数が膨大かつ商品ごとの画像が4-5枚程度といった、分類モデルにとっては、各クラスの学習データが少ない状況でした。
そのため、分類モデルの学習をせずに要望を達成するために、物体検出や画像のエンベディング(埋め込み)といった画像処理技術を中心に、ベクトル検索、検索結果のリランキングといった画像処理以外の技術も活用しながらプロジェクトに取り組みました。

——幅広い技術を活用するとなると、幅広い技術へのキャッチアップが必要に思えますが、どう乗り越えてきたのでしょうか?

クライアントの要望を丁寧に言語化し、プロジェクトのゴールから逆算して必要な技術を整理することを意識しました。闇雲にキャッチアップしようとすると手戻りが発生してしまうので、ゴールに直結する技術から優先的に学ぶことで、より効率的に習得できるようになったと思います。

とはいえ、成し遂げたいこと自体は言語化できても「具体的にどう進めればいいのか」が思いつかず、行き詰まってしまうケースもあります。そんなときに頼りになるのが、社内Slackの「oshieteチャンネル」です。これは、社内のデータサイエンティストに気軽に相談できるチャットの仕組みで、プロジェクトの状況や悩んでいるポイントを整理して投げかけると、適切な技術やアプローチについて有識者からアドバイスをもらうことができます。

——多様な専門性を持ったデータサイエンティストがいるからこその環境ですね。

画像プロジェクトの留意点:プロジェクト開始のための土台作りが重要

——画像プロジェクトを進めるにあたって、重要なポイントについて教えてください。

プロジェクト開始前の事前準備です。
以下は一例となりますが、実際に私が経験した内容となります。
プロジェクト開始後にこのような問題が発覚するとプロジェクト推進におけるリスクになってしまうため、事前の準備が不可欠だと感じています。

——事前準備が重要とのことでしたが、プロジェクトとしてはどのような動きをするのでしょうか?

事前準備をスムーズに進めるためには、まずクライアントと密にコミュニケーションを取ることが大切です。その上で、データ受領に関しては「ブレインパッドが画像を撮影しにいく」ことを、実際にプロジェクトとして打診したことがあります。また、どうしてもデータ受領が遅延する可能性がある場合は「オープンデータを用いた事前分析」を進めることで、実データが手元になくても検証を行い、その後の分析をスムーズに進める準備をしたこともあります。

画像分析する立場だからこそ、分析に適した画像の特徴を把握しているため、画像撮影から関与することで、どうやって撮影するのが理想的かを提案することができます。
むしろブレインパッドから能動的に理想像を示すことができれば、クライアントもどの程度の撮影条件なら現場でも取得可能かを考えてくださるため、より地に足がついたプロジェクト進行ができるのかなと思います。

具体的には、商用利用可能なライセンスで配布されているオープンデータをリサーチし、クライアントのプロジェクトで想定される形式に近いものがあれば、オープンデータをもとに事前分析や検証を行います。もちろん実データでの検証ではないため、事前分析の結果を鵜呑みにすることはできません。ただ、どの程度の精度が期待できそうか、どのような前処理・後処理の工夫が有効かといった知見を事前に得ることができるため、実データでの分析をスムーズに進めることができると考えています。

——データサイエンティスト自身が、データを取りに行く、探すということもあるんですね。

データサイエンティストは、「データがある前提でいかに価値ある分析を行う」職種だと思われがちです。しかし個人的には、自らデータを取得したり探したりすることで価値を発揮する姿勢も同様に大切だと考えています。
特に画像プロジェクトでは、自らデータを取りに行く、探すといった行動が比較的取りやすいと感じています。私自身も、データ取得の段階から関与できる点に、画像プロジェクトならではの大きな魅力を感じています。

今後のキャリアと就活生へのメッセージ:今の学びを大切に

——今後どのようなデータサイエンティストになっていきたいですか?

画像解析を中心とした技術力を磨きつつ、ビジネス的な視点も持ち合わせ、クライアントへ価値貢献ができるデータサイエンティストになっていきたいと思っています。

直近では、データサイエンティストが分析した結果を実際のシステムで活用するためのクラウド技術やエンジニアリング技術にも関心があります。また現在のプロジェクトでは、プロジェクトマネジャーにも相談し、一部分は実際にチャレンジしています。

また、一般的な技術力とはズレてしまうかもしれませんが、取得したスキルをどのようにクライアントの課題解決へ活用できるかも重要だと考えています。
クライアントの課題を解決するためのアプローチは基本的に、複数選択肢があるため、どのアプローチがクライアントにとって最も効果的・効率的かを見極める力を、今後は特に磨いていきたいと考えています。

一度アプローチを思いつくとそれに頼りがちですが、状況に応じて複数の選択肢を提示し、柔軟に手法を選べることも技術力の1つだと思います。例えば、精度が高くても実装に時間がかかる処理より、多少粗くても短期間で実装でき、早く価値を提供できる手法を選ぶ方が適切な場合もあります。

このように、クライアントやプロジェクトの状況を踏まえ、最適なアプローチを根拠を持って主体的に選択・提案できるデータサイエンティストを目指していきたいです。そのためにも、今後も継続的に技術を学び続けたいと考えています。

——おっしゃるとおり、学んだ技術をどう仕事に応用するかはデータサイエンティストにとって重要ですね。冒頭で仰っていた「ビジネス的な視点」についても詳しく伺えますか?

私が考えるビジネス力とは、広い意味でのクライアントとのコミュニケーション能力だと考えています。
例えば、せっかく示唆に富んだ分析結果を得ても、資料や説明がクライアントに伝わらなければ、クライアント目線での価値にはつながりません。「クライアントとコミュニケーションをとる目的はなにか」から逆算することで、クライアントへ何を伝えるべきかがより明確になるかと思います。

私もはじめはプロジェクトの目的を十分に深掘りできておらず、苦労することもありました。こうした課題と正面から向き合って何が大事なのかを言語化していくことで成長できていると実感します。

——飯田さんの目指しているデータサイエンティスト像がイメージできました。最後に、就活生のみなさんへメッセージをお願いします!

私はもともと農学系出身であり、知識も画像処理に偏っていたため、入社前は「データサイエンティストとして、未経験の業界や技術をキャッチアップして仕事していけるのか」と不安に思う時期もありました。実際に入社してからの約2年間を振り返ってみても、未経験の業界や技術に取り組む場面は数多くありました。

しかし、学生時代に培った経験(研究テーマに対して、仮説を言語化して取り組む力や、テーマを深掘りする力など※)や、これまでに身につけたスキルを社内で発揮・アピールすることで、入社前に抱いていた不安を結果的には払拭できたと感じています。
詳細は大学/大学院時の指導教員との対談記事も公開されているため、読んでいただけると幸いです!
blog.brainpad.co.jp

就活生のみなさんには、「目の前のことに全力で取り組むことが、将来の糧になる」ということを伝えたいです。ぜひ頑張ってください。応援しています!

ブレインパッドでは新卒採用・中途採用共にまだまだ仲間を募集しています。
ご興味のある方は、ぜひ採用サイトをご覧ください!

www.brainpad.co.jp
www.brainpad.co.jp




Source link

関連記事

コメント

この記事へのコメントはありません。