Professional Machine Learning Engineer
あなたはオンライン衣料品店のレコメンデーションエンジンを開発しています。過去の顧客取引データはBigQueryとCloud Storageに保存されています。探索的データ分析(EDA)、前処理、モデルトレーニングを実行する必要があります。さまざまな種類のアルゴリズムを試しながら、これらのEDA、前処理、トレーニングのステップを再実行する予定です。実験を行う際に、これらのステップの実行にかかるコストと開発労力を最小限に抑えたいと考えています。どのように環境を設定すべきですか?
あなたは最近、モデルをVertex AIエンドポイントにデプロイし、Vertex AI Feature Storeでオンラインサービングを設定しました。Feature Storeを更新するために、毎日のバッチ取り込みジョブを設定しました。バッチ取り込みジョブ中に、Feature StoreのオンラインサービングノードのCPU使用率が高く、特徴量取得のレイテンシが高いことに気づきました。毎日のバッチ取り込み中にオンラインサービングのパフォーマンスを改善する必要があります。どうすればよいですか?
あなたは、表形式データに基づいたカスタムTensorFlow分類モデルを開発しています。生データはBigQueryに保存されており、数億行のデータを含み、カテゴリ特徴量と数値特徴量の両方を含んでいます。一部の数値特徴量にはMaxMinスケーラーを使用し、SKU名などの一部のカテゴリ特徴量にはワンホットエンコーディングを適用する必要があります。モデルは複数のエポックでトレーニングされます。ソリューションの労力とコストを最小限に抑えたいと考えています。どうすべきでしょうか?
あなたは小売企業に勤務しています。各顧客の解約確率を決定するモデルを構築するタスクを任されました。予測結果が解釈可能である必要があります。これにより、その結果をリスクのある顧客をターゲットとしたマーケティングキャンペーンの開発に利用できます。何をすべきでしょうか?
あなたは、ユーザーの食事計画を支援するアプリケーションを開発している会社に勤務しています。あなたは機械学習を使用してレシピのコーパスをスキャンし、記載されている各材料(例:ニンジン、米、パスタ)と各調理器具(例:ボウル、鍋、スプーン)を抽出したいと考えています。各レシピは非構造化テキストファイルに保存されています。あなたは何をすべきですか?