Professional Machine Learning Engineer
あなたは、画像検索エンジンを開発しているオンライン小売企業に勤務しています。Google Cloud上にエンドツーエンドのMLパイプラインをセットアップし、画像に自社製品が含まれているかどうかを分類しています。近い将来に新製品がリリースされることを見越して、新しいデータをMLモデルに供給できるように、パイプラインに再トレーニング機能を設定しました。また、AI Platformの継続的評価サービスを使用して、モデルがテストデータセットに対して高い精度を維持できるようにしたいと考えています。どうすべきでしょうか?
あなたは銀行に勤務しており、不正検出のためのランダムフォレストモデルを構築しています。あなたには取引データセットがあり、そのうち1%が不正取引として識別されています。どのデータ変換戦略が、あなたの分類器のパフォーマンスを向上させる可能性が高いですか?
あなたは転移学習を使用して、事前学習済みのEfficientNetモデルに基づいた画像分類器をトレーニングしています。トレーニングデータセットには20,000枚の画像があり、モデルを1日に1回再トレーニングする予定です。インフラストラクチャのコストを最小限に抑える必要があります。どのプラットフォームコンポーネントと構成環境を使用すべきですか?
データセットの探索的分析を行っている際に、カテゴリ特徴量Aが大きな予測力を持つものの、時々欠損していることがわかりました。どうすべきでしょうか?
あなたは大手小売業者に勤務しており、顧客を購入習慣に基づいてセグメント化するよう依頼されました。全顧客の購入履歴はBigQueryにアップロードされています。いくつかの明確な顧客セグメントが存在する可能性があると考えていますが、その数は不明であり、彼らの行動における共通点もまだ理解できていません。最も効率的な解決策を見つけたいと考えています。どうすべきでしょうか?