Professional Machine Learning Engineer
あなたは食品製造会社に勤務しています。あなたの会社の過去の販売データはBigQueryに保存されています。BigQueryからデータを読み取り、将来の販売を予測する複数のTensorFlowモデルをトレーニングするために、Vertex AIのカスタムトレーニングサービスを使用する必要があります。モデルの実験を開始する前に、多数の特徴量に対してmin-maxスケーリングとバケット化を実行するデータ前処理アルゴリズムを実装する予定です。前処理の時間、コスト、開発工数を最小限に抑えたいと考えています。このワークフローをどのように構成すべきですか?
あなたは2つのステップを含むVertex AIパイプラインを作成しました。最初のステップは10TBのデータを前処理し、約1時間で完了し、結果をCloud Storageバケットに保存します。2番目のステップは、処理済みのデータを使用してモデルをトレーニングします。異なるアルゴリズムをテストできるようにモデルのコードを更新する必要があります。パイプラインの変更を最小限に抑えつつ、パイプラインの実行時間とコストを削減したいと考えています。どうすればよいでしょうか?
あなたは銀行に勤務しています。融資申請を人間による審査のためにフラグ付けすべきかどうかを予測するカスタムモデルを作成しました。入力特徴量はBigQueryテーブルに保存されています。モデルは良好に機能しており、本番環境にデプロイする予定です。コンプライアンス要件により、モデルは各予測に対する説明を提供する必要があります。あなたは、最小限の労力でこの機能をモデルコードに追加し、可能な限り正確な説明を提供したいと考えています。どうすべきでしょうか?
あなたは最近、オンラインサービングに使用するモデルをPythonでXGBoostを使用して訓練しました。あなたのモデル予測サービスは、Google Kubernetes Engine (GKE) クラスタ上で実行されているGolangで実装されたバックエンドサービスから呼び出されます。あなたのモデルには前処理および後処理ステップが必要です。これらの処理ステップをサービング時に実行されるように実装する必要があります。あなたは、コードの変更とインフラストラクチャのメンテナンスを最小限に抑え、できるだけ迅速にモデルを本番環境にデプロイしたいと考えています。どうすべきでしょうか?
あなたは大規模なホテルチェーンに勤務しており、マーケティングチームがターゲットマーケティング戦略のための予測を収集するのを支援するよう依頼されました。マーケティング活動を適宜調整できるよう、今後20日間のユーザー生涯価値(LTV)について予測を行う必要があります。顧客データセットはBigQueryにあり、あなたはAutoML Tablesでのトレーニング用に表形式データを準備しています。このデータには、複数の列にまたがる時間信号が含まれています。AutoMLがあなたのデータに最適なモデルを適合させるようにするには、どうすればよいですか?