Professional Machine Learning Engineer
あなたは研究者チームと協力して、金融分析のための最先端のアルゴリズムを開発しています。あなたのチームはTensorFlowで複雑なモデルを開発し、デバッグしています。あなたは、デバッグの容易さを維持しつつ、モデルのトレーニング時間も短縮したいと考えています。トレーニング環境をどのように設定すべきですか?
あなたは複数の入力パラメータを持つMLパイプラインを作成しました。異なるパラメータの組み合わせ間のトレードオフを調査したいと考えています。パラメータの選択肢は以下の通りです。 • 入力データセット • ブースティングツリー回帰モデルの木の最大深度 • オプティマイザの学習率 F1スコア、学習時間、モデルの複雑さで測定される、異なるパラメータの組み合わせのパイプラインパフォーマンスを比較する必要があります。あなたのアプローチは再現可能であり、すべてのパイプライン実行を同じプラットフォームで追跡できるようにしたいと考えています。何をすべきですか?
本番環境で実行中のVertex AI Model Monitoringジョブから、トレーニング・サービング スキューのアラートを受信しました。より新しいトレーニングデータでモデルを再トレーニングし、Vertex AIエンドポイントに再デプロイしましたが、依然として同じアラートを受信しています。どうすべきでしょうか?
あなたはVertex AIを使用してカスタムモデルを開発し、過去のトランザクションデータに基づいて自社製品の売上を予測しています。近い将来、特徴量の分布や特徴量間の相関関係が変化すると予想しています。また、大量の予測リクエストを受け取ることも想定しています。ドリフト検出のためにVertex AI Model Monitoringを使用する予定であり、コストを最小限に抑えたいと考えています。どうすべきでしょうか?
最近トレーニングしたscikit-learnモデルがあり、Vertex AIにデプロイする予定です。このモデルは、オンライン予測とバッチ予測の両方をサポートします。モデル推論のために入力データを前処理する必要があります。追加のコードを最小限に抑えながら、デプロイのためにモデルをパッケージ化したいと考えています。どうすればよいですか?