Professional Machine Learning Engineer
あなたは電気通信会社に勤務しています。次の電話料金の支払いを怠る可能性のある顧客を予測するモデルを構築しています。このモデルの目的は、リスクのある顧客に対し、サービス割引や請求期限の延長といった支援を積極的に提供することです。データはBigQueryに保存されており、モデルの訓練に利用可能な予測特徴量には以下が含まれます。 - 顧客ID (Customer_id) - 年齢 (Age) - 給与 (Salary)(現地通貨単位) - 性別 (Sex) - 平均請求額 (Average bill value)(現地通貨単位) - 先月の通話回数 (Number of phone calls in the last month)(整数) - 平均通話時間 (Average duration of phone calls)(分単位) あなたは、不利な立場にあるグループに対する潜在的なバイアスを調査・軽減しつつ、モデルの精度を維持する必要があります。 どうすべきですか?
最近トレーニングしたXGBoostモデルを、オンライン推論のために本番環境にデプロイする予定です。モデルのバイナリに予測リクエストを送信する前に、簡単なデータ前処理ステップを実行する必要があります。このステップは、内部VPC Service Controls内でリクエストを受け付け、予測を返すREST APIを公開します。この前処理ステップを、コストと労力を最小限に抑えて構成したいと考えています。どうすべきでしょうか?
あなたは銀行に勤務しています。ローンの申請決定を支援するための信用リスクモデルを開発する必要があります。TensorFlowのニューラルネットワークを使用してモデルを実装することにしました。規制要件のため、モデルの予測をその特徴量に基づいて説明できる必要があります。モデルがデプロイされた際には、モデルのパフォーマンスを時系列で監視したいと考えています。モデルの開発とデプロイの両方にVertex AIを使用することにしました。何をすべきでしょうか?
あなたは、モデルの1つが犯した誤分類エラーの根本原因を調査しています。モデルのトレーニングとデプロイには Vertex AI Pipelines を使用しました。このパイプラインは BigQuery からデータを読み込み、Cloud Storage に TFRecord 形式でデータのコピーを作成し、そのコピーを使用して Vertex AI Training でモデルをトレーニングし、Vertex AI エンドポイントにモデルをデプロイします。誤分類を行ったモデルの特定のバージョンを特定し、このモデルがトレーニングされたデータを復元する必要があります。そのデータのコピーをどのように見つけるべきですか?
あなたは製造会社に勤務しています。組立ラインの最終工程で製品の欠陥を検出するために、カスタム画像分類モデルをトレーニングする必要があります。モデルのパフォーマンスは良好ですが、ホールドアウトセット内の一部の画像が一貫して高い信頼度で誤分類されています。Vertex AIを使用してモデルの結果を理解したいと考えています。どうすべきでしょうか?