Professional Machine Learning Engineer
あなたはAI PlatformでMLモデルを開発し、それを本番環境に移行しようとしています。毎秒数千クエリを処理しており、レイテンシの問題が発生しています。受信リクエストは、Google Kubernetes Engine (GKE) 上で実行されている複数のKubeflow CPUのみのポッドに、ロードバランサーによって分散されています。あなたの目標は、基盤となるインフラストラクチャを変更することなく、サービングのレイテンシを改善することです。何をすべきですか?
あなたは、モデルのトレーニングと予測の前に生データを前処理するためにDataflowを使用する需要予測パイプラインを本番環境で運用しています。前処理中に、BigQueryに保存されているデータに対してZスコア正規化を行い、その結果をBigQueryに書き戻しています。新しいトレーニングデータは毎週追加されます。計算時間と手動介入を最小限に抑えることで、このプロセスをより効率的にしたいと考えています。どうすべきですか?
顧客の購入履歴に基づいて顧客の購入を予測する、Kerasでカスタマイズされたディープニューラルネットワークを設計する必要があります。複数のモデルアーキテクチャを使用してモデルのパフォーマンスを調査し、トレーニングデータを保存し、同じダッシュボードで評価メトリクスを比較できるようにしたいと考えています。何をすべきですか?
あなたは Google Kubernetes Engine 上で Kubeflow パイプラインを開発しています。パイプラインの最初のステップは、BigQuery に対してクエリを発行することです。そのクエリの結果を、パイプラインの次のステップの入力として使用する予定です。これを可能な限り最も簡単な方法で達成したいと考えています。どうすべきでしょうか?
あなたは日々の気温を予測するモデルを構築しています。データをランダムに分割し、その後、訓練データセットとテストデータセットを変換しました。モデル訓練用の気温データは1時間ごとにアップロードされます。テスト時、モデルは97%の精度を示しましたが、本番環境にデプロイした後、モデルの精度は66%に低下しました。本番モデルの精度をより高めるにはどうすればよいですか?