Professional Machine Learning Engineer
あなたは、本番環境でカスタムモデルをトレーニングし実行するためのプロセスを開発しています。モデルと予測のリネージ(系統)を示すことができるようにする必要があります。どうすればよいですか?
あなたの組織は、社内シャトルサービスのルートをより効率的にしたいと考えています。現在、シャトルは午前7時から午前10時までの間、30分ごとに市内のすべての乗車ポイントに停車しています。開発チームは既に、ユーザーが前日に乗車意思とシャトル停留所を確認する必要があるアプリケーションをGoogle Kubernetes Engine上に構築しています。あなたはどのようなアプローチを取るべきですか?
あなたは、以下のジョブ投入スクリプトを使用して、AI Platform上でテキストを要約するためのLSTMベースのモデルをトレーニングしています。 ``` gcloud ai-platform jobs submit training $JOB_NAME \ --package-path $TRAINER_PACKAGE_PATH \ --module-name $MAIN_TRAINER_MODULE \ --job-dir $JOB_DIR \ --region $REGION \ --scale-tier basic \ -- \ --epochs 20 \ --batch_size=32 \ --learning_rate=0.001 \ ``` モデルの精度を大幅に損なうことなく、トレーニング時間を最小限に抑えたいと考えています。何をすべきですか?
あなたはホテルに勤務しており、紙ベースの顧客フィードバックフォームからスキャンされた顧客のコメントを含むデータセットを扱っています。これらのコメントはPDFファイルとして保存されています。すべてのフォームは同じレイアウトです。各フォームの顧客コメントから、全体的な満足度スコアを迅速に予測する必要があります。このタスクをどのように達成すべきですか?
あなたは、大規模なBigQueryテーブルに保存されたデータで分類モデルをトレーニングするVertex AIパイプラインを開発しました。このパイプラインは4つのステップで構成されており、各ステップはKubeFlow v2 APIを使用するPython関数によって作成されます。コンポーネント名は以下の通りです(画像1参照)。 Vertex AIパイプラインは以下のように起動します(画像2参照)。 あなたは、トレーニングステップのコードとパラメータを調整することで、多くのモデルイテレーションを実行しています。開発、特にデータエクスポートと前処理のステップに関連して高いコストが発生していることに気づきました。モデル開発コストを削減する必要があります。どうすればよいでしょうか?

