Professional Machine Learning Engineer
リアルタイムセンサーデータの異常を検出するためのMLモデルを構築しています。受信リクエストの処理にはPub/Subを使用します。結果は分析と可視化のために保存したいと考えています。パイプラインはどのように構成すべきですか?
あなたのチームは、画像に運転免許証、パスポート、またはクレジットカードが含まれているかどうかを予測するモデルを構築する必要があります。データエンジニアリングチームは既にパイプラインを構築し、運転免許証の画像10,000枚、パスポートの画像1,000枚、クレジットカードの画像1,000枚からなるデータセットを生成しました。あなたは今、次のラベルマップを使用してモデルを訓練する必要があります: [`˜drivers_license', `˜passport', `˜credit_card']。どの損失関数を使用すべきですか?
あなたは製造会社のMLエンジニアです。組立ラインの最後に撮影された製品の画像に基づいて、製品の欠陥を特定するモデルを構築する必要があります。計算量を抑えて画像を前処理し、製品の欠陥の特徴を迅速に抽出できるモデルにしたいと考えています。モデルを構築するために、どのアプローチを使用すべきですか?
あなたは、X線画像が骨折リスクを示すかどうかを分類するためのMLモデルを開発しています。Vertex AI上でTPUをアクセラレータとして使用し、ResNetアーキテクチャを学習させましたが、学習時間とメモリ使用量に不満があります。学習コードのイテレーションを迅速に行い、コードの変更は最小限に抑え、モデルの精度への影響も最小限にしたいと考えています。何をすべきでしょうか?
あなたは、表形式データで学習させた大規模で複雑なTensorFlowモデルを本番環境にデプロイすることに成功しました。my-fortune500-company-projectという名前のプロジェクトにあるsubscription.subscriptionPurchaseという名前のBigQueryテーブルに保存されている各サブスクリプションの顧客生涯価値(LTV)フィールドを予測したいと考えています。BigQueryテーブルからのデータの前処理から、検証済みモデルのVertex AIエンドポイントへのデプロイまでのすべてのトレーニングコードを、TensorFlow Extended(TFX)パイプラインにまとめました。予測ドリフト、つまり本番環境における特徴量のデータ分布が時間とともに大幅に変化する状況を防ぎたいと考えています。どうすればよいでしょうか?