Professional Machine Learning Engineer
あなたは産業機器製造会社のデータサイエンティストです。全ての工場から収集されたセンサーデータに基づいて、社内の製造工場の電力消費量を推定する回帰モデルを開発しています。センサーは毎日数千万件のレコードを収集します。現在の日付までに収集された全てのデータを使用して、モデルの毎日のトレーニング実行をスケジュールする必要があります。モデルがスムーズに拡張でき、開発作業を最小限に抑えたいと考えています。どうすべきでしょうか?
あなたの組織はオンライン掲示板を運営しています。数ヶ月前、掲示板上で有害な言葉遣いやいじめが増加していることに気づきました。そこで、特定のコメントを有害または不適切として識別する自動テキスト分類器を導入しました。しかし現在、一部のユーザーから、自身の宗教に言及した無害なコメントが有害であると誤分類されているとの報告が寄せられています。さらに調査した結果、この分類器の偽陽性率は、特定の少数派宗教グループに言及するコメントにおいて特に高いことが判明しました。あなたのチームは予算が限られており、すでに人員も手一杯の状態です。この状況で、あなたはどのように対処すべきでしょうか?
あなたは複数の地域に店舗を持つ大手食料品小売店のMLエンジニアです。在庫予測モデルの作成を依頼されました。モデルの特徴量には、地域、場所、過去の需要、季節的な人気が含まれます。アルゴリズムが毎日新しい在庫データから学習するようにしたいと考えています。モデル構築に使用すべきアルゴリズムはどれですか?
あなたは雑誌販売代理店に勤務しており、来年の購読を更新する顧客を予測するモデルを構築する必要があります。会社の過去データをトレーニングセットとして使用し、TensorFlowモデルを作成してVertex AIにデプロイしました。モデルによって提供される各予測について、どの顧客属性が最も予測力を持つかを判断する必要があります。どうすればよいですか?
あなたは製造会社のMLエンジニアです。予知保全のユースケースのために分類モデルを作成しています。重要な機械が今後3日以内に故障するかどうかを予測し、修理班が故障前に機械を修理する十分な時間を確保する必要があります。機械の定期メンテナンスは比較的安価ですが、故障が発生すると非常に高コストになります。あなたは、機械が故障するかどうかを予測するためにいくつかの二値分類器を訓練しました。ここで、予測値1はMLモデルが故障を予測することを意味します。 現在、評価データセットで各モデルを評価しています。あなたは、検出を優先しつつ、モデルによってトリガーされたメンテナンス作業の50%以上が差し迫った機械の故障に対処することを保証するモデルを選択したいと考えています。どのモデルを選択すべきですか?