CertPass

Question 66

あなたは産業機器製造会社のデータサイエンティストです。全ての工場から収集されたセンサーデータに基づいて、社内の製造工場の電力消費量を推定する回帰モデルを開発しています。センサーは毎日数千万件のレコードを収集します。現在の日付までに収集された全てのデータを使用して、モデルの毎日のトレーニング実行をスケジュールする必要があります。モデルがスムーズに拡張でき、開発作業を最小限に抑えたいと考えています。どうすべきでしょうか？

カスタムTensorFlow回帰モデルを開発し、Vertex AI Trainingを使用して最適化する。

BigQuery MLを使用して回帰モデルを開発する。

カスタムscikit-learn回帰モデルを開発し、Vertex AI Trainingを使用して最適化する。

カスタムPyTorch回帰モデルを開発し、Vertex AI Trainingを使用して最適化する。

Question 67

あなたの組織はオンライン掲示板を運営しています。数ヶ月前、掲示板上で有害な言葉遣いやいじめが増加していることに気づきました。そこで、特定のコメントを有害または不適切として識別する自動テキスト分類器を導入しました。しかし現在、一部のユーザーから、自身の宗教に言及した無害なコメントが有害であると誤分類されているとの報告が寄せられています。さらに調査した結果、この分類器の偽陽性率は、特定の少数派宗教グループに言及するコメントにおいて特に高いことが判明しました。あなたのチームは予算が限られており、すでに人員も手一杯の状態です。この状況で、あなたはどのように対処すべきでしょうか？

それらのフレーズが無害な方法で使用されている合成トレーニングデータを追加する。

モデルを削除し、人間のモデレーターによる監視に置き換える。

モデルを別のテキスト分類器に置き換える。

コメントが有害または不適切と見なされるためのしきい値を引き上げる。

Question 68

あなたは複数の地域に店舗を持つ大手食料品小売店のMLエンジニアです。在庫予測モデルの作成を依頼されました。モデルの特徴量には、地域、場所、過去の需要、季節的な人気が含まれます。アルゴリズムが毎日新しい在庫データから学習するようにしたいと考えています。モデル構築に使用すべきアルゴリズムはどれですか？

分類

強化学習

リカレントニューラルネットワーク (RNN)

畳み込みニューラルネットワーク (CNN)

Question 69

あなたは雑誌販売代理店に勤務しており、来年の購読を更新する顧客を予測するモデルを構築する必要があります。会社の過去データをトレーニングセットとして使用し、TensorFlowモデルを作成してVertex AIにデプロイしました。モデルによって提供される各予測について、どの顧客属性が最も予測力を持つかを判断する必要があります。どうすればよいですか？

予測結果をBigQueryにストリーミングします。BigQueryのCORR(X1, X2)関数を使用して、各特徴量とターゲット変数間のピアソン相関係数を計算します。

Vertex Explainable AIを使用します。`explain`キーワードを付けて各予測リクエストを送信し、サンプリングされたShapley法を使用して特徴量の帰属を取得します。

Vertex AI Workbenchのユーザー管理ノートブックを使用して、モデルに対してLasso回帰分析を実行します。これにより、強力なシグナルを提供しない特徴量が排除されます。

Google CloudのWhat-Ifツールを使用して、個々の特徴量を除外した場合にモデルがどのように動作するかを判断します。モデルから削除されたときに最も大幅なパフォーマンス低下を引き起こした順に特徴量の重要度をランク付けします。

Question 70

あなたは製造会社のMLエンジニアです。予知保全のユースケースのために分類モデルを作成しています。重要な機械が今後3日以内に故障するかどうかを予測し、修理班が故障前に機械を修理する十分な時間を確保する必要があります。機械の定期メンテナンスは比較的安価ですが、故障が発生すると非常に高コストになります。あなたは、機械が故障するかどうかを予測するためにいくつかの二値分類器を訓練しました。ここで、予測値1はMLモデルが故障を予測することを意味します。現在、評価データセットで各モデルを評価しています。あなたは、検出を優先しつつ、モデルによってトリガーされたメンテナンス作業の50%以上が差し迫った機械の故障に対処することを保証するモデルを選択したいと考えています。どのモデルを選択すべきですか？

ROC曲線下面積（AUC ROC）が最も高く、かつ適合率が0.5より大きいモデル

二乗平均平方根誤差（RMSE）が最も低く、かつ再現率が0.5より大きいモデル

適合率が0.5より大きい条件で、再現率が最も高いモデル

再現率が0.5より大きい条件で、適合率が最も高いモデル

Professional Machine Learning Engineer