Professional Machine Learning Engineer

Question 256

あなたは最近、新しいプロジェクトを間もなくリリースする機械学習チームに参加しました。プロジェクトのリーダーとして、あなたはMLコンポーネントの本番稼働準備状況を判断するよう求められています。チームはすでに特徴量とデータ、モデル開発、およびインフラストラクチャをテスト済みです。チームに推奨すべき追加の準備状況チェックはどれですか?

A.
トレーニングが再現可能であることを確認する。
B.
すべてのハイパーパラメータが調整済みであることを確認する。
C.
モデルのパフォーマンスが監視されていることを確認する。
D.
特徴量の期待値がスキーマに記述されていることを確認する。
Question 257

あなたはクレジットカード会社に勤務しており、AutoML Tablesを使用して過去のデータに基づいたカスタム不正検知モデルを作成するよう依頼されました。偽陽性を最小限に抑えながら、不正取引の検出を優先する必要があります。モデルをトレーニングする際に、どの最適化目標を使用すべきですか?

A.
対数損失を最小化する最適化目標
B.
再現率0.50における適合率を最大化する最適化目標
C.
適合率-再現率曲線下面積(AUC PR)の値を最大化する最適化目標
D.
受信者動作特性曲線下面積(AUC ROC)の値を最大化する最適化目標
Question 258

あなたの会社は、ユーザーが動画を視聴したりアップロードしたりできる動画共有ウェブサイトを運営しています。あなたは、どの新規アップロード動画が最も人気が出るかを予測するMLモデルを作成し、それらの動画を会社のウェブサイトで優先的に表示できるようにする必要があります。モデルが成功したかどうかを判断するために、どの結果を使用すべきですか?

A.
モデルは、動画をアップロードしたユーザーが10,000以上の「いいね」を獲得している場合に、その動画を人気があると予測します。
B.
モデルは、クリック数で測定された、最も人気のあるクリックベイト動画の97.5%を予測します。
C.
モデルは、アップロード後30日以内の視聴時間で測定された、最も人気のある動画の95%を予測します。
D.
公開後7日と30日の対数変換された視聴回数の間のピアソンの相関係数が0に等しい。
Question 259

あなたはニューラルネットワークベースのプロジェクトに取り組んでいます。提供されたデータセットには、範囲が異なる列が含まれています。モデルトレーニングのためにデータを準備している際に、勾配最適化が重みを適切な解に移動させるのに苦労していることがわかりました。どうすべきですか?

A.
特徴量エンジニアリングを使用して、最も強力な特徴量を組み合わせる。
B.
表現変換(正規化)技術を使用する。
C.
欠損値のある特徴量を削除することで、データクリーニングのステップを改善する。
D.
テストセットの次元を減らし、より大きなトレーニングセットを持つように、分割ステップを変更する。
Question 260

あなたのデータサイエンスチームは、様々な特徴量、モデルアーキテクチャ、ハイパーパラメータを用いて迅速に実験を行う必要があります。彼らは様々な実験の精度メトリクスを追跡し、APIを使用して時系列でメトリクスを照会する必要があります。手作業を最小限に抑えながら実験を追跡し報告するために、何を使用すべきでしょうか?

A.
Kubeflow Pipelinesを使用して実験を実行します。メトリクスファイルをエクスポートし、Kubeflow Pipelines APIを使用して結果を照会します。
B.
AI Platform Trainingを使用して実験を実行します。精度メトリクスをBigQueryに書き込み、BigQuery APIを使用して結果を照会します。
C.
AI Platform Trainingを使用して実験を実行します。精度メトリクスをCloud Monitoringに書き込み、Monitoring APIを使用して結果を照会します。
D.
AI Platform Notebooksを使用して実験を実行します。結果を共有Google Sheetsファイルに収集し、Google Sheets APIを使用して結果を照会します。