Professional Machine Learning Engineer

Question 16

あなたは、ある大企業のコンタクトセンターに所属するMLエンジニアです。録音された電話の会話から顧客の感情を予測する感情分析ツールを構築する必要があります。コンタクトセンターに電話をかけてきた顧客の性別、年齢、文化的な違いが、モデル開発パイプラインのどの段階や結果にも影響を与えないようにしつつ、モデルを構築するための最善のアプローチを特定する必要があります。あなたはどうすべきですか?

A.
音声をテキストに変換し、文に基づいて感情を抽出する。
B.
音声をテキストに変換し、単語に基づいてモデルを構築する。
C.
音声録音から直接感情を抽出する。
D.
音声をテキストに変換し、構文解析を用いて感情を抽出する。
Question 17

あなたの会社のモバイルアプリケーションから得られるユーザーアクティビティデータを分析する必要があります。あなたのチームは、データ分析、変換、およびMLアルゴリズムの実験にBigQueryを使用します。ユーザーアクティビティデータをBigQueryにリアルタイムで取り込むことを保証する必要があります。何をすべきですか?

A.
Pub/Subを設定して、データをBigQueryにストリーミングする。
B.
DataprocでApache Sparkストリーミングジョブを実行し、データをBigQueryに取り込む。
C.
Dataflowストリーミングジョブを実行し、データをBigQueryに取り込む。
D.
Pub/SubとDataflowストリーミングジョブを設定し、データをBigQueryに取り込む。
Question 18

あなたは、6人のプレイヤーからなるチーム同士が5分間のバトルで対戦する人気のオンラインマルチプレイヤーゲームを運営するゲーム会社に勤務しています。毎日多くの新規プレイヤーがいます。あなたは、利用可能なプレイヤーをリアルタイムで自動的にチームに割り当てるモデルを構築する必要があります。ユーザー調査によると、スキルレベルの近いプレイヤー同士でバトルを行うと、ゲームがより楽しくなることが示されています。モデルのパフォーマンスを測定するために、どのビジネス指標を追跡すべきですか?

A.
プレイヤーがチームに割り当てられるまでの平均待機時間
B.
予測された能力と実際の能力に基づいてプレイヤーをチームに割り当てる際の適合率と再現率
C.
ユーザーあたりの1日の対戦数で測定されるユーザーエンゲージメント
D.
追加収益から新モデルの開発コストを差し引いたもので測定される投資収益率
Question 19

あなたは、広範な要因に基づいて株式市場のトレンドを予測するMLモデルを構築しています。データを探索している際に、一部の特徴量の範囲が非常に大きいことに気づきました。値の規模が最も大きな特徴量がモデルを過学習させないようにしたいと考えています。どうすればよいでしょうか?

A.
対数関数でデータを変換して標準化する。
B.
主成分分析 (PCA) を適用して、特定の特徴量の影響を最小化する。
C.
ビニング戦略を使用して、各特徴量の値を適切なビン番号に置き換える。
D.
データを0から1の間の値にスケーリングして正規化する。
Question 20

あなたは、生物学的特性に基づいた深層学習MLモデルの実験を行っているバイオテクノロジー系スタートアップ企業に勤務しています。あなたのチームは、MLモデルの新しいアーキテクチャを用いた初期段階の実験を頻繁に行い、C++でカスタムTensorFlow演算を作成しています。モデルのトレーニングは、大規模なデータセットと大きなバッチサイズで行います。典型的なバッチサイズは1024サンプルで、各サンプルは約1MBです。全ての重みと埋め込みを含むネットワークの平均サイズは20GBです。これらのモデルには、どのハードウェアを選択すべきでしょうか?

A.
2台のn1-highcpu-64マシン(各マシンに8基のNVIDIA Tesla V100 GPU、合計128GBのGPUメモリ)と、64 vCPUおよび58GB RAMを搭載したn1-highcpu-64マシン1台からなるクラスタ
B.
2台のa2-megagpu-16gマシン(各マシンに16基のNVIDIA Tesla A100 GPU、合計640GBのGPUメモリ)、96 vCPU、および1.4TB RAMからなるクラスタ
C.
v2-8 TPUおよび64GB RAMを搭載したn1-highcpu-64マシン1台からなるクラスタ
D.
4台のn1-highcpu-96マシン(各マシンに96 vCPUおよび86GB RAM)からなるクラスタ