Professional Machine Learning Engineer

Question 6

あなたは最近Kerasを用いて深層学習モデルを開発し、現在さまざまな学習戦略を試しています。最初に、単一GPUでモデルを学習させましたが、学習プロセスが非常に遅かったです。次に、他に何も変更せずにtf.distribute.MirroredStrategyを使用して4つのGPUに学習を分散させましたが、学習時間の短縮は見られませんでした。どうすべきでしょうか?

A.
tf.distribute.Strategy.experimental_distribute_dataset を使用してデータセットを分散する
B.
カスタムトレーニングループを作成する
C.
tf.distribute.TPUStrategy を使用してTPUを利用する
D.
バッチサイズを増やす
Question 7

あなたは世界中に数百万人の顧客を持つゲーム会社に勤務しています。全てのゲームには、プレイヤー同士がリアルタイムでコミュニケーションできるチャット機能があります。メッセージは20以上の言語で入力可能で、Cloud Translation APIを使用してリアルタイムに翻訳されます。あなたは、様々な言語間でパフォーマンスが均一であり、かつサービングインフラを変更することなく、リアルタイムでチャットをモデレートするMLシステムを構築するよう依頼されました。 あなたは最初のモデルを、Cloud Translation APIによって翻訳されたチャットメッセージを埋め込むために社内のword2vecモデルを使用して訓練しました。しかし、そのモデルは異なる言語間でパフォーマンスに大きな差があります。どのように改善すべきでしょうか?

A.
Min-Diffアルゴリズムのような正則化項を損失関数に追加する。
B.
元の言語のチャットメッセージを使用して分類器を訓練する。
C.
社内のword2vecをGPT-3やT5に置き換える。
D.
偽陽性率が高すぎる言語のモデレーションを削除する。
Question 8

あなたは、大規模多人数同時参加型オンライン(MMO)ゲームを開発するゲーム会社に勤務しています。プレイヤーが今後2週間以内に10ドル以上のアプリ内課金を行うかどうかを予測するTensorFlowモデルを構築しました。このモデルの予測は、各ユーザーのゲーム体験を調整するために使用されます。ユーザーデータはBigQueryに保存されています。コスト、ユーザーエクスペリエンス、管理の容易さを最適化しながらモデルを提供するには、どうすればよいでしょうか?

A.
モデルをBigQuery MLにインポートします。BigQueryからデータをバッチで読み込んで予測を行い、そのデータをCloud SQLにプッシュします。
B.
モデルをVertex AI Predictionにデプロイします。Cloud Bigtableからデータをバッチで読み込んで予測を行い、そのデータをCloud SQLにプッシュします。
C.
モデルをモバイルアプリケーションに組み込みます。アプリ内課金イベントがPub/Subに発行されるたびに予測を行い、そのデータをCloud SQLにプッシュします。
D.
モデルをストリーミングDataflowパイプラインに組み込みます。アプリ内課金イベントがPub/Subに発行されるたびに予測を行い、そのデータをCloud SQLにプッシュします。
Question 9

あなたは、顧客が自社製品を購入する可能性を予測するために、BigQuery MLで線形回帰モデルを構築しています。このモデルでは、都市名の変数が主要な予測要素として使用されます。モデルのトレーニングとサービングのためには、データが列形式で構成されている必要があります。予測変数を維持しながら、最小限のコーディング量でデータを準備したいと考えています。どうすべきでしょうか?

A.
TensorFlowを使用して語彙リストを持つカテゴリ変数を作成します。語彙ファイルを作成し、モデルの一部としてBigQuery MLにアップロードします。
B.
都市情報を含む列を除外した新しいビューをBigQueryで作成します。
C.
Cloud Data Fusionを使用して各都市を1、2、3、4、または5とラベル付けされた地域に割り当て、その番号をモデル内で都市を表すために使用します。
D.
Dataprepを使用して州の列をワンホットエンコーディング手法で変換し、各都市をバイナリ値を持つ列にします。
Question 10

あなたは銀行のMLエンジニアで、モバイルアプリケーションを担当しています。経営陣から、顧客の指紋に基づいて本人確認を行う、アプリ向けのMLベースの生体認証システムを構築するよう依頼されました。指紋は機密性の高い個人情報とみなされ、銀行のデータベースにダウンロードして保存することはできません。このMLモデルを訓練し、デプロイするために、どの学習戦略を推奨しますか?

A.
データ損失防止API
B.
連合学習
C.
MD5によるデータ暗号化
D.
差分プライバシー