Professional Machine Learning Engineer

Question 221

あなたのチームは、機密性の高い患者情報を処理するヘルスケア企業向けの顧客サポートチャットボットを開発しています。顧客との会話中に取得されたすべての個人識別情報(PII)が、データの保存または分析前に保護されるようにする必要があります。どうすればよいですか?

A.
Cloud Natural Language APIを使用して、チャットボットの会話内のPIIを識別し、墨消しする。
B.
Cloud Natural Language APIを使用して、チャットボットの会話内のPIIを含むすべてのデータを分類およびカテゴリ分けする。
C.
DLP APIを使用して、データを保存する前にチャットボットの会話内のPIIを暗号化する。
D.
DLP APIを使用して、データを保存する前にチャットボットの会話内のPIIをスキャンし、匿名化する。
Question 222

あなたのチームは、特定のドメイン向けに、より小さく蒸留されたLLMを開発する実験を行っています。あなたは、蒸留LLMのいくつかのバリエーションを使用してデータセットでバッチ推論を実行し、そのバッチ推論の出力をCloud Storageに保存しました。既存のVertex AIパイプラインと統合し、LLMバージョンのパフォーマンスを評価するとともにアーティファクトも追跡する評価ワークフローを作成する必要があります。どうすればよいですか?

A.
Cloud Storageからバッチ推論の出力を読み取り、評価メトリクスを計算し、結果をBigQueryテーブルに書き込むカスタムPythonコンポーネントを開発する。
B.
Cloud Storageからバッチ推論の出力を処理し、分散方式で評価メトリクスを計算し、結果をBigQueryテーブルに書き込むDataflowコンポーネントを使用する。
C.
Cloud Storageからバッチ推論の出力を読み取り、評価メトリクスを計算し、結果をBigQueryテーブルに書き込むカスタムVertex AI Pipelinesコンポーネントを作成する。
D.
Cloud Storageからバッチ推論の出力を処理し、評価メトリクスを集計し、結果をBigQueryテーブルに書き込むAutomatic side-by-side (AutoSxS) パイプラインコンポーネントを使用する。
Question 223

センサーの読み取り値に基づいて、生産ラインのコンポーネントの故障を調査するよう依頼されました。データセットを受け取った後、読み取り値の1%未満が故障事例を表す陽性例であることがわかりました。いくつかの分類モデルを訓練しようとしましたが、どれも収束しませんでした。このクラスの不均衡問題をどのように解決すべきですか?

A.
クラス分布を使用して、10%の陽性例を生成する。
B.
最大プーリングとソフトマックス活性化関数を用いた畳み込みニューラルネットワークを使用する。
C.
アップウェイティングを伴うダウンサンプリングを行い、10%の陽性例を含むサンプルを作成する。
D.
陽性例と陰性例の数が等しくなるまで陰性例を削除する。
Question 224

あなたのチームはDNN回帰モデルを訓練し、テストした結果、良好な成績を収めました。デプロイから6ヶ月後、入力データの分布が変化したため、モデルの性能が悪化しています。本番環境における入力データの差異にどのように対処すべきですか?

A.
スキュー(偏り)を監視するためのアラートを作成し、モデルを再学習させます。
B.
モデルに対して特徴量選択を行い、より少ない特徴量でモデルを再学習させます。
C.
モデルを再学習させ、ハイパーパラメータ調整サービスを使用してL2正則化パラメータを選択します。
D.
モデルに対して特徴量選択を行い、より少ない特徴量でモデルを毎月再学習させます。
Question 225

あなたは銀行に勤務しています。Cloud Storageに保存されている非構造化データを使用して、クレジットカード取引が不正かどうかを予測するモデルをトレーニングする必要があります。BigQueryでの分析を容易にするために、データを構造化形式に変換する必要があります。会社の方針では、個人を特定できる情報(PII)を含むデータはCloud Storageに保持する必要があります。分析のためのデータの価値を維持するスケーラブルなソリューションを実装する必要があります。どうすべきですか?

A.
BigQueryの承認済みビューと列レベルのアクセス制御を使用して、データセット内のPIIへのアクセスを制限します。
B.
DLP APIを使用して、機密データをBigQueryにロードする前に非識別化します。
C.
非構造化データを、PIIに準拠した別のBigQueryデータベースに保存します。
D.
BigQueryにロードする前に、ファイルから機密データを手動で削除します。