CertPass

問題1

あなたの小売企業は、BigQueryに保存されている過去の購入データを使用して顧客の解約を予測したいと考えています。データセットには、顧客の属性情報、購入履歴、および顧客が解約したかどうかを示すラベルが含まれています。あなたは、解約のリスクがある顧客を特定するための機械学習モデルを構築したいと考えています。`customer_data` テーブルの `churned` 列をターゲットラベルとして使用し、顧客の解約を予測するためのロジスティック回帰モデルを作成し、トレーニングする必要があります。どのBigQuery MLクエリを使用すべきですか？

CREATE OR REPLACE MODEL `your_project.your_dataset.churn_model` OPTIONS(model_type='LOGISTIC_REG', input_label_cols=['churned']) AS SELECT * EXCEPT(customer_id) -- customer_id は特徴量として使用しない想定 FROM `your_project.your_dataset.customer_data`;

CREATE OR REPLACE MODEL `your_project.your_dataset.churn_model` OPTIONS(model_type='LINEAR_REG', -- 分類には不適切なモデルタイプ input_label_cols=['churned']) AS SELECT * EXCEPT(customer_id) FROM `your_project.your_dataset.customer_data`;

CREATE OR REPLACE MODEL `your_project.your_dataset.churn_model` OPTIONS(model_type='LOGISTIC_REG') AS -- input_label_cols が欠落 SELECT * EXCEPT(customer_id), churned AS label FROM `your_project.your_dataset.customer_data`;

CREATE TABLE `your_project.your_dataset.churn_model` AS -- モデル作成には不適切なステートメント SELECT * EXCEPT(customer_id) FROM `your_project.your_dataset.customer_data` WHERE churned = TRUE;

Question 2

あなたの組織内の別のチームが、BigQueryデータセットへのアクセスを要求しています。データの不正なコピーのリスクを最小限に抑えつつ、そのチームとデータセットを共有する必要があります。また、将来的に他のチームとこのデータを共有する場合に備えて、再利用可能なフレームワークを作成したいと考えています。どうすればよいでしょうか？

チームのGoogle Cloudプロジェクト内に、そのチームのみがアクセスできる承認済みビューを作成する。

Analytics Hubを使用してデータエグレス制限付きのプライベートエクスチェンジを作成し、チームメンバーにアクセス権を付与する。

プロジェクトでドメイン制限共有を有効にする。チームメンバーにデータセットに対するBigQueryデータ閲覧者のIAMロールを付与する。

チームのGoogle Cloudプロジェクト内の、そのチームのみがアクセスできるCloud Storageバケットにデータセットをエクスポートする。

Question 3

あなたの会社は、ユーザーが動画ファイルをアップロードして共有できるウェブサイトを開発しました。これらのファイルは、最初にアップロードされたときに最も頻繁にアクセスされ、共有されます。時間が経つにつれて、ファイルのアクセス頻度と共有頻度は低下しますが、一部の古い動画ファイルは非常に人気が残る場合もあります。あなたは、シンプルで費用対効果の高いストレージシステムを設計する必要があります。どうすればよいですか？

Autoclassが有効化された単一リージョンバケットを作成する。

単一リージョンバケットを作成する。アップロード日に基づいてストレージクラスを変更するCloud Schedulerジョブを24時間ごとに実行するように設定する。

アップロード日に基づいたカスタムのオブジェクトライフサイクル管理ポリシーを持つ単一リージョンバケットを作成する。

デフォルトのストレージクラスとしてArchiveを持つ単一リージョンバケットを作成する。

問題4

あなたは最近、組織内のDataflowストリーミングパイプラインを管理するタスクを引き継ぎましたが、適切なアクセス権が付与されていないことに気づきました。パイプラインを再起動できるように、Google提供のIAMロールを要求する必要があります。最小権限の原則に従う必要があります。どうすべきですか？

Dataflow 開発者ロールを要求する。

Dataflow 閲覧者ロールを要求する。

Dataflow ワーカーロールを要求する。

Dataflow 管理者ロールを要求する。

Question 5

新しいデータパイプラインを作成する必要があります。以下の要件を満たすサーバーレスソリューションを求めています。 • データはPub/Subからストリーミングされ、リアルタイムで処理される。 • データは保存前に変換される。 • データはLookerを使用してSQLで分析できる場所に保存される。パイプラインにはどのGoogle Cloudサービスを推奨しますか？

1. Dataproc Serverless 2. Bigtable

1. Cloud Composer 2. Cloud SQL for MySQL

1. BigQuery 2. Analytics Hub

1. Dataflow 2. BigQuery

72問中 1-5問目

1 2 3 4 5 次へ最後へ

Associate Data Practitioner