Associate Data Practitioner
あなたの小売企業は、BigQueryに保存されている過去の購入データを使用して顧客の解約を予測したいと考えています。データセットには、顧客の属性情報、購入履歴、および顧客が解約したかどうかを示すラベルが含まれています。あなたは、解約のリスクがある顧客を特定するための機械学習モデルを構築したいと考えています。`customer_data` テーブルの `churned` 列をターゲットラベルとして使用し、顧客の解約を予測するためのロジスティック回帰モデルを作成し、トレーニングする必要があります。どのBigQuery MLクエリを使用すべきですか?
あなたの組織内の別のチームが、BigQueryデータセットへのアクセスを要求しています。データの不正なコピーのリスクを最小限に抑えつつ、そのチームとデータセットを共有する必要があります。また、将来的に他のチームとこのデータを共有する場合に備えて、再利用可能なフレームワークを作成したいと考えています。どうすればよいでしょうか?
あなたの会社は、ユーザーが動画ファイルをアップロードして共有できるウェブサイトを開発しました。これらのファイルは、最初にアップロードされたときに最も頻繁にアクセスされ、共有されます。時間が経つにつれて、ファイルのアクセス頻度と共有頻度は低下しますが、一部の古い動画ファイルは非常に人気が残る場合もあります。 あなたは、シンプルで費用対効果の高いストレージシステムを設計する必要があります。どうすればよいですか?
あなたは最近、組織内のDataflowストリーミングパイプラインを管理するタスクを引き継ぎましたが、適切なアクセス権が付与されていないことに気づきました。パイプラインを再起動できるように、Google提供のIAMロールを要求する必要があります。最小権限の原則に従う必要があります。どうすべきですか?
新しいデータパイプラインを作成する必要があります。以下の要件を満たすサーバーレスソリューションを求めています。 • データはPub/Subからストリーミングされ、リアルタイムで処理される。 • データは保存前に変換される。 • データはLookerを使用してSQLで分析できる場所に保存される。 パイプラインにはどのGoogle Cloudサービスを推奨しますか?
