Associate Data Practitioner
あなたの組織では、Pub/Subに毎秒数千件到着するイベントのほぼリアルタイム分析を実装する必要があります。受信メッセージには変換が必要です。開発時間を最小限に抑えながら、データを処理、変換し、BigQueryにロードするパイプラインを設定する必要があります。どうすればよいですか?
あなたの組織では、過去の顧客注文データを保存する必要があります。データは分析のために月に1回だけアクセスされ、アクセス時には数秒以内にすぐに利用可能である必要があります。データの迅速な取得を保証しつつ、ストレージコストを最小限に抑えるストレージクラスを選択する必要があります。どの方法を選択すべきですか?
あなたは、Cloud Storage に保存されているウェブサイトのトラフィックログを処理し、処理されたデータを BigQuery に書き込む Dataflow パイプラインを持っています。このパイプラインが断続的に失敗していることに気づきました。この問題をトラブルシューティングする必要があります。どうすればよいですか?
あなたの組織のビジネスアナリストは、ストリーミングデータへのほぼリアルタイムのアクセスを必要としています。しかし、彼らはダッシュボードのクエリの読み込みが遅いと報告しています。BigQueryのクエリパフォーマンスを調査した結果、遅いダッシュボードクエリは複数の結合と集計を実行していることがわかりました。 ダッシュボードの読み込み時間を改善し、ダッシュボードのデータが可能な限り最新であることを保証する必要があります。何をすべきですか?
複数のGoogle Cloudリージョンにあるアプリケーションからイベント情報をBigQueryにストリーミングし、ほぼリアルタイムで分析するためのデータパイプラインを作成する必要があります。データはロード前に変換が必要です。ビジュアルインターフェースを使用してパイプラインを作成したいと考えています。どうすべきでしょうか?