Associate Data Practitioner
あなたは、Cloud Storage から BigQuery に小さなCSVファイルをロードするためのデータ取り込みパイプラインを開発しています。データの遅延を最小限に抑えるために、これらのファイルが到着次第ロードしたいと考えています。これを最小限のコストとメンテナンスで実現したいと考えています。どうすればよいでしょうか?
あなたの組織では、ペタバイト規模のアプリケーションログがParquetファイルとしてCloud Storageに保存されています。これらのファイルに対して迅速に一度限りのSQLベースの分析を実行し、既にBigQueryに存在するデータと結合する必要があります。どうすればよいですか?
あなたのチームは、Cloud Storage内のファイル、Apache Sparkジョブ、BigQuery内のデータから構成される、複雑なタスクと依存関係の集合を含む複数のデータパイプラインを構築しています。これらのタスクと依存関係を、スケジュールに従って特定の順序で実行したいと考えています。これらのデータ処理タスクをスケジュールし、自動化できるシステムを、フルマネージドなアプローチを用いて設計する必要があります。どうすべきですか?
あなたは研究会社のCloud Storageバケットの管理を担当しています。あなたの会社には、明確に定義されたデータ階層化と保持ルールがあります。データ保持のニーズを達成しつつ、ストレージコストを最適化する必要があります。どうすればよいですか?
あなたは、組織のリーダーシップチームにBigQueryの機能を示すために、独自のデータを使用しています。ローカルマシンに保存されているファイルを、できるだけ手間をかけずにBigQueryに一度だけロードする必要があります。どうすればよいですか?