Associate Data Practitioner
あなたは、月末の重要なレポートに使用されるBigQueryテーブルを管理しています。このテーブルは、新しい販売データで毎週更新されます。テーブルが誤って削除された場合に、データ損失やレポート作成の問題を防ぎたいと考えています。どうすべきでしょうか?
あなたの組織は、IoTイベントデータをPub/Subトピックに送信しています。サブスクライバーアプリケーションは、メッセージを読み取り、データウェアハウスに保存する前に変換を実行します。特にトピックへのデータ書き込みが多い繁忙期には、サブスクライバーアプリケーションが期限内にメッセージを確認応答していないことに気づきました。これらのアクティビティの急増に対応し、メッセージの処理を継続できるようにパイプラインを修正する必要があります。どうすればよいですか?
BigQueryに数百万件の顧客フィードバック記録が保存されています。大規模言語モデル(LLM)であるGeminiを使用してこのデータを要約したいと考えています。最も効率的なアプローチを使用してこの分析を計画し、実行する必要があります。どうすればよいですか?
Cloud Storageに保存されている日次売上CSVファイルを処理してBigQueryにロードし、下流のレポート作成に利用したいと考えています。データ品質の問題に関する洞察を提供しつつデータを変換する、スケーラブルなデータパイプラインを迅速に構築する必要があります。どうすればよいでしょうか?
あなたは、リアルタイム分析のためにBigQueryにデータをロードする前に、入力データの検証とクリーニングを行うデータパイプラインに取り組んでいます。データ検証とクリーニングが効率的に実行され、大量のデータを処理できるようにしたいと考えています。どうすればよいでしょうか?