Professional Cloud Architect
データ取得を高速化するため、より多くの車両がセルラー接続にアップグレードされ、ETLプロセスにデータを送信できるようになります。現在のFTPプロセスはエラーが発生しやすく、接続が失敗するとファイルの先頭からデータ転送を再開します。これは頻繁に発生します。ソリューションの信頼性を向上させ、セルラー接続でのデータ転送時間を最小限に抑えたいと考えています。 どうすべきですか?
TerramEarth社の2000万台の車両は世界中に分散しています。車両の位置に基づいて、そのテレメトリデータはGoogle Cloud Storage (GCS) のリージョナルバケット(米国、ヨーロッパ、またはアジア)に保存されます。CTOは、車両が10万マイル走行後に故障する原因を特定するために、生のテレメトリデータに関するレポートを実行するように依頼しました。あなたはこのジョブをすべてのデータに対して実行したいと考えています。 このジョブを実行するための最も費用対効果の高い方法は何ですか?
TerramEarth社は、接続されたすべてのトラックにサーバーとセンサーを搭載し、テレメトリデータを収集しています。来年、彼らはそのデータを使用して機械学習モデルをトレーニングしたいと考えています。コストを削減しながら、このデータをクラウドに保存したいと考えています。 どうすべきでしょうか?
この質問については、TerramEarthのケーススタディを参照してください。ヨーロッパのGDPR規制に準拠するため、TerramEarthは、個人データを含むヨーロッパの顧客から生成されたデータを36ヶ月後に削除する必要があります。新しいアーキテクチャでは、このデータはCloud StorageとBigQueryの両方に保存されます。どのように対応すべきですか?
この問題については、TerramEarthのケーススタディを参照してください。TerramEarthはデータファイルをCloud Storageに保存することにしました。1年分のデータを保存し、ファイルストレージのコストを最小限に抑えるために、Cloud Storageのライフサイクルルールを設定する必要があります。 どの(2つのルールから成る)アクションを実行すべきですか?