Professional Machine Learning Engineer
あなたは、自動車エンジンの欠陥の種類を視覚的に分類するために、AI Platform上でTPUを使用してResNetモデルをトレーニングしています。Cloud TPUプロファイラプラグインを使用してトレーニングプロファイルをキャプチャしたところ、非常に強く入力バウンド(入力処理がボトルネック)になっていることがわかりました。ボトルネックを削減し、モデルのトレーニングプロセスを高速化したいと考えています。tf.dataデータセットにどの変更を加えるべきですか?(2つ選択)
あなたはKubeflowパイプラインを使用して、エンドツーエンドのPyTorchベースのMLOpsパイプラインを開発しています。このパイプラインは、BigQueryからデータを読み込み、データを処理し、特徴量エンジニアリング、モデルトレーニング、モデル評価を行い、モデルをバイナリファイルとしてCloud Storageにデプロイします。あなたは特徴量エンジニアリングとモデルトレーニングのステップについて複数の異なるバージョンのコードを作成しており、それぞれの新しいバージョンをVertex AI Pipelinesで実行しています。各パイプラインの実行に1時間以上かかっています。開発時間を短縮するためにパイプラインの実行を高速化し、追加のコストは避けたいと考えています。どうすべきでしょうか?
あなたは、最近ML(機械学習)とデータワークロードをGoogle Cloudに移行することを決定した大規模な組織で働いています。データエンジニアリングチームは、構造化データをAvro形式でCloud Storageバケットにエクスポートしました。あなたは、分析を実行し、特徴量を作成し、MLモデルがオンライン予測に使用する特徴量をホストするワークフローを提案する必要があります。パイプラインをどのように構成すべきですか?
あなたは、従来のチャット、音声、ビデオ会議を1つのプラットフォームに統合したクラウドベースのコミュニケーションプラットフォームを保守する組織で働いています。音声録音はCloud Storageに保存されています。すべての録音は8kHzのサンプリングレートで、長さは1分以上です。あなたは、通話要約や感情分析などの将来のアプリケーションのために、音声通話の録音を自動的にテキストに書き起こす新機能をプラットフォームに実装する必要があります。Google推奨のベストプラクティスに従って、音声通話の書き起こし機能をどのように実装すべきですか?
あなたは、最近スペインで事業を開始した多国籍企業に勤務しています。あなたの組織内のチームは、ビジネス文書、法律文書、財務文書など、さまざまなスペイン語の文書を扱う必要があります。機械学習を使用して、組織が最小限の労力で迅速かつ正確な翻訳を得られるようにしたいと考えています。あなたの組織では、ドメイン固有の用語や専門用語は必要ありません。どうすべきでしょうか?