Professional Machine Learning Engineer
あなたはサイバーセキュリティ組織向けのシステムログ異常検知モデルに取り組んでいます。TensorFlowを使用してモデルを開発し、リアルタイム予測に使用する予定です。Pub/Sub経由でデータを取り込み、結果をBigQueryに書き込むためのDataflowパイプラインを作成する必要があります。サービングレイテンシを可能な限り最小限に抑えたいと考えています。どうすべきでしょうか?
あなたはモバイルゲーム会社のMLエンジニアです。あなたのチームのデータサイエンティストが最近TensorFlowモデルを訓練し、あなたはこのモデルをモバイルアプリケーションにデプロイする責任を負っています。現在のモデルの推論レイテンシが本番環境の要件を満たしていないことが判明しました。推論時間を50%削減する必要があり、レイテンシ要件を達成するためであれば、モデル精度のわずかな低下は許容できます。新しいモデルを訓練せずに、レイテンシを削減するために最初に試すべきモデル最適化手法はどれですか?
あなたは銀行のデータサイエンスチームに所属しており、ローンのデフォルトリスクを予測するMLモデルを作成しています。あなたは、BigQueryテーブルに数億レコードのトレーニングデータを収集し、クレンジングしました。そして今、TensorFlowとVertex AIを使用して、このデータで複数のモデルを開発し比較したいと考えています。スケーラビリティを考慮しつつ、データ取り込み段階でのボトルネックを最小限に抑えたいと考えています。どうすべきでしょうか?
あなたは最近、概念実証(POC)の深層学習モデルを作成しました。全体的なアーキテクチャには満足していますが、いくつかのハイパーパラメータの値を決定する必要があります。モデルで使用されるカテゴリカル特徴量の適切な埋め込み次元と最適な学習率の両方を決定するために、Vertex AIでハイパーパラメータチューニングを実行したいと考えています。以下の設定を行います。 • 埋め込み次元については、型を整数(INTEGER)とし、最小値を16、最大値を64に設定します。 • 学習率については、型を倍精度浮動小数点数(DOUBLE)とし、最小値を10e-05、最大値を10e-02に設定します。 デフォルトのベイズ最適化チューニングアルゴリズムを使用しており、モデルの精度を最大化したいと考えています。トレーニング時間は問題ではありません。各ハイパーパラメータのスケーリングと最大並列試行数(maxParallelTrials)はどのように設定すべきですか?
あなたは大手企業のデータサイエンス部門のディレクターです。あなたのデータサイエンスチームは最近、トレーニングパイプラインをオーケストレーションするためにKubeflow Pipelines SDKの使用を開始しました。チームはカスタムPythonコードをKubeflow Pipelines SDKに統合するのに苦労しています。彼らのコードをKubeflow Pipelines SDKに迅速に統合するために、どのように指示すべきですか?