Professional Machine Learning Engineer
あなたは会社のリードMLエンジニアとして、スキャンされた顧客フォームをデジタル化するためのMLモデルの構築を担当しています。スキャンされた画像をテキストに変換し、Cloud Storageに保存するTensorFlowモデルを開発しました。毎日終わりに収集される集計データに対して、最小限の手動介入でこのMLモデルを使用する必要があります。何をすべきでしょうか?
あなたは最近、数千のデータセットを持つエンタープライズ規模の会社に入社しました。BigQueryの各テーブルには正確な説明があることを知っており、AI Platformで構築しているモデルに使用する適切なBigQueryテーブルを探しています。必要なデータはどのように見つけるべきですか?
時系列データを用いた分類問題に取り組み始め、数回の実験だけで訓練データに対して99%という受信者動作特性曲線下面積(AUC ROC)の値を得ました。高度なアルゴリズムの使用を検討したり、ハイパーパラメータのチューニングに時間を費やしたりしていません。問題を特定し修正するために、次に取るべきステップは何でしょうか?
あなたは、オンライン旅行代理店に勤務しており、その代理店は自社のウェブサイトで他社向けの広告掲載枠も販売しています。あなたは、ユーザーが次に閲覧すべき最も関連性の高いウェブバナーを予測するよう依頼されました。あなたの会社ではセキュリティが重要です。モデルのレイテンシ要件はp99で300ミリ秒、ウェブバナーの在庫は数千種類あり、探索的分析の結果、ナビゲーションコンテキストが有効な予測因子であることがわかっています。あなたは、最もシンプルなソリューションを実装したいと考えています。予測パイプラインをどのように構成すべきですか?
あなたは、トレーニングジョブを送信するためにクラウドベースのバックエンドシステムを使用するデータサイエンティストのチームを管理しています。このシステムは管理が非常に困難になっており、代わりにマネージドサービスを使用したいと考えています。あなたが一緒に仕事をしているデータサイエンティストは、Keras、PyTorch、theano、Scikit-learn、カスタムライブラリなど、さまざまなフレームワークを使用しています。どうすればよいでしょうか?