Professional Machine Learning Engineer
あなたは、カテゴリ型の入力値を含むデータセットを用いて、深層ニューラルネットワークによる分類モデルを構築しています。一部の列では、カテゴリの種類の数(カーディナリティ)が10,000を超えています。これらのカテゴリ型の値を、モデルの入力とするためにどのようにエンコードすべきでしょうか?
数百万のサンプルと10万のユニークな単語を含む製品説明に対してテキスト分類を行う自然言語モデルを訓練する必要があります。リカレントニューラルネットワーク(RNN)に入力できるように、単語を個別に前処理したいと考えています。何をすべきですか?
あなたは公共交通機関の会社に勤務しており、複数の交通ルートの遅延時間を推定するモデルを構築する必要があります。予測は、アプリ内のユーザーにリアルタイムで直接提供されます。季節や人口増加の違いがデータの関連性に影響を与えるため、モデルを毎月再トレーニングします。あなたは、Googleが推奨するベストプラクティスに従いたいと考えています。予測モデルのエンドツーエンドアーキテクチャをどのように構成すべきですか?
あなたはオンライン旅行代理店に勤務しており、その会社は自社のウェブサイト上の広告掲載枠を他の企業にも販売しています。あなたは、ユーザーが次に閲覧すべき最も関連性の高いウェブバナーを予測するよう依頼されました。あなたの会社にとってセキュリティは重要です。モデルのレイテンシ要件はp99で300ミリ秒、在庫は数千のウェブバナーであり、探索的分析の結果、ナビゲーションコンテキストが優れた予測因子であることがわかっています。あなたは最もシンプルなソリューションを実装したいと考えています。予測パイプラインをどのように構成すべきですか?
あなたのデータサイエンスチームは、定期的なモデル再トレーニング、Dockerコンテナ、そしてオンライン予測リクエストのための自動スケーリングとモニタリングをサポートするサービスを要求しています。このシステムにはどのプラットフォームコンポーネントを選択すべきですか?