Professional Machine Learning Engineer
あなたは、ある大企業のコンタクトセンターに所属するMLエンジニアです。録音された電話の会話から顧客の感情を予測する感情分析ツールを構築する必要があります。コンタクトセンターに電話をかけてきた顧客の性別、年齢、文化的な違いが、モデル開発パイプラインのどの段階や結果にも影響を与えないようにしつつ、モデルを構築するための最善のアプローチを特定する必要があります。あなたはどうすべきですか?
あなたの会社のモバイルアプリケーションから得られるユーザーアクティビティデータを分析する必要があります。あなたのチームは、データ分析、変換、およびMLアルゴリズムの実験にBigQueryを使用します。ユーザーアクティビティデータをBigQueryにリアルタイムで取り込むことを保証する必要があります。何をすべきですか?
あなたは、6人のプレイヤーからなるチーム同士が5分間のバトルで対戦する人気のオンラインマルチプレイヤーゲームを運営するゲーム会社に勤務しています。毎日多くの新規プレイヤーがいます。あなたは、利用可能なプレイヤーをリアルタイムで自動的にチームに割り当てるモデルを構築する必要があります。ユーザー調査によると、スキルレベルの近いプレイヤー同士でバトルを行うと、ゲームがより楽しくなることが示されています。モデルのパフォーマンスを測定するために、どのビジネス指標を追跡すべきですか?
あなたは、広範な要因に基づいて株式市場のトレンドを予測するMLモデルを構築しています。データを探索している際に、一部の特徴量の範囲が非常に大きいことに気づきました。値の規模が最も大きな特徴量がモデルを過学習させないようにしたいと考えています。どうすればよいでしょうか?
あなたは、生物学的特性に基づいた深層学習MLモデルの実験を行っているバイオテクノロジー系スタートアップ企業に勤務しています。あなたのチームは、MLモデルの新しいアーキテクチャを用いた初期段階の実験を頻繁に行い、C++でカスタムTensorFlow演算を作成しています。モデルのトレーニングは、大規模なデータセットと大きなバッチサイズで行います。典型的なバッチサイズは1024サンプルで、各サンプルは約1MBです。全ての重みと埋め込みを含むネットワークの平均サイズは20GBです。これらのモデルには、どのハードウェアを選択すべきでしょうか?