Professional Machine Learning Engineer
ソーシャルメディアアプリケーション用に、ユーザーが提出したプロフィール写真が要件を満たしているかどうかを予測するMLモデルを構築する必要があります。アプリケーションは、写真が要件を満たしている場合にユーザーに通知します。アプリケーションが準拠していない写真を誤って受け入れないようにするには、どのようにモデルを構築すべきですか?
現在BigQueryに保存されている複数の構造化データセットに対して、分類ワークフローを構築する必要があります。分類を複数回実行するため、探索的データ分析、特徴量選択、モデル構築、トレーニング、ハイパーパラメータ調整、およびサービングといった一連のステップを、コードを書かずに完了させたいと考えています。どうすべきでしょうか?
あなたは大規模な国際企業でデータサイエンスチームを率いています。あなたのチームがトレーニングするモデルのほとんどは、AI Platform上でGPUを使用し、高レベルTensorFlow APIを用いた大規模モデルです。チームがモデルの新しいバージョンをイテレーションするには、通常数週間から数ヶ月かかります。あなたは最近、チームの支出を見直すよう依頼されました。モデルのパフォーマンスに影響を与えることなく、Google Cloudのコンピューティングコストを削減するにはどうすればよいですか?
BigQueryに保存されている50,000レコードを含むデータセットに基づいて回帰モデルをトレーニングする必要があります。データには、合計20のカテゴリ特徴量と数値特徴量が含まれており、目的変数は負の値を含む可能性があります。モデルのパフォーマンスを最大化しながら、労力とトレーニング時間を最小限に抑える必要があります。この回帰モデルをトレーニングするには、どのアプローチを取るべきですか?
あなたは、100を超える入力特徴量を持つ線形モデルを構築しています。すべての特徴量の値は-1から1の間です。多くの特徴量が情報を持たないのではないかと疑っています。情報を持つ特徴量は元の形式で保持しつつ、情報を持たない特徴量をモデルから削除したいと考えています。どの手法を使用すべきですか?