Professional Machine Learning Engineer
あなたはVertex AI Workbenchのユーザー管理ノートブックで、組み込みの分散XGBoostモデルを試しています。BigQueryを使用して、以下のクエリでデータを訓練セットと検証セットに分割します。 CREATE OR REPLACE TABLE ‘myproject.mydataset.training‘ AS (SELECT * FROM ‘myproject.mydataset.mytable‘ WHERE RAND() <= 0.8); CREATE OR REPLACE TABLE ‘myproject.mydataset.validation‘ AS (SELECT * FROM ‘myproject.mydataset.mytable‘ WHERE RAND() <= 0.2); モデルの訓練後、受信者動作特性曲線下面積(AUC ROC)の値が0.8になりましたが、モデルを本番環境にデプロイした後、モデルのパフォーマンスがAUC ROC値0.65に低下したことに気づきました。最も可能性の高い問題は何ですか?
ニューラルネットワークのバッチ学習中に、損失に振動が見られることに気づきました。モデルが収束するように調整するにはどうすればよいですか?
あなたは、自社のeコマースウェブサイトの買い物客向けの機械学習(ML)推薦モデルを設計しています。システムの構築、テスト、デプロイにはRecommendations AIを使用します。ベストプラクティスに従いながら収益を増加させる推薦を開発するには、どうすればよいでしょうか?
あなたは、需要が大幅に増加している玩具メーカーに勤務しています。品質管理検査員が製品の欠陥を確認するために費やす時間を削減するためのMLモデルを構築する必要があります。欠陥検出の高速化が最優先事項です。工場には信頼性の高いWi-Fiがありません。あなたの会社は、新しいMLモデルをできるだけ早く導入したいと考えています。どのモデルを使用すべきですか?
現在BigQueryに保存されている複数の構造化データセットに対して、分類ワークフローを構築する必要があります。分類を複数回実行するため、探索的データ分析、特徴量選択、モデル構築、トレーニング、ハイパーパラメータ調整、およびサービングといったステップを、コードを書かずに完了させたいと考えています。どうすればよいですか?