Professional Machine Learning Engineer
TensorFlowモデルの訓練時間のパフォーマンスをプロファイリングしたところ、Cloud Storage上にある単一の5テラバイトのCSVファイルデータセットの入力データパイプラインに非効率な点があり、パフォーマンスの問題が発生していることに気づきました。入力パイプラインのパフォーマンスを最適化する必要があります。パイプラインの効率を上げるために、最初に試すべきアクションはどれですか?
特定のミッションクリティカルな機械部品が故障するかどうかを判断するための非同期予測を提供するアーキテクチャを設計する必要があります。システムは、機械の複数のセンサーからデータを収集します。過去12時間の各センサーデータの平均値に基づいて、今後N分以内に故障が発生するかどうかを予測するモデルを構築したいと考えています。どのようにアーキテクチャを設計すべきですか?
あなたの会社は、多くの異なるオンラインソースからニュース記事を集約し、ユーザーに送信するアプリケーションを管理しています。あなたは、読者が現在読んでいる記事と類似した記事を提案する推薦モデルを構築する必要があります。どのアプローチを使用すべきですか?
あなたは、ユーザーが記事を投稿しニュースについて議論する大規模なソーシャルネットワークサービスプロバイダーで働いています。毎日数百万のコメントがオンラインに投稿され、200人以上の人間のモデレーターが常にコメントをレビューし、不適切なものをフラグ付けしています。あなたのチームは、人間のモデレーターがプラットフォーム上のコンテンツをチェックするのを助けるMLモデルを構築しています。モデルは各コメントをスコアリングし、疑わしいコメントにフラグを立てて人間によるレビューを促します。モデルのパフォーマンスを監視するために使用すべき指標は何ですか?
あなたは小売企業のリードMLエンジニアです。チームがアーティファクトを生成することで再現性のある実験を行えるように、MLメタデータを一元的に追跡および管理したいと考えています。チームにどの管理ソリューションを推奨しますか?