Professional Machine Learning Engineer
あなたのチームは、機密性の高い患者情報を処理するヘルスケア企業向けの顧客サポートチャットボットを開発しています。顧客との会話中に取得されたすべての個人識別情報(PII)が、データの保存または分析前に保護されるようにする必要があります。どうすればよいですか?
あなたのチームは、特定のドメイン向けに、より小さく蒸留されたLLMを開発する実験を行っています。あなたは、蒸留LLMのいくつかのバリエーションを使用してデータセットでバッチ推論を実行し、そのバッチ推論の出力をCloud Storageに保存しました。既存のVertex AIパイプラインと統合し、LLMバージョンのパフォーマンスを評価するとともにアーティファクトも追跡する評価ワークフローを作成する必要があります。どうすればよいですか?
センサーの読み取り値に基づいて、生産ラインのコンポーネントの故障を調査するよう依頼されました。データセットを受け取った後、読み取り値の1%未満が故障事例を表す陽性例であることがわかりました。いくつかの分類モデルを訓練しようとしましたが、どれも収束しませんでした。このクラスの不均衡問題をどのように解決すべきですか?
あなたのチームはDNN回帰モデルを訓練し、テストした結果、良好な成績を収めました。デプロイから6ヶ月後、入力データの分布が変化したため、モデルの性能が悪化しています。本番環境における入力データの差異にどのように対処すべきですか?
あなたは銀行に勤務しています。Cloud Storageに保存されている非構造化データを使用して、クレジットカード取引が不正かどうかを予測するモデルをトレーニングする必要があります。BigQueryでの分析を容易にするために、データを構造化形式に変換する必要があります。会社の方針では、個人を特定できる情報(PII)を含むデータはCloud Storageに保持する必要があります。分析のためのデータの価値を維持するスケーラブルなソリューションを実装する必要があります。どうすべきですか?