Amazon AWS Certified Machine Learning Engineer - Associate (MLA-C01日本語版) - MLA-C01日本語 Exam Practice Test
ある企業は、AWS 上にカスタムトレーニング済みの分類機械学習モデルをデプロイする必要があります。このモデルは、低レイテンシーでほぼリアルタイムの予測を行う必要があり、変動するリクエスト量にも対応する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
これらの要件を満たすソリューションはどれでしょうか?
Correct Answer: B
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
MLエンジニアは、k-foldクロスバリデーションを実行し、トレーニング中に平均F1スコアを記録するカスタムコンテナを所有しています。MLエンジニアは、Amazon SageMaker AI Automatic Model Tuning (AMT) を利用して、平均F1スコアを最大化するハイパーパラメータを選択したいと考えています。
ML エンジニアはカスタムメトリックを SageMaker AI AMT にどのように統合すればよいでしょうか?
ML エンジニアはカスタムメトリックを SageMaker AI AMT にどのように統合すればよいでしょうか?
Correct Answer: A
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
ML エンジニアは、サブスクリプション サービスの顧客離脱を予測するためのロジスティック回帰モデルを構築しています。
データセットには、location と job_seniority_level という 2 つの文字列変数が含まれています。
location 変数には 3 つの異なる値があり、job_seniority_level 変数には 10 を超える異なる値があります。
ML エンジニアは変数の前処理を実行する必要があります。
どのソリューションがこの要件を満たすでしょうか?
データセットには、location と job_seniority_level という 2 つの文字列変数が含まれています。
location 変数には 3 つの異なる値があり、job_seniority_level 変数には 10 を超える異なる値があります。
ML エンジニアは変数の前処理を実行する必要があります。
どのソリューションがこの要件を満たすでしょうか?
Correct Answer: D
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
ある企業は、各広告の配色を考慮して広告キャンペーンの成功を予測したいと考えています。機械学習エンジニアは、ニューラルネットワークモデル用のデータを準備しています。データセットには、色情報がカテゴリデータとして含まれています。
ML エンジニアはモデルにどの特徴エンジニアリング手法を使用する必要がありますか?
ML エンジニアはモデルにどの特徴エンジニアリング手法を使用する必要がありますか?
Correct Answer: D
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
ある企業では、Amazon S3バケットに.csvファイルとして保存されているデータの量が大幅に増加しました。そのため、データ変換スクリプトとクエリの実行に以前よりも大幅に時間がかかるようになりました。
ML エンジニアは、最小限の運用オーバーヘッドでクエリ パフォーマンスのためにデータを最適化するソリューションを実装する必要があります。
どのソリューションがこの要件を満たすでしょうか?
ML エンジニアは、最小限の運用オーバーヘッドでクエリ パフォーマンスのためにデータを最適化するソリューションを実装する必要があります。
どのソリューションがこの要件を満たすでしょうか?
Correct Answer: C
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
機械学習エンジニアは、Amazon SageMaker AIノートブックインスタンスを使用して、推定器を備えたニューラルネットワークモデルをトレーニングするトレーニングジョブを実行します。このトレーニングジョブは、環境変数として設定されたAmazon S3パスからデータを繰り返しロードします。機械学習エンジニアは、トレーニングジョブのプロファイリングレポートを確認しました。その結果、トレーニング時間の大部分がデータロードに費やされていることが分かりました。
機械学習エンジニアは、どのようにすればトレーニング速度を向上させることができるでしょうか?
機械学習エンジニアは、どのようにすればトレーニング速度を向上させることができるでしょうか?
Correct Answer: C
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
数百人のデータサイエンティストを擁するある企業は、Amazon SageMaker を使用して機械学習モデルを作成しています。これらのモデルは、SageMaker モデルレジストリ内のモデルグループに保存されています。
データサイエンティストは、コンピュータービジョン、自然言語処理(NLP)、音声認識の3つのカテゴリーに分類されます。MLエンジニアは、既存のモデルをこれらのグループに整理し、大規模なモデル発見可能性を向上させるソリューションを実装する必要があります。このソリューションは、モデル成果物とその既存のグループ分けの整合性に影響を与えてはなりません。
これらの要件を満たすソリューションはどれでしょうか?
データサイエンティストは、コンピュータービジョン、自然言語処理(NLP)、音声認識の3つのカテゴリーに分類されます。MLエンジニアは、既存のモデルをこれらのグループに整理し、大規模なモデル発見可能性を向上させるソリューションを実装する必要があります。このソリューションは、モデル成果物とその既存のグループ分けの整合性に影響を与えてはなりません。
これらの要件を満たすソリューションはどれでしょうか?
Correct Answer: B
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
カスタマーコールセンターは、Amazon Transcribeを使用して、顧客とサポート担当者間の数百件の音声録音をテキストファイルに変換しています。コールセンターは、これらのテキストファイルを使用して機械学習モデルをトレーニングしたいと考えています。業界規制を遵守するため、コールセンターはトレーニング用テキストファイルから顧客名、住所、電話番号を削除する必要があります。
開発労力を最小限に抑えつつ、これらの要件を満たすソリューションはどれでしょうか?
開発労力を最小限に抑えつつ、これらの要件を満たすソリューションはどれでしょうか?
Correct Answer: A
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
機械学習エンジニアは、さまざまなデータ用途に最適なデータ形式を選択する必要があります。異なるチームが、分析、機械学習、レポート作成などの目的でデータにアクセスします。
各ユースケースの要件を満たす適切なデータ形式を以下のリストから選択してください。各データ形式は1回ずつ選択してください。(4つ選択してください。)

各ユースケースの要件を満たす適切なデータ形式を以下のリストから選択してください。各データ形式は1回ずつ選択してください。(4つ選択してください。)

Correct Answer:

Explanation:

The best answers are Parquet, JSON, CSV, and ORC in that order.
Parquet is the strongest choice for complex analytical queries over large structured datasets because it is a columnar format. Columnar storage allows query engines such as Amazon Athena, AWS Glue, and Spark to read only the columns required by the query instead of scanning full rows. AWS documentation states that Apache Parquet and ORC are columnar storage formats optimized for fast retrieval in analytical applications, and that column-level compression can reduce storage space and I/O during query processing. This directly matches the need to filter, aggregate, reduce query response time, and lower storage/query cost.
JSON is correct for semi-structured real-time logs because JSON supports flexible and nested data structures.
AWS Glue documentation describes JSON as a format for data structures with consistent shape but flexible contents and notes that it is not row-based or column-based. That makes it appropriate for application logs, event records, and evolving schemas used later for analytics or ML ingestion.
CSV is correct for small spreadsheet exports and occasional human-readable analysis. AWS Glue describes CSV as a minimal, row-based data format. CSV is widely supported by spreadsheet tools and is easy for humans to inspect, but it is not ideal for large-scale analytical performance because it lacks efficient column pruning and rich schema support.
ORC is correct for the Apache Hive read-heavy big data pipeline. ORC is a performance-oriented, column- based format, and it is strongly associated with Hive-based analytics workloads. It provides high compression and efficient reads, making it well suited for structured data in read-heavy big data pipelines.