Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版) - DP-100日本語 Exam Practice Test
Azure Machine Learning Python SDK を使用して、モデルをトレーニングするためのパイプラインを定義します。
モデルのトレーニングに使用されるデータは、データストア内のフォルダーから読み取られます。
フォルダー内のデータが変更されるたびにパイプラインが自動的に実行されるようにする必要があります。
何をすべきでしょうか?
モデルのトレーニングに使用されるデータは、データストア内のフォルダーから読み取られます。
フォルダー内のデータが変更されるたびにパイプラインが自動的に実行されるようにする必要があります。
何をすべきでしょうか?
Correct Answer: B
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
機械学習プロジェクトのデータ処理戦略を設計します。
処理する必要があるデータには、リアルタイムで処理する必要がある非構造化フラット ファイルが含まれます。
データ変換はサーバーレスコンピューティングで実行され、ビッグデータ分析ワークロード向けに最適化される必要があります。
データ サイエンス チーム用の Azure サービスを選択する必要があります。
どのストレージおよびデータ処理サービスを使用すべきですか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが加算されます。

処理する必要があるデータには、リアルタイムで処理する必要がある非構造化フラット ファイルが含まれます。
データ変換はサーバーレスコンピューティングで実行され、ビッグデータ分析ワークロード向けに最適化される必要があります。
データ サイエンス チーム用の Azure サービスを選択する必要があります。
どのストレージおよびデータ処理サービスを使用すべきですか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが加算されます。

Correct Answer:

Explanation:

Azure Machine Learning ワークスペースがあります。
Azure Machine Learning デザイナーを使用して、ワークスペースに複数のコンポーネントを登録する予定です。
登録をサポートするコンポーネントを構成する必要があります。
どのコンポーネント構成を使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

Azure Machine Learning デザイナーを使用して、ワークスペースに複数のコンポーネントを登録する予定です。
登録をサポートするコンポーネントを構成する必要があります。
どのコンポーネント構成を使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

Correct Answer:

Explanation:

注: この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自の解決策が含まれています。一部の質問セットには複数の正解がある場合もあれば、正解がない場合もあります。
このセクションの質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
ロジスティック回帰アルゴリズムを使用して分類モデルをトレーニングします。
全体的なグローバル相対重要度値と特定の予測セットのローカル重要度の測定の両方として、各特徴の重要度を計算することにより、モデルの予測を説明できる必要があります。
必要なグローバルおよびローカルの特徴重要度の値を取得するために使用できる説明を作成する必要があります。
解決策: TabularExplainer を作成します。
ソリューションは目標を達成していますか?
このセクションの質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
ロジスティック回帰アルゴリズムを使用して分類モデルをトレーニングします。
全体的なグローバル相対重要度値と特定の予測セットのローカル重要度の測定の両方として、各特徴の重要度を計算することにより、モデルの予測を説明できる必要があります。
必要なグローバルおよびローカルの特徴重要度の値を取得するために使用できる説明を作成する必要があります。
解決策: TabularExplainer を作成します。
ソリューションは目標を達成していますか?
Correct Answer: A
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
Azure Machine Learning ワークスペースを管理しています。script.py という名前の Python スクリプトは、training_data という名前の引数を読み取ります。training_data 引数は、datasetl.csv という名前のファイル内のトレーニングデータへのパスを指定します。script.py Python スクリプトを、機械学習モデルをトレーニングするコマンド ジョブとして実行する予定です。
スクリプトをトレーニングジョブとして送信する際には、データセットのパスをパラメータ値として渡すコマンドを指定する必要があります。
解決策:python script.py dataset1.csv
その解決策は目標を達成しているか?
スクリプトをトレーニングジョブとして送信する際には、データセットのパスをパラメータ値として渡すコマンドを指定する必要があります。
解決策:python script.py dataset1.csv
その解決策は目標を達成しているか?
Correct Answer: A
Vote an answer
様々な都市における住宅所有に関する人口統計データを調査する予定です。データは、以下の形式のCSVファイルです。
年齢、都市、収入、住宅所有者
21,シカゴ,50000,0
35,シアトル,120000,1
23,シアトル,65000,0
45,シアトル,130000,1
18,シカゴ,48000,0
Azure Machine Learning ワークスペースで実験を実行し、データを探索して結果をログに記録する必要があります。実験では以下の情報をログに記録する必要があります。
データセット内の観測数
住宅所有者別の収入の箱ひげ図
都市名と各都市の平均収入を含む辞書。必要な情報を記録するには、実験の実行オブジェクトの適切なログ記録方法を使用する必要があります。
コードをどのように完成させるべきでしょうか? 回答するには、適切なコード セグメントを正しい場所にドラッグします。
各コードセグメントは、1回、複数回、またはまったく使用されない場合があります。コンテンツを表示するには、ペイン間の分割バーをドラッグするか、スクロールする必要がある場合があります。
注意: 正しい選択ごとに 1 ポイントが付与されます。

年齢、都市、収入、住宅所有者
21,シカゴ,50000,0
35,シアトル,120000,1
23,シアトル,65000,0
45,シアトル,130000,1
18,シカゴ,48000,0
Azure Machine Learning ワークスペースで実験を実行し、データを探索して結果をログに記録する必要があります。実験では以下の情報をログに記録する必要があります。
データセット内の観測数
住宅所有者別の収入の箱ひげ図
都市名と各都市の平均収入を含む辞書。必要な情報を記録するには、実験の実行オブジェクトの適切なログ記録方法を使用する必要があります。
コードをどのように完成させるべきでしょうか? 回答するには、適切なコード セグメントを正しい場所にドラッグします。
各コードセグメントは、1回、複数回、またはまったく使用されない場合があります。コンテンツを表示するには、ペイン間の分割バーをドラッグするか、スクロールする必要がある場合があります。
注意: 正しい選択ごとに 1 ポイントが付与されます。

Correct Answer:

Explanation:

Box 1: log
The number of observations in the dataset.
run.log(name, value, description= ' ' )
Scalar values: Log a numerical or string value to the run with the given name. Logging a metric to a run causes that metric to be stored in the run record in the experiment. You can log the same metric multiple times within a run, the result being considered a vector of that metric.
Example: run.log( " accuracy " , 0.95)
Box 2: log_image
A box plot of income by home_owner.
log_image Log an image to the run record. Use log_image to log a .PNG image file or a matplotlib plot to the run. These images will be visible and comparable in the run record.
Example: run.log_image( " ROC " , plot=plt)
Box 3: log_table
A dictionary containing the city names and the average income for each city.
log_table: Log a dictionary object to the run with the given name.
決定木アルゴリズムを使用して分類モデルをトレーニングします。
以下のPythonコードを実行して推定器を作成します。変数feature_namesはすべての特徴量名のリスト、class_namesはすべてクラス名のリストです。
解釈.ext.blackboxからTabularExplainerをインポートする

すべての機能の重要性を決定することによって、すべてのクラスに対してモデルによって行われた予測を説明する必要があります。
以下の各文について、正しい場合は「はい」を選択してください。そうでない場合は「いいえ」を選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

以下のPythonコードを実行して推定器を作成します。変数feature_namesはすべての特徴量名のリスト、class_namesはすべてクラス名のリストです。
解釈.ext.blackboxからTabularExplainerをインポートする

すべての機能の重要性を決定することによって、すべてのクラスに対してモデルによって行われた予測を説明する必要があります。
以下の各文について、正しい場合は「はい」を選択してください。そうでない場合は「いいえ」を選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

Correct Answer:

Explanation:

Box 1: Yes
TabularExplainer calls one of the three SHAP explainers underneath (TreeExplainer, DeepExplainer, or KernelExplainer).
Box 2: Yes
To make your explanations and visualizations more informative, you can choose to pass in feature names and output class names if doing classification.
Box 3: No
TabularExplainer automatically selects the most appropriate one for your use case, but you can call each of its three underlying explainers underneath (TreeExplainer, DeepExplainer, or KernelExplainer) directly.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-machine-learning-interpretability-aml
2クラスのロジスティック回帰モデルを使用して、バイナリ分類を作成しています。
不均衡のモデル結果を評価する必要があります。
どの評価基準を使用する必要がありますか?
不均衡のモデル結果を評価する必要があります。
どの評価基準を使用する必要がありますか?
Correct Answer: B
Vote an answer
Explanation: Only visible for PassTestking members. You can sign-up / login (it's free).
財務チームから、finance-data という名前の Azure Storage BLOB コンテナー内のデータを使用してモデルをトレーニングするように依頼されました。
コンテナーを Azure Machine Learning ワークスペースのデータストアとして登録し、コンテナーが存在しない場合にエラーが発生するようにする必要があります。
コードをどのように完成させるべきですか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

コンテナーを Azure Machine Learning ワークスペースのデータストアとして登録し、コンテナーが存在しない場合にエラーが発生するようにする必要があります。
コードをどのように完成させるべきですか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

Correct Answer:

Explanation:

Box 1: register_azure_blob_container
Register an Azure Blob Container to the datastore.
Box 2: create_if_not_exists = False
Create the file share if it does not exists, defaults to False.
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.datastore.datastore
Azure Machine Learning ワークスペースを管理します。開発環境は、Azure Machine Learning Notebooks の Serverless Spark コンピューティングで構成されています。
インタラクティブなデータ ラングリングを実行して、Titanic データセットをクリーンアップし、新しいデータセットとして保存します (行番号は参照用にのみ使用されます)。

以下の各文について、正しい場合は「はい」を選択し、そうでない場合は「いいえ」を選択します。注: 正しい選択はそれぞれ 1 ポイントの価値があります。

インタラクティブなデータ ラングリングを実行して、Titanic データセットをクリーンアップし、新しいデータセットとして保存します (行番号は参照用にのみ使用されます)。

以下の各文について、正しい場合は「はい」を選択し、そうでない場合は「いいえ」を選択します。注: 正しい選択はそれぞれ 1 ポイントの価値があります。

Correct Answer:

Explanation:
