広告
詳しくはこちらをクリック ≫
Python 3 エンジニア認定データ分析試験 練習問題 – データ分析のプロセスとJupyter Notebookの基本操作
問題1:
Jupyter Notebookにおいて、現在選択されているセルを実行し、その下に新しいセルを自動的に追加するショートカットキーとして正しいものはどれですか?
Ctrl + EnterShift + EnterAlt + EnterCtrl + Shift
問題2:
データ分析の標準的なプロセスにおいて、データの外れ値の除去や欠損値の補完は、次のうちどの段階で最も適切に行われますか?
- データ収集
- データ可視化
- データ加工
- データ分析
問題3:
Jupyter Notebookで%matplotlib inlineというマジックコマンドを使用する主な目的は何ですか?
- インタラクティブなグラフを作成するため
- matplotlibで作成したグラフをノートブック内に表示するため
- グラフを外部ファイルに保存するため
- matplotlibのバージョン情報を表示するため
問題4:
以下のコードは、pandas DataFrame df の ‘sales’ 列の平均値を計算し、その結果を average_sales 変数に格納しようとしています。ただし、コードには誤りがあります。正しいコードを選択してください。
python
import pandas as pd
(仮のDataFrame)
data = {‘sales’: [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
誤ったコード
average_sales = df[‘sales’].mean()
average_sales = df.sales.average()average_sales = mean(df['sales'])average_sales = df['sales'].mean()average_sales = df.sales.calc_mean()
問題5:
データ分析のプロセスにおいて、分析結果をビジネスの意思決定者にわかりやすく伝えるために、グラフや図表を用いてデータを表現する段階はどれですか?
- データ収集
- データ加工
- データ可視化
- データモデリング
解答と解説
問題1: 解答 2. Shift + Enter
- 解説:
Shift + Enterは、Jupyter Notebookで現在選択されているセルを実行し、その下に新しいセルを自動的に追加する最も一般的なショートカットキーです。Ctrl + Enterはセルを実行しますが、新しいセルは追加しません。Alt + Enterもセルを実行し、下にセルを追加しますが、Shift + Enterの方が一般的です。 - 合格に向けたパイセンのアドバイス: Jupyter Notebook のショートカットキーは、データ分析の効率を大幅に向上させます。特に、セルの実行と追加は頻繁に行う操作なので、
Shift + Enterは必ず覚えましょう。他のショートカットキーも積極的に試して、自分に合ったものを使いこなせるようにすると良いでしょう。
問題2: 解答 3. データ加工
- 解説: データ加工の段階では、収集したデータを分析しやすい形に変換します。外れ値の除去や欠損値の補完は、データの品質を向上させ、分析結果の信頼性を高めるために重要な処理です。
- 合格に向けたパイセンのアドバイス: データ分析のプロセスは、目的によって順序が多少前後することがありますが、データのクリーニング(加工)は、分析の前に必ず行うべきステップです。汚れたデータは、どんなに優れた分析手法を使っても、正しい結果を得ることはできません。
問題3: 解答 2. matplotlibで作成したグラフをノートブック内に表示するため
- 解説:
%matplotlib inlineマジックコマンドは、matplotlib で作成したグラフを Jupyter Notebook のセル出力に直接表示させるためのものです。これにより、グラフを別ウィンドウで表示する手間が省け、ノートブック内で分析結果をまとめて確認できます。 - 合格に向けたパイセンのアドバイス: マジックコマンドは、Jupyter Notebook をより便利に使うための機能です。
%matplotlib inline以外にも、様々なマジックコマンドがあるので、公式ドキュメントなどを参照して、積極的に活用しましょう。
問題4: 解答 3. average_sales = df['sales'].mean()
- 解説: pandas DataFrame の特定の列の平均値を計算するには、
df['列名'].mean()のように記述します。mean()は pandas Series オブジェクト(DataFrame の列)のメソッドです。 - 合格に向けたパイセンのアドバイス: pandas はデータ分析において非常に重要なライブラリです。DataFrame の操作、特にデータの抽出、集計、変換に関する基本的なメソッドは確実に理解しておきましょう。
問題5: 解答 3. データ可視化
- 解説: データ可視化は、分析結果をグラフや図表を用いてわかりやすく表現する段階です。効果的な可視化は、データに隠されたパターンや傾向を明らかにし、ビジネスの意思決定をサポートします。
- 合格に向けたパイセンのアドバイス: どんなに高度な分析を行っても、結果をうまく伝えられなければ意味がありません。データ可視化のスキルは、データ分析者にとって必須のスキルです。様々なグラフの種類や、それぞれのグラフがどのようなデータに適しているかを理解し、効果的な可視化を心がけましょう。
| 評価 / 特徴 | サービス名 | おすすめポイント(強み) | ターゲット層 | リンク |
|---|---|---|---|---|
| 👑 国内最大級 |
ハッピーメール | 「迷ったらここ!圧倒的な会員数と実績」 運用歴20年以上の安心感があり、マッチング率が非常に高く、地方でも素敵な出会いが期待できる業界トップクラスの老舗です。 |
20代~50代 幅広く対応 |
公式サイト(無料登録) |
| 🔥 今すぐ会いたい |
PCMAX | 「リアルタイムの出会いに特化」 アクティブユーザー数が圧倒的で、掲示板の更新頻度はNo.1です。今すぐ誰かと会いたい、ワクワクしたい方に最適でございます。 |
20代~40代 積極派の方向け |
公式サイト(無料登録) |
| ✨ 女性支持◎ |
ワクワクメール | 「クリーンで安全、初心者に優しい」 女性誌にも掲載されるほどイメージが良く、24時間有人サポートで安全性が抜群。初めての方でも使いやすい操作性が魅力です。 |
20代~30代 爽やか系・初心者 |
公式サイト(無料登録) |
| 💍 再婚・婚活 |
マリッシュ | 「大人のための、理解あるパートナー探し」 再婚や婚活に特化した設計です。バツイチ・子連れへの理解を示す「リボンマーク」など、誠実な出会いを大切にしています。 |
30代~50代 真剣派の方 |
公式サイト(無料登録) |
| 🍷 熟年層特化 |
華の会メール | 「30代後半からの、大人の落ち着いた出会い」 中高年層に特化しているため、同世代で話が合います。周囲を気にせず、自分のペースでゆったりと活動が可能です。 |
30代~60代 落ち着いた層 |
公式サイト(無料登録) |
| 🤝 趣味で繋がる |
イククル | 「会員数1500万人突破の巨大SNSコミュニティ」 日記や掲示板など、出会い以外の機能も充実しています。共通の趣味から自然にお相手との距離を縮められるのが特徴です。 |
20代~40代 趣味・友達作り |
公式サイト(無料登録) |
| 📍 地域密着 |
ミントC!Jメール | 「近所で会いたいを叶えるエリア検索」 地域に根差した掲示板が強く、コストパフォーマンス良く出会いを探せます。すぐ会える距離のお相手探しに最適です。 |
20代~40代 ご近所・コスパ |
公式サイト(無料登録) |
| 🔒 鉄壁ガード |
ASOBO | 「細かなプロフィールで自分にぴったりの相手を」 運営実績が長くセキュリティが非常に強固。詳細なデータから理想の条件に合うお相手を効率よく見つけることが可能です。 |
20代~40代 条件・安全重視 |
公式サイト(無料登録) |
| ☕ 気軽さNo.1 |
デジカフェ | 「堅苦しいのはナシ。友達から始めたい方に」 SNS感覚で気軽に繋がれるライトなコミュニティ。婚活よりもまずは楽しく会話をしたいというライトな出会いに最適。 |
20代~30代 友達・気軽派 |
公式サイト(無料登録) |