広告
詳しくはこちらをクリック ≫
Python 3 エンジニア認定データ分析試験 対策練習問題:データ分析のプロセスとJupyter Notebookの基本操作
問題1:
Jupyter Notebookで、現在選択しているセルの下に新しいセルを挿入するためのキーボードショートカットとして正しいものはどれですか?
Shift + EnterCtrl + EnterB(コマンドモード)A(コマンドモード)
問題2:
以下のJupyter Notebookのマジックコマンドのうち、カレントワーキングディレクトリを"/home/user/data"に変更するものはどれですか?
%pwd%cd /home/user/data!cd /home/user/data%mkdir /home/user/data
問題3:
データ分析の標準的なプロセスにおいて、通常、データの可視化はどの段階で行われますか?
- データ収集
- データ加工
- データ可視化
- モデリング
問題4:
以下のコードは、Jupyter Notebookで実行することを想定しています。このコードを実行すると、どのような結果が得られますか?
python
import pandas as pd
data = {‘col1’: [1, 2], ‘col2’: [3, 4]}
df = pd.DataFrame(data)
df.to_csv(‘my_data.csv’, index=False)
!head my_data.csv
my_data.csvファイルが作成され、ファイルの内容が表示される。- エラーが発生する。
!headコマンドはPythonでは実行できない。 my_data.csvファイルは作成されるが、内容は表示されない。my_data.csvファイルは作成されず、エラーが発生する。
問題5:
データ分析のプロセスにおける「データ加工」の主な目的として最も適切なものはどれですか?
- データを収集元からJupyter Notebook環境に取り込むこと。
- データの傾向やパターンを視覚的に把握すること。
- 欠損値の処理、不要なデータの削除、データ型の変換などを行い、分析可能な状態にデータを整えること。
- 機械学習モデルを構築し、予測を行うこと。
解答と解説
問題1: 解答 3
- 解説: Jupyter Notebookのコマンドモードでは、
Bキーを押すと、現在選択しているセルの下に新しいセルが挿入されます。Aキーは上に挿入です。Shift + EnterやCtrl + Enterはセルの実行に関連するショートカットです。 - 合格に向けたパイセンのアドバイス: コマンドモードと編集モードの切り替え、セルの追加、削除、コピー&ペーストなどの基本的なショートカットは必ずマスターしておきましょう。試験時間の短縮に繋がります!
問題2: 解答 2
- 解説:
%cdはJupyter Notebookのマジックコマンドで、カレントワーキングディレクトリを変更するために使用されます。!はシェルコマンドを実行するためのもので、一時的にディレクトリを変更しますが、Notebook全体のカレントワーキングディレクトリは変更しません。%pwdは現在のワーキングディレクトリを表示するコマンドです。%mkdirはディレクトリを作成するコマンドです。 - 合格に向けたパイセンのアドバイス: マジックコマンドは、Jupyter Notebookの操作を効率化するために非常に便利です。
%cd,%pwd,%timeitなど、よく使うコマンドは覚えておきましょう。
問題3: 解答 3
- 解説: データ可視化は、データ加工後に行われることが一般的です。加工されたデータを可視化することで、データの分布、異常値、変数間の関係などを把握し、さらなるデータ加工やモデリングの方向性を定めることができます。
- 合格に向けたパイセンのアドバイス: データ分析のプロセスは、PDCAサイクルを回すように、反復的な性質を持ちます。可視化の結果を受けて、再度データ加工が必要になることもあります。
問題4: 解答 1
- 解説: このコードは、pandas DataFrameを
my_data.csvという名前のCSVファイルとして保存し、その後、!head my_data.csvコマンドを実行して、ファイルの最初の数行をターミナルに出力します。index=FalseはDataFrameのインデックスがCSVファイルに保存されないようにするための指定です。 - 合格に向けたパイセンのアドバイス:
!マークを使うことで、Jupyter Notebook上でシェルコマンドを実行できます。ファイル操作や外部プログラムの実行に役立ちます。pandasのto_csvメソッドは、データ分析で非常によく使うので、引数の意味も理解しておきましょう。
問題5: 解答 3
- 解説: データ加工は、収集したデータを分析に適した形に変換するプロセスです。欠損値の補完、外れ値の処理、データ型の変換、集計などが含まれます。これにより、データの品質が向上し、より正確な分析が可能になります。
- 合格に向けたパイセンのアドバイス: データ加工は、データ分析の成否を左右する重要なステップです。データの性質を理解し、適切な加工方法を選択することが大切です。
| 評価 / 特徴 | サービス名 | おすすめポイント(強み) | ターゲット層 | リンク |
|---|---|---|---|---|
| 👑 国内最大級 |
ハッピーメール | 「迷ったらここ!圧倒的な会員数と実績」 運用歴20年以上の安心感があり、マッチング率が非常に高く、地方でも素敵な出会いが期待できる業界トップクラスの老舗です。 |
20代~50代 幅広く対応 |
公式サイト(無料登録) |
| 🔥 今すぐ会いたい |
PCMAX | 「リアルタイムの出会いに特化」 アクティブユーザー数が圧倒的で、掲示板の更新頻度はNo.1です。今すぐ誰かと会いたい、ワクワクしたい方に最適でございます。 |
20代~40代 積極派の方向け |
公式サイト(無料登録) |
| ✨ 女性支持◎ |
ワクワクメール | 「クリーンで安全、初心者に優しい」 女性誌にも掲載されるほどイメージが良く、24時間有人サポートで安全性が抜群。初めての方でも使いやすい操作性が魅力です。 |
20代~30代 爽やか系・初心者 |
公式サイト(無料登録) |
| 💍 再婚・婚活 |
マリッシュ | 「大人のための、理解あるパートナー探し」 再婚や婚活に特化した設計です。バツイチ・子連れへの理解を示す「リボンマーク」など、誠実な出会いを大切にしています。 |
30代~50代 真剣派の方 |
公式サイト(無料登録) |
| 🍷 熟年層特化 |
華の会メール | 「30代後半からの、大人の落ち着いた出会い」 中高年層に特化しているため、同世代で話が合います。周囲を気にせず、自分のペースでゆったりと活動が可能です。 |
30代~60代 落ち着いた層 |
公式サイト(無料登録) |
| 🤝 趣味で繋がる |
イククル | 「会員数1500万人突破の巨大SNSコミュニティ」 日記や掲示板など、出会い以外の機能も充実しています。共通の趣味から自然にお相手との距離を縮められるのが特徴です。 |
20代~40代 趣味・友達作り |
公式サイト(無料登録) |
| 📍 地域密着 |
ミントC!Jメール | 「近所で会いたいを叶えるエリア検索」 地域に根差した掲示板が強く、コストパフォーマンス良く出会いを探せます。すぐ会える距離のお相手探しに最適です。 |
20代~40代 ご近所・コスパ |
公式サイト(無料登録) |
| 🔒 鉄壁ガード |
ASOBO | 「細かなプロフィールで自分にぴったりの相手を」 運営実績が長くセキュリティが非常に強固。詳細なデータから理想の条件に合うお相手を効率よく見つけることが可能です。 |
20代~40代 条件・安全重視 |
公式サイト(無料登録) |
| ☕ 気軽さNo.1 |
デジカフェ | 「堅苦しいのはナシ。友達から始めたい方に」 SNS感覚で気軽に繋がれるライトなコミュニティ。婚活よりもまずは楽しく会話をしたいというライトな出会いに最適。 |
20代~30代 友達・気軽派 |
公式サイト(無料登録) |