データクレンジングの方法を教えてもらうプロンプト

中級

このプロンプトでできること

汚いデータを整理・クリーニングする方法を教えてもらえます。重複削除、表記ゆれ統一、欠損値処理などの手順を解説します。

プロンプト

以下のデータのクレンジング方法を教えてください。

【データの状況】
{どんなデータか、どんな問題があるか}

【問題点】
例:
- 重複データがある
- 表記ゆれがある(株式会社/㈱など)
- 空白セルがある
- 日付形式がバラバラ
- 余分なスペースがある

【使用ツール】
{Excel/Googleスプレッドシート/Python等}

【最終的にしたいこと】
{クレンジング後の用途}

以下の形式で回答してください:

1. 問題の診断
   - データの問題点の整理
   - 優先的に対処すべき項目

2. クレンジング手順
   - ステップバイステップの手順
   - 使用する機能/関数

3. 各問題への対処法
   - 具体的な操作方法
   - 使える関数や数式

4. 自動化のヒント
   - 繰り返し使えるテクニック

5. 品質チェック方法
   - クレンジング後の確認ポイント

カスタマイズ例

  • 「Excelのみで完結する方法で」と追記
  • 「10万行のデータを効率的に」と追記
  • 「再発防止のルールも提案して」と追記

出力例

データクレンジング手順書

1. 問題の診断

問題件数優先度
重複レコード約200件
会社名の表記ゆれ約500件
電話番号形式不統一約300件
空白セル約100件

2. クレンジング手順

Step 1:バックアップ作成 元データのコピーを別シートに保存

Step 2:重複削除

  1. 全データを選択
  2. データ → 重複の削除
  3. 判定基準の列を選択

Step 3:表記ゆれ統一

会社名の統一(新しい列で変換):

=SUBSTITUTE(SUBSTITUTE(A2,"㈱","株式会社"),"(株)","株式会社")

Step 4:電話番号形式統一

=SUBSTITUTE(SUBSTITUTE(A2,"-","")," ","")

→ ハイフンなしの数字のみに統一

3. 品質チェック

  • 重複確認:COUNTIF関数で2以上がないか
  • 空白確認:COUNTBLANK関数
  • 形式確認:LEN関数で文字数チェック

関連プロンプト

この記事をシェア

人気のプロンプト

反論・批判的検討プロンプト

このプロンプトでできること 自分のアイデアや計画に対して、あえて反対意見や批判的な視点を提示してもらえます。盲点の発見や、提案の弱点を事前に補強するのに役立ちます。 プロンプト # Role あなたは …

中級

契約書を確認するプロンプト

このプロンプトでできること 契約書の内容をチェックし、注意すべきポイントやリスクを洗い出します。専門家に相談する前の一次チェックとして活用できます。 プロンプト あなたは契約書レビューの専門家です。 …

上級

目標設定を支援するプロンプト

このプロンプトでできること SMARTの法則に基づいた具体的で達成可能な目標設定を支援します。目標の分解やKPI設定、アクションプランの作成まで行います。 プロンプト 以下の内容で目標設定を手伝ってく …

中級

引き継ぎ資料を作成するプロンプト

このプロンプトでできること 異動・退職・担当変更時に必要な引き継ぎ資料を、漏れなく整理した形で作成できます。業務内容、関係者、注意点などを体系的にまとめます。 プロンプト # Task 以下の業務情報 …

中級

報告書を作成するプロンプト

このプロンプトでできること 業務報告書や調査レポートを、論理的な構成で作成できます。目的に応じた形式と、読み手を意識した文章構成を提案します。 プロンプト 以下の内容で報告書を作成してください。 【報 …

中級

オンボーディングスケジュールを作成するプロンプト

このプロンプトでできること 新入社員が早期に活躍できるよう、体系的なオンボーディングスケジュールを作成します。 プロンプト 以下の条件でオンボーディングスケジュールを作成してください。 ## 新入社員 …

中級