データクレンジングの方法を教えてもらうプロンプト

中級

このプロンプトでできること

汚いデータを整理・クリーニングする方法を教えてもらえます。重複削除、表記ゆれ統一、欠損値処理などの手順を解説します。

プロンプト

以下のデータのクレンジング方法を教えてください。

【データの状況】
{どんなデータか、どんな問題があるか}

【問題点】
例:
- 重複データがある
- 表記ゆれがある(株式会社/㈱など)
- 空白セルがある
- 日付形式がバラバラ
- 余分なスペースがある

【使用ツール】
{Excel/Googleスプレッドシート/Python等}

【最終的にしたいこと】
{クレンジング後の用途}

以下の形式で回答してください:

1. 問題の診断
   - データの問題点の整理
   - 優先的に対処すべき項目

2. クレンジング手順
   - ステップバイステップの手順
   - 使用する機能/関数

3. 各問題への対処法
   - 具体的な操作方法
   - 使える関数や数式

4. 自動化のヒント
   - 繰り返し使えるテクニック

5. 品質チェック方法
   - クレンジング後の確認ポイント

カスタマイズ例

  • 「Excelのみで完結する方法で」と追記
  • 「10万行のデータを効率的に」と追記
  • 「再発防止のルールも提案して」と追記

出力例

データクレンジング手順書

1. 問題の診断

問題件数優先度
重複レコード約200件
会社名の表記ゆれ約500件
電話番号形式不統一約300件
空白セル約100件

2. クレンジング手順

Step 1:バックアップ作成 元データのコピーを別シートに保存

Step 2:重複削除

  1. 全データを選択
  2. データ → 重複の削除
  3. 判定基準の列を選択

Step 3:表記ゆれ統一

会社名の統一(新しい列で変換):

=SUBSTITUTE(SUBSTITUTE(A2,"㈱","株式会社"),"(株)","株式会社")

Step 4:電話番号形式統一

=SUBSTITUTE(SUBSTITUTE(A2,"-","")," ","")

→ ハイフンなしの数字のみに統一

3. 品質チェック

  • 重複確認:COUNTIF関数で2以上がないか
  • 空白確認:COUNTBLANK関数
  • 形式確認:LEN関数で文字数チェック

関連プロンプト

この記事をシェア

人気のプロンプト

報告書を作成するプロンプト

このプロンプトでできること 業務報告書や調査レポートを、論理的な構成で作成できます。目的に応じた形式と、読み手を意識した文章構成を提案します。 プロンプト 以下の内容で報告書を作成してください。 【報 …

中級

反論・批判的検討プロンプト

このプロンプトでできること 自分のアイデアや計画に対して、あえて反対意見や批判的な視点を提示してもらえます。盲点の発見や、提案の弱点を事前に補強するのに役立ちます。 プロンプト # Role あなたは …

中級

業界動向を調査するプロンプト

このプロンプトでできること 特定の業界の動向、市場規模、主要プレイヤー、トレンドを調査・整理します。ビジネス戦略や投資判断の参考情報を生成します。 プロンプト 以下の業界について調査してください。 【 …

中級

お詫びメールを作成するプロンプト

このプロンプトでできること ビジネスシーンで必要なお詫びメールを、状況に応じて適切な文面で作成できます。謝罪の程度や原因、今後の対応策を含めた丁寧なメールが生成されます。 プロンプト 以下の状況に対す …

初級

契約書を確認するプロンプト

このプロンプトでできること 契約書の内容をチェックし、注意すべきポイントやリスクを洗い出します。専門家に相談する前の一次チェックとして活用できます。 プロンプト あなたは契約書レビューの専門家です。 …

上級

要件定義を作成するプロンプト

このプロンプトでできること システム開発の要件定義書を作成します。機能要件・非機能要件を整理し、開発の前提となる文書を提案します。 プロンプト 以下のシステムの要件定義を作成してください。 【システム …

上級