本記事で紹介するデータ加工の例
本記事では、「メールアドレスから不要な文字列を削除したい」という要件について、b→dashのデータパレット機能を用いて、どのようにデータを加工すれば実現できるかをご紹介します。
データ加工の内容
本記事で紹介する加工例では以下のイメージのデータ加工を行います。
想定利用業界別 利用シーン
本記事で紹介するデータ加工の内容が「どのような業界の」「どのような企業において」「どのように活用されるか」の例をご紹介します。
活用企業イメージ
- メールアドレスに「 」(半角スペース)が含まれており、メールアドレスから「 」(半角スペース)を削除したい企業
- 重複して存在しているメールアドレスに対してユニークカウントを行いたいが、メールアドレスに不要な文字列が入っており、実現できない企業
活用イメージ
- 冒頭/末尾に含まれる「 」(半角スペース)をメールアドレスから削除したい
データ構築の流れ
本記事では、「 」(半角スペース)をメールアドレスから削除する手順を紹介します。
メールアドレスから「 」(半角スペース)を削除するケースとしては、顧客データのメールアドレスをキーとなる項目として名寄せしたいケースが挙げられます。
例えば「 nakata@test.com」と「nakata@test.com」が含まれている「メールアドレス」カラムを名寄せする場合、「 nakata@test.com」の冒頭に半角スペースが含まれていることで、別々のメールアドレスとして判定されるため、同一顧客であっても2レコード作成されます。このようなケースにおいて、半角スペースを削除することで、同一のメールアドレスと判断させたい場合に、本手順を実施します。
メールアドレスから不要な文字列を削除する
「データパレット」をクリックします
「データを確認する」をクリックします
加工する「データファイル」を選択し、クリックします
「除外」をクリックします
※以下のキャプチャでは、「メールアドレス」カラムの値には、半角スペースが含まれていないように見えますが、メールアドレスの冒頭/末尾には「 」(半角スペース)が含まれているものがあります
「メールアドレス」カラムを選択し、クリックします
下記の条件を指定して、「適用」をクリックします
【条件】:「テキストを指定」「全ての」「 」(半角スペース)を除外
「 」(半角スペース)以外にも削除したい文字列がある場合、削除したい文字列に該当する条件を入力してください。
「上書き保存」を選択後、
カラム名「メールアドレス」を入力し「保存」をクリックします
「保存」をクリックします
ファイル名を入力し、「保存」をクリックします
今回は「顧客データ(文字除外後)」と入力しています。
データファイルが作成されました
「メールアドレスから不要な文字列を削除したい」の実現方法の紹介は以上になります。