本記事について
本記事では、データパレットのクレンジングを使用する際によくあるデータファイルの加工例をご紹介します。
よくある加工例
➊住所から都道府県を抽出したい
以下では、住所の入ったカラムをもとに都道府県のみを表示したカラムの作成方法をご紹介します。
【加工のイメージ】
「データパレット」をクリックします
「データを確認する」をクリックします
加工する「データファイル」を選択し、クリックします
加工するデータファイルが表示されます
今回は、こちらのデータファイルの「住所」のカラムを加工をしていきます!
画面右上の「加工する」をクリックします
編集方法を選択し、「適用」をクリックします
「上書き保存」ができるデータファイルの条件とは??
画面上部の「置換」をクリックします
「置換したいカラム」を選択し、「適用」をクリックします
「条件」のタブをクリックし、「正規表現」を選択します
「条件」と「値」に指定した文字列を入力し、「適用」をクリックします
条件は以下の文字列を記入し、値は「$1」と入力ください。
^(北海道|東京都|京都府|大阪府|.{2}県|.{3}県).+
「名前」を入力し、「保存」をクリックします
都道府県のみのカラムが作成されます
以上で、都道府県のみのカラムを作成することができました!
➋電話番号からハイフン抜きの携帯電話番号のみ抽出したい
以下では、「電話番号の種類の違い」や「電話番号のハイフンの有無」といったバラバラの電話番号が入ったカラムをもとにハイフンを抜いた携帯電話番号のみを表示したカラムの作成方法をご紹介します。
【加工のイメージ】
加工するデータファイルを表示します
今回は、こちらのデータファイルの「電話番号」のカラムを加工をしていきます!
「置換」をクリックします
「置換したいカラム」を選択し、「適用」をクリックします
「条件」のタブをクリックし、「正規表現」を選択します
「条件」と「値」に指定した文字列を入力し、「適用」をクリックします
条件は以下の文字列を記入し、値は「0$2$3$4」と入力ください。
^(0|)(70|80|90).*([0-9]{4}).*([0-9]{4})$
「名前」を入力し、「保存」をクリックします
置換されたカラムが作成されます
「置換」をクリックします
「先程、置換で作成したカラム」を選択し、「適用」をクリックします
「正規表現」を選択し、「条件」と「値」に指定した文字列を入力し、「適用」をクリックします
条件は以下の文字列を記入し、値は「携帯」と入力ください。
^(0|)(70|80|90).*([0-9]{4}).*([0-9]{4})$
「名前」を入力し、「保存」をクリックします
置換されたカラムが作成されます
「IF文」をクリックします
「先程作成した、携帯番号を『携帯』に変更したカラム」を選択し、「適用」をクリックします
条件に「次を含まない」「携帯」と入力し、値は「空白」を選択します
値に「次のカラムの値」を選択し、「先程作成した、『携帯(ハイフン抜き)』のカラム」を選択し、「適用」をクリックします
携帯電話番号のみのカラムが作成されます
[任意]カラム名を変更します
以上で、電話番号からハイフン抜きの携帯電話番号のカラムを作成することができました!