pd.read_sqlでの顧客データフレーム（df_customer）読み込み時のbirth_dayの型指定 #6

hyga2c · 2020-06-28T08:00:42Z

現在の読み込みではbirth_dayがstrで読み込まれています。（Rではdate形式になっている）
このため、P-045の回答ではpd.to_datetimeでdatetime形式に変換後、再度.dtで文字列に変換されています。
問題の意図にそったDataFrameにするためにも読み込み時にbirth_dayをparse_dates指定でdtype='datetime64'として読み出した方がよいのではないですか？

df_customer = pd.read_sql(sql='select * from customer', con=conn, parse_dates={'birth_day'})

これによりP-045は下記で回答でき、問題の意図に沿ったものになると考えます。

pd.concat([df_customer['customer_id'], df_customer['birth_day'].dt.strftime('%Y%m%d')], axis =1).head(10)

The text was updated successfully, but these errors were encountered:

KazuhiroM · 2020-06-28T15:37:44Z

Issueありがとうございます。単純に読み込んだ状態をスタート地点として、そこから必要となる様々な手間を駆使することも狙って作っております。birth_dayについては、「datetime.date」で取り込まれているかと思います。このdatetime.datetimeのようでちょっと違うdatetime.dateに対し、to_datetimeを使うとdatetimeのようにstrftime使えるよ、ということをあえて問いています。実務の分析やシステム開発のコードでは、ご指摘のように入り口で指定し、全体をシンプルにするのが良いかと思いますが、ここでは100本ノックという性質上、コード毎の手間（to_datetimeなど）を含め訓練として残してありますので、その点ご了承いただければと思います。

実他Issueでも皆さんにシェアすべき知見などいただいておりますので、「こういったやり方があるよ」というWikiを今後整備していこうと考えています。本件のparse_dates={'birth_day'})は、実務においてとても役立つ知識だと思いますので、設問ファイルや解答例ファイルに修正をかけるのではなくそちらの掲載させていただく形で紹介させていただくかもしれません。

どうぞよろしくお願いします。

KazuhiroM · 2020-07-05T05:14:01Z

Wikiネタとしてピン留めし、Issueとしては一旦クローズ

KazuhiroM pinned this issue Jun 29, 2020

KazuhiroM closed this as completed Jul 5, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pd.read_sqlでの顧客データフレーム（df_customer）読み込み時のbirth_dayの型指定 #6

pd.read_sqlでの顧客データフレーム（df_customer）読み込み時のbirth_dayの型指定 #6

hyga2c commented Jun 28, 2020

KazuhiroM commented Jun 28, 2020 •

edited

Loading

KazuhiroM commented Jul 5, 2020

pd.read_sqlでの顧客データフレーム（df_customer）読み込み時のbirth_dayの型指定 #6

pd.read_sqlでの顧客データフレーム（df_customer）読み込み時のbirth_dayの型指定 #6

Comments

hyga2c commented Jun 28, 2020

KazuhiroM commented Jun 28, 2020 • edited Loading

KazuhiroM commented Jul 5, 2020

KazuhiroM commented Jun 28, 2020 •

edited

Loading