mutomasa ブログ

浅学非才、継続は力なり

データ分析

Pandasで簡単な変換処理(金額編)

データ分析・機械学習でデータの前処理作業が大変だとかよく言われますが、最近になってその意味がわかりつつあります。あるエクセル形式で提供されている販売データで「金額」をPandasで読むと、Object型でした。Groupbyで各商品ごとの売上平均金額が出ない…

2次元のヒストグラムを書く

今年も残すところあと僅かです。基本的なデータ分析の勉強中です。 1次元のヒストグラムを描いていたら、2次元のヒストグラムを表示してみたくなって描いてみました。 平均ベクトルと分散共分散行列を用意して、多次元正規分布からランダムに1000サンプ…

久々にTableauを触る

来年の仕事に向けて、久々にTableauを触ってます。 書籍も買ったので、少し体系的にBIを使ってデータ分析スキルを上げたいと思います。 Tableau Desktopは自宅ではアカデミックプランで使用してます。 相変わらずに可視化が素敵すぎます。※小売店サンプルデ…

Raspberry Pi4で大量のcsvファイルを生成した

(1000行,3列)のcsvファイルを1000個生成しました。比較数値がないのですが、所要時間が思ったよりも短かったです。マジックコマンド%%timeitを使い、計測して27秒程でした。 Raspberry Pi3で重かった処理がRaspberry Pi4でサクサクと処理ができて嬉しいです…