PROYEK DATA SCIENCE 6: ANALISIS PENJUALAN SUPERMARKET
Salam sejahtera, kali ini saya akan coba menganalisa data dari Kaggle yaitu data sales dari sebuah perusahaan di Myanmar. Saya akan menganalisa satu per satu data ini. Seperti biasa saya akan menggunakan library Numpy, Pandas, Matplotlib, dan Seaborn untuk menganalisa.
Sebelumnya saya ingin membuat tanggalnya menjadi beraturan dulu dari awal sampai akhir waktu pembukaan tokonya. Dan bisa kita lihat toko tersebut beroperasi dari tanggal 1 Januari 2019–30 Maret 2019.
Lalu saya mencoba untuk mengetahui bentuk datasetnya, dan bisa kita lihat beberapa data ada yang float, integer, datetime dan object. Tidak ada null di data tersebut semuanya total 1000 entry 17 kolom.
Saya ingin mengatahui performance perusahaan secara keseluruhan, kita bisa lihat dibawah ini.
Saya juga ingin mengetahui product line apa saja yang ada di perusahaan ini. Setelah saya mengetahui jumlahnya saya akan mencoba mengetahui total penjualan productnya satu per satu.
Bisa kita lihat produk yang paling banyak terjual adalah produk Electronic Accessories walaupun jumlah produk yang lain relatif setara jumlahnya tetapi produk Health and Beauty sama sekali tidak laku untuk dijual.
Saya ingin memecah analisis ke beberapa branch di tiap kota. Ada 3 kota yang yang terdapat branch perusahaan yaitu Yangon, Mandalay, dan Naypyitaw.
Lalu saya ingin menilai performance di tiap branch tersebut. Untuk rating kepuasan konsumen diungguli oleh Naypyitaw, total sales terbanyak terdapat di Yangon, total cost of good sold terbanyak ada di Yangon, total gross income terbanyak di Naypyitaw, total pajak yang ditanggung terbanyak di Naypyitaw, gross margin semuanya relatif sama hanya sekitar 4.7%.
Saya ingin mengetahui Product Line apa di tiap branch yang paling laku.
Untuk Fashion Accessories dipegang oleh Naypyitaw, untuk Food and Beverages dipegang oleh Naypyitaw, untuk Electronic Accessories dipegang oleh Naypyitaw, untuk Sports and Travel dipegang oleh Yangon, untuk Home an Lifestyle dipegang oleh Yangon.
Saya ingin melihat statistik dari Gross Income, Quantity Sales, Total Sales, dan Cost of Good Sold di tiap branch. Ternyata bisa kita lihat secara trend statistik yang kita perhatikan dari tanggal 1 Januari-30 Maret 2019 ternyata tidak ada berbentuk Uptrend(bergerak naik) maupun Downtrend(bergerak turun) tetapi Sideways(bergerak ditengah).
Sekarang kita mencoba mempelajari Payment Method, Customer Type, dan Gender dari tiap branch.
Untuk di Yangon Payment Method banyak menggunakan Ewallet, Customer Typenya kebanyakan Normal, dan Gender kebanyakan Male.
Untuk di Mandalay Payment Method kebanyakan Ewallet Payment, Customer Type lebih banyak yang Normal, Gender lebih banyak Male.
Payment Method lebih banyak Cash, Customer Type kebanyakan Member, dan Customer Gender kebanyakan Female.
Lalu sebelum saya ingin mengetahui korelasi antar variabel yang ada di perusahaan, saya akan memastikan variabelnya tidak ada yang berbentuk object lalu menggunakan LabelEncoder untuk merubah semuanya menjadi angka. Agar korelasi lebih akurat saya akan menghapus kolom Invoice ID.
Kita bisa pelajari bahwa terdapat korelasi yang sangat kuat antara Total-Tax 5%, Cogs-Tax 5%, gross income-Tax 5%, cogs-Total, gross income- Total, gross income- cogs. Korelasi sedang Tax 5%-Unit price, Total-Unit Price, cogs-Unit price, gross income- Unit Price. Menurut saya sangat jelas karena hal yang berkaitan hitung-hitung akutansi transaksi penjualan dan pemasukan pastinya akan berkorelasi satu sama lain tergantung besar kecilnya transaksi. Demikian blog saya kali ini semoga memberi manfaat. Terima kasih.