සුභ පැතුම්! ඔබ දැන් මෙම පාඨමාලාවේ වැදගත්ම සහ አስደሳත්ම කොටසට පැමිණ සිටිනවා. මෙතෙක් ඔබ ඉගෙනගත් සියලුම සංකල්ප—Python, Pandas, Data Cleaning, Visualization, සහ EDA—ප්රායෝගිකව යොදාගෙන, සැබෑ ලෝකයේ දත්ත කට්ටලයක් විශ්ලේෂණය කිරීමට කාලයයි. මෙම කුඩා ව්යාපෘතිය (Mini Project) මගින්, දත්ත විශ්ලේෂණ ක්රියාවලියක් මුල සිට අග දක්වා සිදුවන ආකාරය පිළිබඳව ඔබට සැබෑ අත්දැකීමක් ලැබෙනු ඇත.
අපි මෙම ව්යාපෘතිය සඳහා **ව්යාපාරික විකුණුම් දත්ත කට්ටලයක් (Sales Dataset)** භාවිතා කරමු. අපගේ අරමුණ වන්නේ මෙම දත්ත විශ්ලේෂණය කර, ව්යාපාරයේ වර්ධනයට උපකාරී වන වටිනා තොරතුරු (insights) සොයා ගැනීමයි.
ව්යාපෘති ක්රියාවලිය (Project Workflow)
ඕනෑම දත්ත විශ්ලේෂණ ව්යාපෘතියක් පැහැදිලි පියවර කිහිපයකට අනුව සිදු කෙරේ. අපි එම පියවර අනුගමනය කරමු.
Step 1: ව්යාපෘතිය තේරුම් ගැනීම සහ සූදානම් වීම (Problem Understanding & Setup)
පළමුව, අප විසඳීමට උත්සාහ කරන ගැටලුව කුමක්දැයි වටහා ගත යුතුය. අපගේ ව්යාපාරික කළමනාකරු අපෙන් පහත ප්රශ්න වලට පිළිතුරු බලාපොරොත්තු වන බව සිතමු:
- මාසිකව අපගේ විකුණුම් වල ප්රවණතාවය (trend) කෙසේද?
- වඩාත්ම අලෙවි වන නිෂ්පාදන (best-selling products) මොනවාද?
- අපගේ විකුණුම් වැඩිපුරම සිදුවන්නේ කුමන නගර වලද?
දැන්, අපගේ Jupyter Notebook එක සූදානම් කර, අවශ්ය libraries import කර ගනිමු.
Step 2: දත්ත ලබාගැනීම සහ මූලික ගවේෂණය (Data Loading & Initial Exploration)
අපට ලබා දී ඇති `sales_data.csv` ගොනුව Pandas DataFrame එකකට load කර, එහි මූලික තොරතුරු පරීක්ෂා කර බලමු.
Step 3: දත්ත පිරිසිදු කිරීම (Data Cleaning)
Module 5 හි ඉගෙනගත් පරිදි, දත්ත විශ්ලේෂණයට පෙර ඒවායේ ඇති දෝෂ නිවැරදි කළ යුතුය. අපි හිස්තැන් (missing values) සහ අනුපිටපත් (duplicates) පරීක්ෂා කර, අවශ්ය පිරිසිදු කිරීම් සිදු කරමු.
Step 4: ගවේෂණාත්මක දත්ත විශ්ලේෂණය සහ දෘශ්යකරණය (EDA & Visualization)
දැන් අපගේ ප්රශ්න වලට පිළිතුරු සෙවීමට කාලයයි. මේ සඳහා අපි දත්ත සාරාංශගත කර, ප්රස්තාර නිර්මාණය කරමු.
ප්රශ්නය 1: මාසික විකුණුම් ප්රවණතාවය? (Line Chart)
ප්රශ්නය 2: වඩාත්ම අලෙවි වන නිෂ්පාදන? (Bar Chart)
Step 5: ප්රතිඵල අර්ථ නිරූපණය සහ වාර්තා කිරීම (Interpretation & Reporting)
අවසාන පියවර වන්නේ අපගේ විශ්ලේෂණයෙන් සොයාගත් දේ සරලව සාරාංශගත කිරීමයි.
සොයාගැනීම් (Findings):
- මාසික ප්රවණතාව: Line chart එකට අනුව, අපගේ විකුණුම් වසරේ අවසාන භාගයේදී (උදා: නොවැම්බර්, දෙසැම්බර්) සැලකිය යුතු ලෙස ඉහළ යන බව පෙනේ. මෙය උත්සව සමයන් නිසා විය හැක.
- හොඳම නිෂ්පාදන: Bar chart එකට අනුව, 'Product A' සහ 'Product B' අපගේ ආදායමෙන් වැඩිම කොටසක් උපයන බව පැහැදිලිය.
- ප්රධාන නගර: (අදාළ ප්රස්තාරයට අනුව) අපගේ ප්රධාන වෙළඳපොළවල් වන්නේ 'City X' සහ 'City Y' ය.
නිර්දේශ (Recommendations):
මෙම සොයාගැනීම් මත පදනම්ව, අපට කළමනාකාරීත්වයට "වසර අවසානයේදී වැඩිපුර අලෙවි වන නිෂ්පාදන සඳහා ප්රවර්ධන වැඩසටහන් දියත් කිරීම" සහ "'City Z' වැනි අඩු විකුණුම් ඇති නගර වල වෙළඳපොළ පුළුල් කිරීමට අවධානය යොමු කිරීම" වැනි නිර්දේශ ඉදිරිපත් කළ හැක.
මෙම සොයාගැනීම් සහ ප්රස්තාර, සරල Presentation එකක් හෝ Word Document එකක් ලෙස සකස් කර වාර්තාවක් ලෙස ඉදිරිපත් කළ හැක.
- ගැටලුව තේරුම් ගැනීම
- දත්ත ලබාගැනීම
- දත්ත පිරිසිදු කිරීම
- EDA සහ Visualization
- අර්ථ නිරූපණය සහ වාර්තා කිරීම