နိဒါန္း
Python သည် ဒေတာခွဲခြမ်းစိတ်ဖြာမှု၊ ဉာဏ်ရည်တုနှင့် ဝဘ်ဖွံ့ဖြိုးတိုးတက်မှုအပါအဝင် နယ်ပယ်အသီးသီးတွင် စွယ်စုံရနှင့် အသုံးများသော ပရိုဂရမ်ဘာသာစကားတစ်ခုဖြစ်သည်။ Python တွင် အကြီးစားဒေတာများကို ကိုင်တွယ်ရန်အတွက် မရှိမဖြစ်လိုအပ်သော စာကြည့်တိုက်များထဲမှ တစ်ခုဖြစ်သည်။ numpy. NumPy သည် ကျွန်ုပ်တို့အား ရှုပ်ထွေးသော သင်္ချာဆိုင်ရာ လုပ်ဆောင်ချက်များကို လွယ်ကူစွာ လုပ်ဆောင်နိုင်စေသည့် အစွမ်းထက် N-dimensional array အရာဝတ္ထုကို ပံ့ပိုးပေးပါသည်။ ဒေတာခွဲခြမ်းစိတ်ဖြာမှုတွင် အရေးပါသော လုပ်ဆောင်မှုများထဲမှ တစ်ခုဖြစ်သည်။ ခွဲခြမ်းလုပ်ဆောင်ချက်နောက်ထပ်ခွဲခြမ်းစိတ်ဖြာရန်အတွက် အချက်အလက်များကို အပိုင်းငယ်များခွဲရန် အသုံးပြုသည်။ ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် လက်တွေ့ကျသောဖြေရှင်းချက်၊ အဆင့်ဆင့်ရှင်းလင်းချက်နှင့် ဆက်စပ်စာကြည့်တိုက်များနှင့် လုပ်ဆောင်ချက်များကို ဆွေးနွေးခြင်းဖြင့် NumPy ၏ခွဲထွက်သည့်လုပ်ဆောင်ချက်၏ အထားအသိုနှင့်အသုံးပြုမှုကို စေ့စေ့စပ်စပ်လေ့လာပါမည်။
ပြဿနာဖြေရှင်းချက်-
ကျွန်ုပ်တို့တွင် ဖက်ရှင်ရှိုးတစ်ခုမှ ထုတ်ပေးထားသော ဒေတာအတွဲတစ်ခုရှိပြီး မတူညီသော စတိုင်များ၊ ခေတ်ရေစီးကြောင်းများနှင့် အရောင်ပေါင်းစပ်မှုများကို ခွဲခြမ်းစိတ်ဖြာလိုသည်ဆိုပါစို့။ ကျွန်ုပ်တို့၏ ရည်မှန်းချက်မှာ ဤဒေတာအတွဲကို နောက်ထပ်ခွဲခြမ်းစိတ်ဖြာရန်အတွက် သေးငယ်သောအပိုင်းများအဖြစ် ခွဲထုတ်ရန်ဖြစ်သည်။ ဒါကိုအောင်မြင်ဖို့၊ ငါတို့ကဒီကိုသုံးမယ်။ NumPy ခွဲထုတ်သည့်လုပ်ဆောင်ချက်.
import numpy as np # Sample data (styles, trends, and colors) data = np.array([["Bohemian", "Oversized", "Earthy"], ["Minimalist", "Tailored", "Monochrome"], ["Classic", "Simple", "Neutrals"], ["Romantic", "Flowy", "Pastels"]]) # Split the data into 2 equal parts using NumPy split function split_data = np.split(data, 2)
ကုဒ်၏ အဆင့်ဆင့် ရှင်းလင်းချက်
1. ကျွန်ုပ်တို့မှစတင်သည်။ NumPy စာကြည့်တိုက်ကို တင်သွင်းခြင်း။ကြီးမားသောဒေတာကို ကိုင်တွယ်ရန်အတွက် လိုအပ်သောလုပ်ဆောင်ချက်များကို ကျွန်ုပ်တို့အား ပေးဆောင်သည်။
2. ပြီးရင် တစ်ခုဖန်တီးပါ။ နမူနာဒေတာအတွဲ ကွဲပြားခြားနားသောဖက်ရှင်စတိုင်များ၊ ခေတ်ရေစီးကြောင်းများနှင့်အရောင်အစီအစဉ်များနှင့်အတူ။ ဤဒေတာအတွဲသည် 2D NumPy အခင်းအကျင်းတစ်ခုဖြစ်သည်။
3. နောက်ဆုံးအနေဖြင့်၊ NumPy ခွဲထုတ်သည့်လုပ်ဆောင်ချက်Dataset ကို အညီအမျှ နှစ်ပိုင်းခွဲထားပါတယ်။ 'split_data' variable တွင် မူရင်းဒေတာအတွဲ၏ တစ်ဝက်စီပါရှိသော သေးငယ်သည့် array နှစ်ခုပါရှိသည်။
မာတိကာ
NumPy နှင့် ၎င်း၏ခွဲထွက်လုပ်ဆောင်ချက်ကို နားလည်ခြင်း။
NumPy သည် Numeric Python ၏ အတိုကောက်ဖြစ်ပြီး Python တွင် ကိန်းဂဏာန်းဆိုင်ရာ လုပ်ဆောင်မှုများကို လုပ်ဆောင်ရန်အတွက် မရှိမဖြစ်လိုအပ်သော စာကြည့်တိုက်တစ်ခုဖြစ်သည်။ ၎င်း၏အတွက် ကျယ်ပြန့်စွာ အသိအမှတ်ပြုခံရသည်။ ထိရောက်သော N-dimensional array အရာဝတ္ထုသိပ္ပံနည်းကျ တွက်ချက်ခြင်းနှင့် ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်းအတွက် အစွမ်းထက်သော ကိရိယာတစ်ခုအဖြစ် ဆောင်ရွက်သည်။
အဆိုပါ NumPy က ကွဲသွားတယ်။ သတ်မှတ်ဝင်ရိုးတစ်လျှောက် input array တစ်ခုကို သေးငယ်သော array အများအပြားသို့ ပိုင်းခြားရန် function ကို အသုံးပြုသည်။ ဤလုပ်ဆောင်ချက်သည် ကြီးမားသောဒေတာအတွဲများကို သေးငယ်၍ ပိုမိုစီမံခန့်ခွဲနိုင်သော အစိတ်အပိုင်းများအဖြစ် ခွဲခြမ်းရန်အတွက် အကျိုးရှိနိုင်ပြီး ဒေတာ၏ သီးခြားအပိုင်းများတွင် သီးခြားခွဲခြမ်းစိတ်ဖြာမှုများကို လုပ်ဆောင်ရန် ပိုမိုလွယ်ကူစေသည်။
ဒေတာခြယ်လှယ်မှုအတွက် အခြားသော NumPy လုပ်ဆောင်ချက်များ
ခွဲထုတ်သည့်လုပ်ဆောင်ချက်အပြင် NumPy သည် ဒေတာစီမံခန့်ခွဲမှုအတွက် အခြားလုပ်ဆောင်ချက်များစွာကို ပေးစွမ်းသည်-
- ပုံသဏ္ဍာန် အရင်းခံဒေတာကို မပြောင်းလဲဘဲ ပေးထားသည့် အခင်းအကျင်းတစ်ခု၏ ပုံသဏ္ဍာန်ကို ပြောင်းလဲရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုသည်။ တစ်ဘက်မြင် array ကို နှစ်ဘက်မြင် array အဖြစ်သို့ ပြောင်းရန် သို့မဟုတ် အပြန်အလှန်အားဖြင့် ၎င်းကို အသုံးပြုနိုင်သည်။
- ပေါင်းစပ်ပါ သတ်မှတ်ထားသော ဝင်ရိုးတစ်လျှောက် နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော array များကို ပေါင်းစည်းရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုသည်။ မတူညီသောရင်းမြစ်များမှ ဒေတာများကို ပေါင်းစပ်သည့်အခါ အထောက်အကူဖြစ်စေနိုင်သည်။
- hstack- ဤလုပ်ဆောင်ချက်ကို ဝင်ရိုးတစ်ခုတည်းတစ်လျှောက် အလျားလိုက် (ကော်လံ-အလိုက်) ခင်းကျင်းရန် အသုံးပြုသည်။ ရှိပြီးသား array တစ်ခုသို့ ကော်လံများကို ပေါင်းထည့်ခြင်း သို့မဟုတ် array အများအပြားကို ဘေးချင်းကပ်လျက် ချိတ်ဆက်ခြင်းဖြင့် array အသစ်တစ်ခု ဖန်တီးခြင်းအတွက် အသုံးဝင်သည်။
- vstack- hstack နှင့်ဆင်တူသည်၊ ဤလုပ်ဆောင်ချက်ကို ဝင်ရိုးတစ်ခုတည်းတစ်လျှောက်တွင် အခင်းအကျင်းများကို ဒေါင်လိုက် (အတန်းအလိုက်) စီရန်အသုံးပြုသည်။ တစ်ခုနှင့်တစ်ခုအပေါ်ရှိ array များစွာကို ပေါင်းစည်းခြင်းဖြင့် ရှိပြီးသား array တစ်ခုသို့ အတန်းများ ထပ်ထည့်ခြင်း သို့မဟုတ် အသစ်တစ်ခု ဖန်တီးခြင်းအတွက် အကျိုးရှိသည်။
နိဂုံးချုပ်မှာ NumPy ခွဲထုတ်သည့်လုပ်ဆောင်ချက် Python တွင် အကြီးစားဒေတာများကို ကိုင်တွယ်ရန်အတွက် မရှိမဖြစ်ကိရိယာတစ်ခုဖြစ်သည်။ ဒေတာအတွဲတစ်ခုကို အသေးအဖွဲများအဖြစ် ပိုင်းခြားခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် တိကျသော ဒေတာအစုခွဲများကို ထိရောက်စွာ ပိုင်းခြားစိတ်ဖြာနိုင်ပြီး တန်ဖိုးရှိသော ထိုးထွင်းဥာဏ်များကို ထုတ်ယူနိုင်ပါသည်။ ထို့အပြင်၊ NumPy ရှိ ဆက်စပ်လုပ်ဆောင်ချက်များနှင့် ဒစ်ဂျစ်တယ်များကို နားလည်ခြင်းက Python ရှိ ကျွန်ုပ်တို့၏ ဒေတာကိုင်တွယ်နိုင်မှုစွမ်းရည်ကို ပိုမိုတိုးတက်စေမည်ဖြစ်သည်။