Nalutas: numpy split sa mga chunks ng pantay na laki

Ang Numpy ay isang malakas na library para sa numerical computing sa Python. Ang isang karaniwang gawain sa numerical computing at pagsusuri ng data ay ang hatiin ang isang array sa mga chunks ng pantay na laki. Tuklasin ng artikulong ito kung paano makamit ito gamit ang Numpy at magbibigay ng komprehensibong gabay sa mga hakbang na kasangkot. Sumisid tayo!

Upang malutas ang problema ng paghahati ng isang malaking hanay ng Numpy sa mas maliliit na tipak ng pantay na laki, maaari nating gamitin ang numpy.split function. Ang function na ito ay nagbibigay-daan sa amin na hatiin ang isang array sa maramihang mga sub-array na may pantay na laki sa isang tinukoy na axis. Sumisid tayo sa solusyon at unawain ang code nang sunud-sunod.

import numpy as np

def numpy_split_to_chunks(array, chunk_size):
    return np.array_split(array, chunk_size, axis=0)

large_array = np.random.randint(0, 100, size=(10, 4))
chunk_size = 2
chunks = numpy_split_to_chunks(large_array, chunk_size)

Una, ini-import namin ang numpy library, at pagkatapos ay tinukoy namin ang isang function na tinatawag numpy_split_to_chunks na tumatagal ng dalawang input parameter: ang numpy array na kailangang hatiin at ang gustong laki ng chunk. Ang function ay nagbabalik ng isang listahan ng mga numpy array, na kung saan ay ang mga chunks.

Dito, ginagamit namin ang numpy function array_split upang hatiin ang input array. Tinukoy din namin ang axis kung saan gusto naming hatiin ang array. Sa aming halimbawa, itinakda namin ang axis=0, na nangangahulugang gusto naming hatiin ang array sa mga row.

Sa wakas, lumikha kami ng isang random na numpy array ng mga integer (large_array) at tukuyin ang isang chunk size (sa kasong ito, 2). Tinatawag namin ang aming numpy_split_to_chunks function upang makuha ang listahan ng mga chunks.

Numpy Library

  • Ang Numpy library ay ang pangunahing library para sa scientific computing sa Python.
  • Ito ay malawakang ginagamit para sa mga gawaing nauugnay sa linear algebra, istatistika at pagsusuri ng data.
  • Nagbibigay ito ng high-performance na multidimensional array object at mga tool upang gumana sa mga array.

Ang Numpy library ay may malawak na hanay ng mga feature at function na kapaki-pakinabang para sa iba't ibang layunin sa matematika at computational. Kasama sa mga kakayahan nito pagmamanipula ng array, mga operasyong matematikal sa mga array, at mga pag-andar ng istatistika. Ang Numpy ay madalas na pinagsama sa iba pang mga aklatan tulad ng Matplotlib para sa visualization ng data, na ginagawa itong isang staple para sa mga data scientist at mga inhinyero na nagtatrabaho sa Python.

Numpy Array Splitting

  • Ang Numpy ay may ilang mga function upang hatiin ang mga array, tulad ng numpy.split, numpy.array_split, numpy.hsplit at numpy.vsplit.
  • Ang mga function na ito ay nagpapahintulot sa amin na hatiin ang isang array sa ilang bahagi kasama ng isang tinukoy na axis.
  • Ang mga ito ay kapaki-pakinabang sa pamamahagi ng data, parallel computations, at pag-aayos ng data.

Ang iba't ibang array splitting function na ibinigay ng Numpy ay nagbibigay-daan sa mga developer na gumana nang mahusay sa malalaking dataset, kumuha ng mga partikular na bahagi ng data, o hatiin ang data sa maraming magkakatulad na gawain. Ang mga function na ito ay makapangyarihang mga tool sa pagsusuri ng data at mga gawain sa pagmamanipula, at mahalaga ang mga ito sa mga programming workflow para sa numerical computing sa Python.

Kaugnay na mga post:

Mag-iwan ng komento