Lahendatud: kopeeri fail ühendatud hdfs

Koopiafaili ühendatud hdfs-i peamine probleem on see, et see võib olla väga aeglane.

import shutil shutil.copyfile("/hdfs/path/to/file", "/local/path/to/file")

See koodirida impordib shutili mooduli ja kasutab seejärel faili kopeerimiseks sellest moodulist faili HDFS-ist kohalikku failisüsteemi.

Mis on hdfs

HDFS on hajutatud failisüsteem, mis pakub suurte andmehulkade jaoks skaleeritavat, vastupidavat ja usaldusväärset salvestusruumi. See on kirjutatud Java keeles ja töötab Java platvormil.

Failide liitmise viisid

Pythonis failide liitmiseks on mitu võimalust. Lihtsaim viis on kasutada sisseehitatud faililiitmismoodulit:

impordi failiühendaja
fail1 = avatud (“fail1.txt”)
fail2 = avatud (“fail2.txt”)
merge_file(fail1, fail2)
print ("Fail on ühendatud!")

Töötage failidega

Pythonis saate failidega töötada, importides vastava mooduli. Näiteks failihaldusmooduli importimiseks kasutage järgmist rida:

failist Impordifaili käsitlemine

Kui olete mooduli importinud, pääsete failidele juurde, kasutades muutujana nende nime. Näiteks kui soovite juurdepääsu failile myfile.txt oma praeguses kataloogis, kasutage järgmist rida:

myfile = Fail(“minufail.txt”)

Seonduvad postitused:

Jäta kommentaar