தீர்க்கப்பட்டது: நகலெடுக்கப்பட்ட கோப்பு hdfs

நகல் கோப்பு ஒன்றிணைக்கப்பட்ட hdf களின் முக்கிய பிரச்சனை என்னவென்றால், அது மிகவும் மெதுவாக இருக்கும்.

import shutil shutil.copyfile("/hdfs/path/to/file", "/local/path/to/file")

இந்த குறியீட்டு வரி shutil தொகுதியை இறக்குமதி செய்து, HDFS இலிருந்து உள்ளூர் கோப்பு முறைமைக்கு ஒரு கோப்பை நகலெடுக்க அந்த தொகுதியிலிருந்து காப்பிஃபைல் செயல்பாட்டைப் பயன்படுத்துகிறது.

hdfs என்றால் என்ன

HDFS என்பது ஒரு விநியோகிக்கப்பட்ட கோப்பு முறைமையாகும், இது பெரிய தரவுத் தொகுப்புகளுக்கு அளவிடக்கூடிய, நீடித்த மற்றும் நம்பகமான சேமிப்பகத்தை வழங்குகிறது. இது ஜாவாவில் எழுதப்பட்டு ஜாவா இயங்குதளத்தில் இயங்குகிறது.

கோப்புகளை ஒன்றிணைப்பதற்கான வழிகள்

பைத்தானில் கோப்புகளை ஒன்றிணைக்க சில வழிகள் உள்ளன. உள்ளமைக்கப்பட்ட கோப்பு இணைப்பு தொகுதியைப் பயன்படுத்துவது எளிய வழி:

இறக்குமதி கோப்பு இணைத்தல்
file1 = open (“file1.txt”)
file2 = open (“file2.txt”)
merge_file(file1, file2)
அச்சு (“கோப்பு இணைக்கப்பட்டது!”)

கோப்புகளுடன் வேலை செய்யுங்கள்

பைத்தானில், பொருத்தமான தொகுதியை இறக்குமதி செய்வதன் மூலம் நீங்கள் கோப்புகளுடன் வேலை செய்யலாம். எடுத்துக்காட்டாக, கோப்பு கையாளுதல் தொகுதியை இறக்குமதி செய்ய, நீங்கள் பின்வரும் வரியைப் பயன்படுத்த வேண்டும்:

கோப்பிலிருந்து இறக்குமதி கோப்பை கையாளுதல்

நீங்கள் தொகுதியை இறக்குமதி செய்தவுடன், அவற்றின் பெயரை மாறியாகப் பயன்படுத்தி கோப்புகளை அணுகலாம். எடுத்துக்காட்டாக, உங்கள் தற்போதைய கோப்பகத்தில் myfile.txt கோப்பை அணுக விரும்பினால், பின்வரும் வரியைப் பயன்படுத்துவீர்கள்:

myfile = கோப்பு (“myfile.txt”)

தொடர்புடைய இடுகைகள்:

ஒரு கருத்துரையை