मैं डिस्क से Google क्लाउड स्टोरेज में डेटा अपलोड करने की कोशिश कर रहा हूं जिसमें ~ 3000 फाइलों के साथ ~ 3000 फाइलें हैं। मैं gsutil cp -R <disk-top-directory> <bucket>
का उपयोग कर रहा हूँ। मेरी समझ यह है कि, यदि gsutil
फिर से शुरू/पुनरारंभ किया गया है, तो यह निर्धारित करने के लिए चेकसम का उपयोग करता है कि फ़ाइल कब पहले से अपलोड हो चुकी है और उस पर छोड़ दी गई है।फिर से शुरू करें gsutil फ़ाइलों को फिर से अपलोड करने के लिए प्रतीत होता है
ऐसा प्रतीत नहीं होता है: ऐसा लगता है कि यह शीर्ष से अपलोड को फिर से शुरू कर रहा है और फ़ाइलों को फिर से बदल रहा है। जब मैं gsutil ls -Rl <bucket/disk-top-directory>
को दस मिनट अलग करता हूं और diff
के साथ तुलना करता हूं, तो मुझे लगता है कि एक ही आकार के साथ एक ही फाइलें दिखाई देती हैं लेकिन एक बदली (नई) तिथि होती है। (एक ही फाइल के साथ अर्थात लगातार फिर से अपलोड किया जा रहा।)
उदाहरण के लिए:
< 404104811 2014-04-08T14:13:44Z gs://my-bucket/disk-top-directory/dir1/dir2/dir3/dir4/dir5/file-20.tsv.bz2
---
> 404104811 2014-04-08T14:43:48Z gs://my-bucket/disk-top-directory/dir1/dir2/dir3/dir4/dir5/file-20.tsv.bz2
मशीन मैं डिस्क पढ़ सकते हैं और फ़ाइलों को हस्तांतरण करने का उपयोग कर रहा उबंटू 13.10 चल रहा है। मैंने डेबियन और उबंटू के लिए पाइप निर्देशों का उपयोग करके gsutil स्थापित किया।
क्या मैं गलत समझ रहा हूं कि gsutil के पुन: प्रारंभ करने योग्य स्थानान्तरण कैसे काम करते हैं? यदि नहीं, सही निदान व्यवहार प्राप्त करने के लिए कोई निदान और ठीक है? अग्रिम में धन्यवाद!
धन्यवाद! यह मेरी समस्या तय है। ये फ़ाइलें 2 एमबी से अधिक थीं, इसलिए फिर से शुरू करने योग्य स्थानांतरण मोड ऐसा नहीं था जिसे मैंने सोचा था, या कुछ गलत हो गया था, या जीएसयूटीएल का मेरा संस्करण ऑनलाइन दस्तावेज के साथ पुराना/सिंक था (शायद क्योंकि मैंने पीआईपी का उपयोग किया था) । समाधान करने में खुशी हुई! – MPBall