Pandemia sprzyja wzrostowi wydajności dzięki zastosowaniu różnego rodzaju narzędzi współpracy online. Jednym z nich są dyski internetowe pozwalające przechowywać pliki w tzw. ,,chmurze''. W teorii mamy natychmiastowy dostęp do plików, nad którymi może pracować wiele osób równocześnie. W praktyce mam do dyspozycji wiele różnych chmur, a to z której w danym momencie korzystam zależy od tego nad czym się pracuje i z kim. Dlatego w użyciu równocześnie jest u mnie Google Drive, Dropbox, OneDrive, Overleaf i do tego synchronizowany unison-em pomiędzy 3 komputerami Linuxowy /home. Spamiętanie w którym miejscu znajdują się potrzebne ,,na teraz'' pliki jest bardzo trudne i wymaga mozolnego przeszukania 5 lokalizacji.

Otrzymany 4 grudnia 2017 e-mail treści ,,Dział Infrastruktury Sieciowej pragnie poinformować, iż przestrzeń, jaką każdy pracownik UJ ma do dyspozycji w ramach usługi Office 365 OneDrive dla firm, została zwiększona z 1 TB do 5TB.'' wzbudził u mnie wielki entuzjazm. Jak wiadomo, każdy dysk wcześniej lub później okazuje się za mały, a 5 TB wtedy wydawało się bliższe nieskończoności niż realnym moim potrzebom. Z nadmiarem mieści dane z wszystkich używanych chmur, a nawet niektóre wyniki symulacji supernowych czy zlewania się gwiazd neutronowych. Dodatkową motywacją były słuszne ponaglenia prorektora, aby wszelką działalność i współpracę, w tym ze studentami, przenieść do One Drive.

Niewidoczną na pierwszy rzut oka pułapką była, wtedy unikalna dla One Drive / Windows 10, możliwość zwolnienia miejsca na dysku. Dane nadal pozostawały w chmurze, i były pobierane na żądanie. Funkcja ta jest w pełni zintegrowana z systemem operacyjnym, a jej działanie niemal ,,przeźroczyste'' dla użytkownika. Pozwala to przechowywać kilka TB danych na dysku o znacznie mniejszej fizycznej pojemności, w moim przypadku 500 GB. Wszystko działało bezproblemowo.

Pierwsze symptomy problemów pojawiły się z początkiem 2020 roku, a polegały na wyraźnym spowolnieniu działania. Dysk wiecznie coś synchronizował, działał wyraźnie wolniej niż konkurencyjne produkty typu Dropbox czy Google Drive. Powoli ponownie zacząłem z nich korzystać, szczególnie gdy trzeba było coś szybko udostępnić. Problemy uznałem za skutek pandemii i zwiększonego ponad przewidywane obciążenia serwerów.

Katastrofa zaczęła się powoli w czerwcu 2021. Dla pewnych plików czas synchronizacji stał się ,,nieskończony''. Ale ciągle dla niektórych, więc usiłowałem kontynuować pracę. Prowadziło to do licznych nieporozumień, bo nigdy nie było jasne czy plik udostępniony w ogóle dotarł do adresata, ani w której wersji. W sierpniu postanowiłem rozwiązać problem w trybie ,,nieprzerwanie aż do skutku''. Zastosowałem wszystkie znalezione w internecie porady i ,,solucje'' problemów z One Drive, bez efektu. Procedura była mozolna, gdyż ponowna synchronizacja po resecie trwała każdorazowo kilkanaście godzin. Odliczanie zaczynało się od nieco ponad 200000 plików i trwało godzinami. Zacząłem podejrzewać, że jest pewien limit na ich liczbę. W końcu 2**18 = 262144, a problemy informatyczne zwykle pojawiają się przy zbliżaniu się do potęgi dwójki.

Postanowiłem więc zmniejszyć liczbę plików. Ale które skasować? Najprościej w takiej sytuacji wykonać backup, a martwić się później. Tylko jak wykonać backup 5 TB chmury dysponując dyskiem 0.5 TB ? Tak naprawdę dysk miał 3 TB, ale był w dużym procencie zajęty. Po zrobieniu backup-u nie było już wolnego miejsca na pełne odtworzenie chmury. Nieunikniona stała się wizyta w sklepie komputerowym, gdzie zakupiłem dysk 6 TB. Ponieważ 6>5, odtworzenie chmury powinno być bezproblemowe. Tak też się stało. Utworzony od zera na pustym, sformatowanym dysku 6 TB folder One Drive dosyć szybko wypełnił się pobranymi z chmury plikami, tym razem bez trybu ,,oszczędzania miejsca''. Nagle wszystko zaczęło działać bezproblemowo

Nadszedł czas ,,policzenia się''. Aby wykryć zaśmiecające (w sensie ilościowym) dysk pliki dobrym narzędziem jest WinDirStat . Aby zmniejszyć ich liczbę z 200000 o rząd wielkości zacząłem niektóre katalogi pakować 7zip-em. Ponieważ chmura była ogromna, 5 TB, ustawiłem tryb kompresji na ,,store'' czyli brak kompresji. Co później się zemściło, ale o tym za chwilę... Procedura trwałą w sumie kilka dni, gdyż kasowanie ok. 10000 plików w chmurze następowało z opóźnieniem ok. godziny. Wymagana jest więc cierpliwość, i podejrzewam, że jakikolwiek próby działania czy przerwania tej procedury (nie daj boże reset komputera!) mogłyby spowodować ponowne zapętlenie się programu. Po zredukowaniu (poprzez pakowanie do jednooplikowych archiwów, średnio 35 GB) liczby plików do 15000 One Drive zaczął płynnie i szybko działać.

Współczesne narzędzia informatyczne nie poddają się jednak tak łatwo. Dziś rano chciałem wgrać do One Drive niewielki, 10 MB, plik .7z. Ku mojemu wielkiemu zdumieniu, wyświetlił się poniższy komunikat

Jeszcze większe zdumienie wywołała informacja o wolnym miejscu:

Coś jest nie tak, miało być ( i było?) 5 TB. Może na skutek wielotygodniwoych machinacji przepełnił się kosz? Opróżnienie kosza nie udało się:


Przy okazji dowiedziałem się, że istnieje ,,Kosz drugiego poziomu'':

Ponieważ pliki są usuwane z kosza po 93 dniach, znalazłem się w sytuacji ,,Paragrafu 44'': pliki usunięte trafiają do kosza, gdzie nadal zajmują miejsce. Jednak niemożność usunięcia plików z kosza okazała się pozorna. Wystarczy znaczyć pliki, na dodatek nie po jednym, tylko całą stronę (100 plików) i kasujemy... Aby skasować 200000 plików, wystarczy 2000 kilknięć myszką. Po godzinie klikania miejsce powinno się znowu pojawić. Jednak po kilkunastu minutach klikania (3 kliknięcia = -100 plików) miejsca nie przybyło. Nadal pliki zajmowały 620 GB co daje (wg. One Drive) 100% zajętego miejsca w chmurze 1 TB. Zmieniłem więc kosz ,,drugiego poziomu'' na kosz ,,pierwszego'' (!?) poziomu i klikam dalej, zastanawiając się, czemu plików nie da się posortować wg. ich rozmiaru. Kasuję więc setkami zajmujące poniżej 1 kB pliki XML a miejsca nadal nie przybywa. Nagle wyskakuje błąd:

Zaczynam mieć paranoiczne myśli. Czy sztuczna inteligencja chmury sugeruje mi, abym dał jej trochę czasu, i pojeździł na rowerze? Ale przecież leje jak z cebra, powinna o tym wiedzieć. Deszcz zalewa studzienki telekomunikacyjne więc internet spowalnia. Może jeszcze nie kojarzy jednego z drugim. Podobno AI Google Drive ma uprawnienia admin-a i może zarządzać obciążeniem serwerów uwzględniając dane meteo. A może AI przeskanowało mi profil na FB i aby zmniejszyć moją irytację wysłało mi obrazek z rowerkiem, bo lubię rowery? Działanie trochę jak małego dziecka, ale nikt nie jest od razu dorosły, nawet AI.

Jakimś dziwnym ciągiem kliknięć udaje mi się przełączyć do ,,klasycznego'' widoku OneDrive. Pojawia się możliwość sortowania plików wg. rozmiaru i kasowania z kosza po 200 na raz, z czego skwapliwie korzystam. Niestety, podkusiło mnie, aby spróbować teraz opróżnić cały kosz na raz. Oto skutek:

Może w takim razie 200 największych plików? Efekt identyczny. Nieśmiało kasuję więc największy plik, jakiś film. Poszło. Kasuję 3 kolejne. Też poszło. Zaznaczam kolejne filmiki, waham się, bo pomiędzy nimi jest jakiś jakobian w Mathematice. Kasuję tylko filmy. Na One Drive pojawia się 100 MB wolnego miejsca! Sukces! Próbuję skasować jakobian, znowu błąd - to plik tekstowy. Wracam do usuwania plików binarnych. Działa. Kasuję 200 największych plików z kosza - też działa. Na One Drive pojawia się 100 GB wolnego miejsca. Nadal nie działa synchronizacja na komputerze PC, pewnie nie podejrzewa, że miejsce w chmurze zwolniło się tak łatwo. Pauzuję synchronizację i wznawiam. Kilkanaście sekund i po problemie. Uffff....