#138 Short #62: Bezpieczeństwo AI Foundry, Tabele S3, Drama Fluttera, Algorytmy Systemowe, Restrykcje AI

Bezpieczeństwo AI Foundry czy Tabele S3? To nie quiz IT, to nowy odcinek Patoarchitektów! Serwujemy gorącą mieszankę tematów jak Drama Fluttera i Algorytmy Systemowe.

Odkryjemy tajniki testów integracyjnych i ich wpływ na jakość kodu. Przeanalizujemy raport Cloudflare 2024 i jego zaskakujące wnioski. Omówimy też nowe restrykcje GPU i ich konsekwencje dla branży AI.

Masz ochotę na solidną dawkę wiedzy technicznej z nutką humoru? Włącz ten odcinek i przygotuj się na patoarchitektoniczny rollercoaster! Twój mózg ci podziękuje, a szef doceni nowe pomysły.

Linki i ciekawe znaleziska

Transkrypcja

Szymon Warda: Cześć, słuchacie Patoarchitektów. Prowadzą: Szymon Warda…

Łukasz Kałużny: I Łukasz Kałużny. Linki do tego odcinka gdzieś klasycznie tu sobie znajdziecie na dole, tutaj Patoarchitekci.io, lub jak powiedziałem, opis w zależności, gdzie czytacie. No to co, kolejny przegląd newsów. Lecisz Szymon z pierwszym linkiem.

Szymon Warda: Dobrze. Pierwszy przegląd newsów, to co mi się pierwsze trafiło, to jest artykuł, który już drugi raz polecamy właściwie, drugi raz polecamy bloga, można powiedzieć. On ukradł moje serce fajnym cytatem tak naprawdę odnośnie tego, jaki wpływ mają testy i jaki efekt mają. I teraz lecimy po kolei. Integracyjne testy - lepsze, wszystko lepiej działa, ale jakość kodu idzie do dołu. Jednostkowe, a mało integracyjnych - kod jest dużo łatwiejszy, raczej dużo ładniejszy jest, ale rzeczy przestają działać. I to jest bardzo prawdziwe, co często widzę. Np. taka sytuacja jak jeden zespół właśnie mieli koło 200 testów. System wywalił się przy pierwszym wdrożeniu, bo się nie mógł do bazy danych połączyć, bo mieli błąd w połączeniu samym. Ale idziemy dalej. Testy end-to-end w greenfieldzie. Ogromy dług technologiczny i to jest bardzo prawdziwe. Robienie end-to-end, jak nie znamy domeny, nie ma żadnego kompletnie sensu. Za to testy end-to-end, w kontekście systemów starszych już, to jest ogromna, ogromna wartość, bo tam ta cała logika będzie się działa. Tak że o co mi chodzi? O to, że nie ma czegoś takiego jak piramida której trzeba zawsze się trzymać, itd. Kontekst jest zawsze najważniejszy, więc myślmy po prostu.

Łukasz Kałużny: Patrząc, tak, Maciek, pozdrawiamy, bo pewnie słuchasz. Czy wiesz co, teraz jak popatrzymy, ta piramida testów, ale to wszystko zależy od kontekstu… Inaczej, najgorsza skrajność to jest popadanie, że zacznijmy testować frameworki, jak większość kurde zaczyna uznawać unit testy, zamiast skupić się na, chyba tak jak przescrollowałem, a właśnie: shifting our focus to behavior rather than all possible combinations. To jest dobre takie całe podsumowanie tego, bo jak popatrzymy… Weźmy jeszcze światek .Netowy, z którego się wywodzimy. Mock na mocku, abstrakcja na abstrakcji, żeby coś przetestować. I w większości na koniec dnia testujesz zachowanie frameworka, jakby tak na to popatrzeć szczerze.

Szymon Warda: Druga opcja jest taka, że testujesz czy się element dodał do listy. I ja to trochę upraszczam, ale na przykład w wielu podejściach, jak widzę, takie bardzo mocne DDD, to testujemy, czy element dodał się do listy tak naprawdę, w testach jednostkowych najczęściej. Co jest okej, taka jest logika, że coś się wydarzyło. Ale naprawdę integracyjne często mają dużo większą wartość, tym bardziej, że ja będę brutalny, ale mi zależy dużo bardziej na tym, czy ten system działa. Ten kod nie wszędzie musi być piękny, a takie, no takie, sorry, ale takie brandzlowanie się miejscami, żeby testy jednostkowe były świetne i żeby dało się wszystko, a potem kończyć na tym, że i tak mamy 10 mocków, nie ma to żadnego sensu.

Łukasz Kałużny: To znaczy, odwróćmy. Piszmy tak warstwy abstrakcji, żeby dało się przetestować logikę biznesową.

Szymon Warda: Tak, kontekst jest zawsze też najważniejszy tutaj. Dobra, tyle już. Zgadzamy się, nie będziemy się klepali po pupach, jest to fajnie, śmigamy dalej. Co tam masz?

Łukasz Kałużny: Dobra. Mam taki projekt u klienta, u którego nie mogę mówić, ale jest regulowany. I jedną z takich rzeczy, które robimy na co dzień w Protopii, to pomagamy zonboardować do organizacji jakąś usługę. W tym przypadku jest to sobie machine learning, dokładnie AI Studio, a teraz po nowemu kuźnia AI, czyli AI Foundry w Azurze. Jest taka ciekawostka, że jak popatrzymy z perspektywy bezpieczeństwa, to dostawcy chmury, za przeproszeniem, wpisują sobie, jeżeli popatrzycie na listę np. co trzeba, kiedy zabezpieczamy usługę, chcemy ją wstawić do naszej sieci, zabezpieczyć możliwości, żeby ten ruch np. wychodzący do internetu nie był na zasadzie otwórzmy gwiazdką i wszystko, wypuszczamy wszystko.

Szymon Warda: Totalny standard.

Łukasz Kałużny: Totalny standard. Jedną z takich rzeczy, na którą ja jestem chory, jak widzę, i działy bezpieczeństwa u klientów również w środowiskach regulowanych, to jest otwieranie przez Microsoft ruchu do GitHub. Po prostu wpisujemy GitHub.com, https i developerzy cloudu: dziękujemy, są szczęśliwi, grupy produktowe są szczęśliwe, bo rozwiązali swój problem. I jednych z takich drobnych moich sukcesów z ostatnich tygodni to jest to, że wpisali jawnie, z jakiego repozytorium na GitHubie dokładnie pobiera, licząc nawet ścieżkę dokładnie do, gdzie znajdują się rzeczy, które są pobierane akurat przez te AI Foundry i zaktualizowali to w publicznej dokumentacji. Trzy tygodnie czekałem na odpowiedź. Okazało się, że nie próbowali odwrócić kota ogonem, tylko aktualizowali dokumentację.

Szymon Warda: Z takich rzeczy dodawanie też, że jest: dodaj dostęp do bloba wszystkiego i absolutnie to otwórzmy.

Łukasz Kałużny: Tak, to jest mój ulubiony ten, ulubiona rzecz. Teraz krok drugi w ramach eskalacji to jest, co zrobić, żeby w ogóle nie był ten GitHub potrzebny. I dlaczego słuchajcie, ja się tak tego czepiam i bezpiecznicy się czepiają? Bo otwierając ruch, zazwyczaj w takie usługi, nie obsługują np. proxy, na którym możemy filtrować ruch, zrobić DLP i inne rzeczy. Oznacza to dwa elementy. Jeżeli ktoś chce się uprzeć, przykładowo taki data scientist, czy osoba, która ma dostęp do takiego AI Studio Foundry, to może te dane zgarnąć i wysłać je sobie bezkarnie na jakiekolwiek repozytorium na GitHubie I my na firewallu zobaczymy tylko ruch do GitHub’a, nic więcej, bo wszystko będzie szyfrowane i tylko rozwiniemy sobie początek nagłówka od SMI. Drugą rzeczą, która jest, możemy też ściągnąć rzeczy, których sobie nie życzymy na naszą moc obliczeniową. I to jest jedna z takich podstawowych rzeczy, zabezpieczenie tego, co pobieramy i wysyłamy do internetu, i każdy bezpiecznik będzie was o to ścigał. Więc że tak działa chmura, to też nie wolno sobie wmówić. I z drugiej strony, tam po drugiej stronie tworząc tę usługę, też siedzą developerzy i też próbują robić rzeczy na skróty.

Szymon Warda: Bardzo mocno. Nie ma co patrzeć, że to on, to jest chmura, to to jest poważny soft. Różnie z tym bywało ustalmy.

Łukasz Kałużny: Raczej rekord z drugiej rzeczy, to za dwa tygodnie powinno być załatane. Microsoft wypuścił też dla ML Workspace, dla usługi od ML Studio właśnie Workspace i tej AI Foundry zrobili nową wersję CMK, która jest przyjemna do używania. Ale wymaga, tak, jest bardzo dobrze zrobiona, poza jednym bugiem, którego nikt wcześniej nie zauważył i oni też, że Key Vault musi być publiczny. Mina Szymona jest tak, jest dobra, to Ci pewnie w którymś momencie o tym mówiłem, bo to w czerwcu zgłaszałem, więc teraz czerwiec, więc w styczniu ma wjechać. I mówiąc dalej, bo miałem okazję rozmawiać z inżynierem, który to tworzył, ja go się tak zapytałem, czemu nie skorzystaliście, tam jest taki przycisk “allow trusted services” na Key Vault, gdzie Microsoft może rejestrować. Nie napisali do końca mikroserwisu jak należy i nie zarejestrowali go w tej liście.

Szymon Warda: Tak, ale to “allow trusted services” też jest dość ciekawa czasami.

Łukasz Kałużny: Tak, to takie rzeczy robimy w Protopii, tak pomagamy prostować chmurę.

Szymon Warda: Dobrze, a jak idziemy tematem, co tam się w chmurach różnego wywaliło i nie zadziałał, jak powinno zdziałać, to ja inny temat. Mówiliśmy przy przeglądzie re:Inventa, o ile pamiętam, o tym, że AWS się pokłonił i opublikował S3 Tables, czyli taki zarządzany Apache Iceberg, ogólnie open source’owy format do przechowania danych, dużego zbioru danych, który finalnie można ładnie się odpytywać po SQL’u. No i opublikowali, do tego jeszcze dorzucili fajną opcję, bo dorzucili opcję zagęszczania, czyli tam po prostu te mniejsze pliki zagęszczamy do większych. Wiadomo, że w tej sytuacji łatwiej i szybciej on się odczytuje. Nawet dwa, trzy, trzy i pół raza szybciej generalnie operacje idą. No i teraz…

Łukasz Kałużny: Ściąganie ogólnie dużego bloba jest tańsze niż wiele małych odczytów.

Szymon Warda: Ale były też przeszukiwania tak naprawdę, wykonywanie tych operacji. No i trochę się rozlało w AWS-owym światku, bo niektórzy chwalą, że faktycznie fajnie, fajnie, fajnie. Ale np. John Catay ze Stream po prostu jest trochę zły, bo co się w tym momencie dzieje? W tym momencie możemy sobie wziąć Sparka, podłączyć go ładnie do S3 Bucket’a i śmigamy tak naprawdę. Więc AWS zaczął robić to, co robi Amazon.com, czyli po prostu wycinać wszystkich pośredników i bardzo ładnie robić analitykę właśnie na bardzo prosty sposób. Tak że trochę się rozlało i trochę tam się zaczęło shitstormu robić wokół tego. Ciekawy jestem, jak to dalej pójdzie, tym bardziej, że jeszcze pamiętajmy o tym, że ogłosili to tagowanie metadanych, o których też mówiliśmy przy re:Invencie. Tak że z tego S3 zaczyna robić się taki całkiem ciekawy store do trzymania różnych zbiorów danych i przeszukiwania ich. Oczywiście pod LLM-a i oczywiście pod AI-a [niesłyszalne 00:10:17] co to jest.

Łukasz Kałużny: Tak i lakehouse’y, jak popatrzymy. Ale to jest też to, co, kurde inaczej… Ze wszystkich firm aktualnie wyszło to tylko Databricks’om. Jak popatrzysz. Ze wszystkich firm, bo był Hortonworks, przejęty, Cloudera. No w sensie, Cloudera zniknęła z radaru. Raczej ona nadal gdzieś jest jako HDFS, Spark i inne rzeczy. Ale ogólnie jak popatrzymy, to tak z tego całego systemu Hadoop’a, jak popatrzymy na część taką korporacyjną, to Databricks, gdzieś tam Snowflake i długo, długo nic.

Szymon Warda: Tak, ale nawet te ile dostali kasy z kolejnych rund zbierania funduszy, to jest ogromna ilość. Rynek analityki jest ogromny i to jest rynek, który jest od wielu lat przyzwyczajony do tego, że płaci się dużo. Dlatego nie dziwi mnie kompletnie to, że AWS powoli, powoli tam podżera po kawałku, po kawałku. Inna bajka jest, że faktycznie dodanie tej funkcjonalności do S3 ma sens i jest całkiem fajne. Kwestia płatności, bo to jest dość ciekawe, tam jest… To zagęszczanie kosztuje 5 centów za gigabajt. I to niby nie jest dużo, jak się pomyśli, ale jak mówimy o petabajtach, to zaczyna być dużo, dużo, dużo, dużo droższa usługa.

Łukasz Kałużny: Słuchaj, inaczej, to tak jak opłaty za transfer między zone’ami.

Szymon Warda: Tak, tak, tak, to są takie ładne, że można się bardzo pięknie nadziać, że: oj to [niesłyszalne 00:11:53] jest większe niż przewidywałem.

Łukasz Kałużny: Ups, ups. Dobra. A teraz rzecz, jest tam wpis, który nie podlinkuję, bo jest beznadziejny, ale zainspirował mnie do innej rzeczy. Sam oryginalny wpis, że w ogóle w DevOps’ie jest dużo outdated toolsów DevOps’owych. Jak sam autor mówi o Jenkins’ie, puppetach, [niesłyszalne 00:12:18]. Powiedzmy tak, zgodzę się z Jenkins’em, że mógłby przestać istnieć.

Szymon Warda: Ale on ma strasznie dużo użycia.

Łukasz Kałużny: Inaczej, Jenkins ma użycie, Szymon, ale to jest bardzo jasne, bo jest długo na rynku i ma dużą ilość haków i ludzie mają w nim płynność i jest darmowy.

Szymon Warda: On się wybił bardzo mocno tym, że bardzo wcześnie miał całe pipeline’y jako kod. To tym zabłysnął i…

Łukasz Kałużny: Tak, groovy to ten… Tak jak na naszym Discordzie pisałem, bo ktoś wrzucał, już nie pamiętam, jakiegoś toola, to miałem PTSD od Webpacka, to drugie PTSD jest od groovy’iego w Jenkins’ie, jak go widzę. Ale wracając, to bardziej chodzi mi teraz o to, o czym sobie przypomniałem, było kiedyś pytanie Krzysztofa w komentarzach bodajże na YouTube, bo wspominałem, że mam auto-update’y providerów terraformowych. I po co w ogóle robić auto-update infrastruktury i podbijać regularnie wersję? I tu się pojawia taka rzecz, bo akurat ten proces wczoraj patrzyłem i robiłem merge takich requestów, to po diabła robić, np. podbijać automatycznie providery, bo prościej jest zerknąć 5, 10 minut raz na dwa tygodnie, jak podbija się wersja i zobaczyć, jakie będą, jak to niektórzy mówią, depreciations zamiast deprecated, jakie rzeczy będą wycofywane i zrobić sobie taska, być może podmienić parametr i zrobić lekki refaktoring kodu niż obudzić się z ręką w nocniku, żeby był duży skok. Potrzebujemy jakiejś property np. i obsługi nowej wersji API i nagle się okazuje, że trzeba przeorać połowę projektu.

Szymon Warda: Czekaj, właśnie, czyli w bardzo zawoalowany sposób powiedziałeś, że łatwiej jest robić mniejsze zmiany niż rzadziej większe.

Łukasz Kałużny: To jest tak, normalne, tylko zobacz, bo jak masz to, czego ludzie nie chcą zaakceptować mentalnie, to że regularny auto update, w zależności czy to będzie w ogóle Terraform czy kod, zazwyczaj prościej Ci jest to refaktorować ongoing niż zrobić potem rzut pod tytułem, nie będę tu przeklinał, bo ponoć słuchają nas też nieświadomie dzieci w samochodach, ale zrobić rzut, że nagle jest: O boże, ja to muszę zaktualizować i nie wiem od czego zacząć, żeby infra przeżyła, tudzież aplikacja.

Szymon Warda: To było z serii “Patoarchitekci odkrywają wielkie prawdy”. Ale tak bardzo poważnie, to Łukasz, wydaje mi się, że to powód jest trochę inny. Bardzo łatwo nam jest mówić, jak inni powinny robić. Dużo trudniej jest mieć up to update samemu. Czyli mówimy, że: o, developerzy powinni. A jak to dotyczy infra, to gorzej. A moje takie wrażenie, że, szczególnie jeżeli mówimy o Terraformie, to tam update’y są naprawdę bardzo ważne, bo oni jednak gonią i te niezgodności są dość ważne, to się potrafi rozjechać. Tak że nie, tu bym się bardzo, bardzo zgodził. Przy Bicepie to może jeszcze te wersje nie są tak bardzo potrzebne, bo tego nie zmienia strasznie.

Łukasz Kałużny: Ale wiesz, jak patrzę na Terraforma czy w ogóle na te API wszystkie cloudowe, to przez to, że… Inaczej, zmiany, które tam są wprowadzone, są drobne i naprawdę to są pierdoły do refaktoru. I nagle się okazuje w takiej infrzeja, wezmę Azure’a, z którym najczęściej pracuję, no to update zajmował mi teraz, jak tam popatrzę, co muszę zrobić, to jest z 20, 30 minut roboty i np. przejście z providera, taki duży skok, niby making changes z wersji trójkowej na czwórkową, to były dwie godziny roboty i tyle, pozamiatane i do domu.

Szymon Warda: Tak, nie, ja się zgodzę, że tam nie ma dużo roboty do zrobienia. Dobrze, mój drogi, to co, lecimy chyba dalej? To ja jeszcze czymś rzucę. Ja mam serię dramatów właściwie dzisiaj wyłapałem, bo całe dramaty teraz się dzieją wokół Fluttera.

Łukasz Kałużny: Raczej one się zaczęły kiedyś tam, parę miesięcy temu.

Szymon Warda: Tak, zaczęły, ale tam się jakby dzieją. Ale mnie tam co innego zaciekawiło bardzo. Bo o co chodzi? Chodzi o to, że dwie osoby, Matt Carrol i Jesse Ezell opublikowali Flocka. Flock jest forkiem Fluttera, którego celem jest to, że ma być zgodny dalej z Flutterem i stworzyli go po to, żeby naprawiać rzeczy, które ich bolą w projektach i przez które wywalają się aplikacje produkcyjne. No i wylała się cała fala hejtu, właściwie co tam się dzieje, itd., że to może powinno być i przez Google, itd. Ale w to nie będę wchodził. Najbardziej zafascynowało mnie to, że dwaj panowie stwierdzili, że też przy okazji opublikują toola, który w bardzo łatwy sposób umożliwi samodzielne robienie i prywatne robienie forków do Fluttera. Czyli jak będziesz startował z projektem to sobie, przepraszam, weźmiesz forka, użyłbym innego słowa tak naprawdę tutaj, ale dzieci, i będziesz miał swojego forka Fluttera. Przepis na absolutną tragedię.

Łukasz Kałużny: Myślałem, że w 25-tym nauczyliśmy się, że nie ma gorszego pomysłu niż własny fork prywatny.

Szymon Warda: Nie ma gorszego pomysłu niż własny fork, no naprawdę. Mnie to zwaliło z nóg osobiście i nie wiem co dalej o tym mówić, ale taka ogólna informacja, dobre rady na nowy rok, to unikajcie utrzymywania projektów open source’owych tylko pod wasz projekt, bo to się po prostu nie udaje. Tak, to jest ciekawostka. No więc takie krótkie. Co tam masz dalej?

Łukasz Kałużny: Na razie jestem rozwalony. Następnie rzecz: taki rysunek na temat algorytmów z miejsca, którego nie lubię i oglądam je tylko dlatego, że ma animowane strzałki i patrzę, kto przyjdzie z jakim głupim tekstem.

Szymon Warda: Łukasz, nie tłumacz się. Każdy z nas scrolluje coś wiadomo w jakim miejscu.

Łukasz Kałużny: Tak, dokładnie. I z tego miejsca przychodzę z grafiką od słynnego ByteByteGo, czyli tam Alex Xu, czy jak mu tam, który zrobił tą książkę, jak scracować, tłumacząc na polski, jak scracować system design interview, nie wiedząc nic o system designie. Bo na tym polega ta część [niesłyszalne 00:18:59] system designu. Ale co jest dobrego? I to bardziej jest lista rzeczy. Algorytmy, które warto poznać, jeżeli chodzi o system design i nie je pisać, bo nie oszukujmy się, 99% z nas nie będzie miało w ogóle potrzeby z tymi algorytmami na co dzień go zaimplementować, ale w wielu miejscach ma z nimi styczność w postaci już gotowych bibliotek czy rozwiązań.

Szymon Warda: Wiesz co, powiedziałbym, że niekoniecznie ma styczność, ale że jest jako opcja. Np. załóżmy widzę tu HyperLogLog. To nie jest to, że się pomyliłem, tam jest dwa razy “Log”, który jest od dawien dawna w Redisie jako opcja.

Łukasz Kałużny: Dobra, dalej masz Rafta, Paxosa, jeżeli popatrzysz na to. Masz Liki Back-end czy Token Bucket do rate limitingu. Masz consistent hashing i geohashing i Quadtri, z których jak wchodzisz na Face’a, LinkedIn’a czy inną usługę cloudową, na co dzień nieświadomie nawet używasz, przechodzisz przez to. Więc dobrze jest poznać do czego te wszystkie algorytmy, o co w nich chodzi, do czego służą, jak się zachowują.

Szymon Warda: Tak, tym bardziej, że większość tych algorytmów w ogóle, jak się poszuka w sieci, to mają bardzo ładne wizualizacje graficzne.

Łukasz Kałużny: Tak.

Szymon Warda: Tak patrzę właśnie po kilku… No wiadomo, Paxos i Rafta, tam oczywiście, że mają.

Łukasz Kałużny: Raczej Paxosa olejcie, jak Rafta zrozumiecie, to już wystarczy.

Szymon Warda: Tak, tak.

Łukasz Kałużny: Uczciwie.

Szymon Warda: Dobrze, to śmigamy dalej. Ja co innego, ja wygrzebałem jeszcze jedną rzecz. Mianowicie Cloudflare opublikował swój Radar 2024. Tam nic jakiegoś takiego super odkrywczego nie ma, ale tak przejdziemy, bo może kogoś zainteresuje. Oczywiście wiadomo, że nie było liderów, Google będzie dalej najbardziej popularny, itd. Z ciekawostek, ruch na Starlinkach wzrósł trzykrotnie. To jest sporawo. Ale co jest najciekawsze? To są Crawlery AI-owe.

Łukasz Kałużny: Ile tego przybyło?

Szymon Warda: No właśnie nie podają absolutnych wartości, ale podają co się zmieniło. I teraz tak, o ile Bynders AI zaczął bardzo wysoko, to sobie zmalał razem z całym przejściem roku, co jest ciekawe. Anthropic pojawił się, miał taki pik w kwietniu, a potem znowu ten ruch zleciał w dół.

Łukasz Kałużny: A potem ten, w kwietniu, czyli wydali nowy model, zrobili nowy crawling, i wydali model w październiku, czyli…

Szymon Warda: Tak, ale to jest w ogóle ciekawe z tego prostego powodu, że obecnie cały crawling, dużo artykółów, które widziałem, właśnie jak się strony bardzo mocno…

Łukasz Kałużny: Chcą blokować.

Szymon Warda: Narzekają na to, że po pierwsze te crawlery nie respektują Robots TXT, crawlują bardzo często, tak kilkadziesiąt razy częściej niż Google to robi, więc to jest dość relatywnie duże obciążenie. I to nie oszukujmy się, ale to crawlowanie z reguły jest pełnym pogwałceniem praw intelektualnych wszystkich stron. Także jest to temat super ciekawy. Jestem ciekawy, co tam dalej się zadzieje. Ale dalej, co tam się jeszcze działo? 13% stron używa postquant encryption, czyli coś, o czym mówiliśmy w poprzednim odcinku, co jest dużą wartością mimo wszystko. Prawie połowa korzysta z HTTP/2, 20% korzysta z HTTP/3, co jest bardzo ładnym wynikiem. I Stany Zjednoczone są odpowiedzialne za jedną trzecią globalnego ruchu, jeżeli chodzi o crawlowanie.

Łukasz Kałużny: Tylko jedną trzecią.

Szymon Warda: A teraz ciekawostka, pamiętasz podatność w Log4j z 2021?

Łukasz Kałużny: Nadal tak, nadal.

Szymon Warda: Główna podatność. Więc to ostatnie jest smutne, bym powiedział i też przerażające. No, raport okej, fajnie przygotowany, fajne grafiki ma, ale to właściwie chyba wyczerpaliśmy, co tam jest ciekawego.

Łukasz Kałużny: Dobra. Z drugiej rzeczy to teraz walor edukacyjny, zamiast newsowy. I to można wykorzystać też w swojej dokumentacji, czyli “Rules for Writing Software Tutorials”. I tu jest 16, jak popatrzy, takich punktów, które pokazują dobrze wyglądające, pokazuje na zasadzie jak wygląda zły koncept, jak wygląda dobry i tłumaczy. Jest 16 takich punktów, które pokazują np. z list: good, your style skills that promise a clear outcome. Czyli jak sobie pójdziemy potem, są takie pierdoły, w jaki sposób uczynić swoje rzeczy czytelniejszym, lepszym, w jaki sposób powinno to wyglądać.

Szymon Warda: To ja mam taką ogólną radę - pisz, żeby komuś wyjaśnić, a nie żeby pokazać, jak jest się bardzo mądrym i jakie to, co zrobiłeś, jest super skomplikowane i fajne.

Łukasz Kałużny: Podsumowałeś jednym zdaniem ten artykuł, ale są tam takie właśnie - keep your code in working state. To jest dobra rzecz z takich tekstów.

Szymon Warda: Artykuł jest świetny do dodania do DOD dla dokumentacji albo do produktów, po prostu do siebie wrzucenia, żeby wszyscy to przeszli. Faktycznie, bardzo dobry, nawet z obrazkami, to w ogóle rewelka.

Łukasz Kałużny: Tak, nie, właśnie to nie są obrazki, autor stosuje to, co pisze, Szymon, czyli pozwalają na copy paste. To jest jedna z najgorszych rzeczy, czyli snippety z tych generatorów wrzucone, żebyś nie mógł kopiować kodu, że ludzie chcieli, żeby było tak ładnie jak na Twitterze. I wrzucają w tym. Więc to… Ale dobrą rzeczą, don’t try to look pretty.

Szymon Warda: Dobra. To mamy ostatnią chyba rzecz właściwie, to jest… Mieliśmy dyskusję o tym, co właściwie, jaki jest tego wynik? Zmiany taryfowe, jeżeli chodzi o AI i chipy NVIDI i [niesłyszalne 00:25:36], itd. I tu w kraju zostały podzielone na trzy sekcje tak naprawdę. Ci, którzy są: okej. Ci, którzy są: nie, może. Ci, którzy są: no zdecydowanie nie. Wiadomo, że w grupie “zdecydowania nie” są Chiny, Korea i Rosja, to oczywista bajka. Ale cała nasza dyskusja przed odcinkiem była o to, w której właściwie my jesteśmy strefie? Nagrywamy to dość wcześnie tak naprawdę, bo część artykułów na ITIF pokazuje, że jesteśmy w tej „jej, ale będzie fajnie", a część pokazuje, że: “z tym może niekoniecznie”. Tym bardziej, że ta grupa między pierwszą a drugą kategorią, ta pierwsza grupa jest dość niewielka.

Łukasz Kałużny: Wiesz co, jeszcze wyjaśnijmy o czym mówimy, czyli prawa do używania mocy GPU i trenowania modeli.

Szymon Warda: Doprecyzuję, to, gdzie modele mogą być trenowane, bo to jest bardzo ważne.

Łukasz Kałużny: Tak. I problem jest taki, kiedyś pod względem algorytmów kryptograficznych istniało coś takiego jak licencja eksportowa. I np., żeby odblokować, to była świetna rzecz, żeby odblokować np. pełną moc w ruterach Cisco i inne rzeczy, trzeba było kupić specjalną droższą licencję, jako będąc Polakiem. Czyli Amerykanie na dzień dobry dostawali pełnowartościowe pudełko, a Twój chip był ograniczony software’owo. I to teraz się znowu pojawia.

Szymon Warda: Znaczy do software’u wchodzi to, co jest obecne w hardwarze i w innych sektorach powiedzmy sobie tak naprawdę. Bo to nie w pełni istnieje. Tak samo jak F35 musisz wpisać odpowiedni kod codziennie rano, poważnie, żeby odblokować. Więc jest to mega ciekawe. Mnie bardzo ciekawi jak to wpłynie właśnie na data center, na moce obliczeniowe i jak to będzie respektowane przez dostawców chmurowych, tym bardziej że ta właśnie strefa, powiedzmy, między pierwszą a drugą, np. Meksyk już jest w drugiej na pewno.

Łukasz Kałużny: Wiesz co?

Szymon Warda: Cała Ameryka Południowa.

Łukasz Kałużny: Z drugiej strony, w pierwszej jest tylko 18 krajów.

Szymon Warda: Jest bardzo mało, tak.

Łukasz Kałużny: Nie jest nawet całe NATO. Dlatego mówię, że obstawiam, tak jak z jednym wrzuciłem Wam, żebyście się nie musieli męczyć, od razu link z Remove Paywallem, który działa. I grafiki, które latają np., które opublikował Bloomberg, który jest raczej solidnym źródłem i nie jest clickbaitowym miejscem, to np. w grafice, którą przygotowali i danych, no to Polska już jest w tier drugim, tak jak było to historycznie. A teraz szybki przerywnik. Mieliśmy tutaj z Szymonem dyskusję, czy Polska jest na liście krajów objętych restrykcjami, czy nie. Wychodzi na to, że nie jesteśmy w tierze pierwszym. Jak pojedziemy w szczegółowy dokument, który mówi o tych restrykcjach, to nie ma nas, jesteśmy w kategorii tak zwanej drugiej. Jak pewnie w tym momencie słuchania popatrzycie, co dzieje się, to z jednej strony wśród dyplomacji, nie tylko Polski, ale też między innymi Czech, jest duże wkurzenie, jakby to można było określić, tą całą sytuacją. I tak samo Brukseli, podział Europy na kategorie lepsze i gorsze, czy też z perspektywy NATO, jest źle postrzegane i zobaczymy, co będzie się dalej działo z tymi restrykcjami. Dobra, to trzymajcie się w takim razie.

Szymon Warda: Trzymajcie się. Na razie. Hej.

#138 Short #62: Bezpieczeństwo AI Foundry, Tabele S3, Drama Fluttera, Algorytmy Systemowe, Restrykcje AI

SUBSKRYBUJ PODCAST

Słuchasz Patoarchitektów dzięki firmie Protopia.

ZAPISZ SIĘ DO NEWSLETTERA