Konferencja Pato #200 · 16 czerwca 2026, Warszawa · 👉 Kup bilet za 359 zł netto
#Technology Radar #AI Agents #Claude Code #Codebase Cognitive Debt #Sandboxed Execution #Agentic Reinforcement Learning
“Obecnie taczki mamy pełne, biegamy, ale budujemy nie do końca to, co powinniśmy budować.” Szymon o codebase cognitive debt, a Łukasz dopowiada: “Budujemy budynek obok.” Velocity wygląda fenomenalnie - tylko kod nie jest używany. Witamy w przeglądzie Technology Radar Vol. 34 od Thoughtworksa. 🎯
Najdłużej żyjąca seria Patoarchitektów wraca z diagnozą: radar skupił się na coding agents, ale wyłącznie dla deweloperów - agenci biznesowi, hype poprzedniej edycji, wyparowali. Za to feedback sensors, sandboxed execution, mapping code smells to refactoring techniques i Spec Driven Development budują nową infrastrukturę wokół pracy z AI. Łukasz: “Miałem what the fuck, czy ktoś przeskanował mojego Todoista?”
Co jeszcze? Claude Code w adopcie, small language models z Gemmą na telefonie, DeepEval w codziennym użyciu, a Token-Oriented Object Notation do wyrzucenia po testach. “Jak usłyszycie, że manager mówi, że coś się samo uczy na naszych przykładach, weźcie wyrzućcie mu komputer przez okno.” ⚠️
Fowler zniknął z creditsów, hold zamieniono na caution, a agenci powstają jak notebooki Jupyterowe - jednorazówki, nigdy niemodyfikowane. Sprawdź, czy Twój feedback loop nadąża.
Linki i ciekawe znaleziska
Transkrypcja
Łukasz Kałużny: Miałem takie what the fuck, czy ktoś przeskanował mojego Todoista?
Szymon Warda: Możliwe Łukasz, obserwują Cię. A obecnie moje porównanie jest takie, że obecnie taczki mamy pełne, biegamy, ale budujemy nie do końca to, co powinniśmy budować.
Łukasz Kałużny: Budujemy budynek obok. Jak usłyszycie, że manager mówi, że coś się samo uczy na naszych przykładach, weźcie wyrzućcie mu komputer przez okno. Toole zaczynają być nieaktualne już w momencie wypuszczenia. I to jest mocno prawdziwe w tym momencie.
Szymon Warda: Mam wrażenie, że agenci obecnie powstają na takiej samej zasadzie jak powstawały Notebooki Jupyterowe. Jednorazówka, nigdy nie modyfikowane. Cześć, słuchacie Patoarchitektów. Prowadzą Szymon Warda…
Łukasz Kałużny: I Łukasz Kałużny. Wszystkie linki do tego odcinka klasycznie znajdziecie na Patoarchitekci.io albo gdzieś tu na dole. No to Szymonie, co Ty robisz 16 czerwca, powiedz mi.
Szymon Warda: Ty wiesz, że będę się z Tobą wymądrzał na jednej konferencji, na której uważam, że większość ludzi powinna być, bo to przyspiesza działanie twojego systemu o jakieś 30%.
Łukasz Kałużny: A co to za konfa Mistrzu Sucharze?
Szymon Warda: Jest to oczywiście nasza wspaniała konferencja z okazji 200 odcinka, którego żaden z nas nie myślał, że dożyjemy. Więc sobie zbieramy fajnych ludzi, o których często tu rozmawiamy, których uważamy, że są mądrzy, sensowni, mają coś ciekawego do powiedzenia.
Szymon Warda: No i taka jednodniówka w Warszawie.
Łukasz Kałużny: I wszyscy już byli. Czyli 16 czerwca. Będą ogłoszenia parafialne w postaci Keynote’a, którego nie skipniecie w tym miejscu z Q&A-em nie nagrywanym. Czyli będzie można zadać jakieś naprawdę głupie pytania i być może któryś z nas absurdalnie na nie odpowie, albo i szczerze i absurdalnie, można się zaskoczyć. Idąc sesjami moje będzie “200 odcinków later”, powtarzające się patologie. Ty Szymonie o pomidorach znowu?
Szymon Warda: Nie, tym razem nie o pomidorach, chociaż pomidory urosły i powiem Ci, że tak już tak prawie metr mają. Ja tym razem dalej idę w promowanie tego czwartego profilu Observability, czyli mówienie o profilach, bo jednak uważam, że to jest sensowny kawałek i w kontekście tego mojego ulubionego właśnie tematu Observability, jest brakujący i jest trochę niedoceniany na polskim rynku.
Łukasz Kałużny: Będzie Oskar i Mariusz od strony podejścia do architektury, kodu i innych takich rzeczy. Bardzo ciekawe sesje. Oskar Dudycz i Mariusz Gil, też byli gośćmi. I na końcu mamy Mariusza Dalewskiego. I on będzie miał trochę o Kubernetesie, trochę o abstrakcjach, trochę o tym, jak tworzą się standardy i gdzie za nie płacimy. Więc to też będzie ciekawa rzecz.
Szymon Warda: A jeszcze jedna rzecz ważna, nasz Discord, gdzie na przykład można wejść, dołączyć i napisać Łukaszowi, że jednak rosół powinien być w formie lunchu. Taka sugestia.
Łukasz Kałużny: Tak, zerknijcie, landing page konferencji już istnieje, jest suchy i wygląda dobrze.
Szymon Warda: Zachęcam na zdjęcie, bo udało mi się przeforsować, z małym trudem bym powiedział, ale jestem z niego dumny.
Łukasz Kałużny: Po to robię na siłowni te przysiady. Więc teraz w tym. Dobra, słuchajcie, lecimy, najdłużej żyjąca, jak jesteśmy przy 200 odcinku, to najdłużej żyjąca seria, czyli Przegląd Technology Radaru od Thoughtworksa. To Szymon, czym jest może Thoughtworks? Sobie zacznijmy od tego.
Szymon Warda: Thoughtworks jest taką firmą, trzeba jak to powiedzieć, konsultingową, która jednocześnie też ma swoich developerów, którzy są wstawiani do różnych firm w formie team augmentation. Po prostu firma konsultingowa, wstawiają. I co jest ciekawe? Skupiają się na tym, żeby faktycznie być wysoko jakościowym. Tam Fowlera znajdziemy, dość ciekawych ludzi i oni mają dość mocne ciśnienie na publikację, na pokazywanie się i na bycie opiniotwórczymi. I też żeby nie było, często mają fajne rzeczy.
Łukasz Kałużny: I byli dla nas inspiracją w 2019 roku.
Szymon Warda: Tak.
Łukasz Kałużny: Jedną z inspiracji. Dobra i czym jest Radar? Radar ma nam pokazać w postaci właśnie takiego radaru mapy technologie, które warto zaadaptować, czyli adopt. Trial, czyli takie, które warto przetestować. Assess, zacząć oceniać. I kiedyś było, Szymon, ja tego jakoś nie zauważyłem, Ty to wyłapałeś, kiedyś było jeszcze hold. A teraz mamy?
Szymon Warda: Teraz jest caution, więc osłabili bym powiedział formułę słowną tego. Wcześniej to było po prostu “nie rób tego”, teraz “z dużą uwagą”.
Łukasz Kałużny: Dobra, i teraz taka jedna rzecz, zanim sobie przejdziemy, chyba istotna…
Szymon Warda: Czego znowu ja nie wyłapałem.
Łukasz Kałużny: Tak, i to są dwie kluczowe rzeczy. Nie ma już Rebecci w ogóle, która była poprzednio CTO. Więc jest już z Rachel, która jest nowym CTO Thoughtworksa już całkowicie zrobiony. I nie ma również nigdzie Fowlera w tym Technology Radarze. Ja tego nie wyłapałem, bo chyba w poprzednim coś jeszcze gdzieś był w creditsach, teraz go już tutaj nie ma. I to jest bardzo ciekawa rzecz, następuje wymiana pokoleniowa tam. Jak popatrzymy na cały zespół.
Szymon Warda: Tak, jest fajnie, zespół jest młody.
Łukasz Kałużny: Tak.
Szymon Warda: Albo my jesteśmy starzy.
Łukasz Kałużny: Przejdźmy sobie teraz do głównych rzeczy. Jak Ty oceniasz cały Radar? Może tak ogólnie, o tak, zanim pójdziesz w kontrowersyjną opinię, tą zostaw na koniec.
Szymon Warda: Jako cały Radar, jak ogólnie, jest poprawny. Jest dużo rzeczy wokoło poprawy jakości i tu się nie odłączy od mojej kontrowersyjnej opinii. Ten Radar skupia się na jednej rzeczy - na agentach. Ale, co ważne, w kontekście pracy developera. Jest dużo mniej agentów dla biznesu, co było we wcześniejszym Radarze bardzo mocne, a tu jest dużo właśnie wokół wytwarzania softwareu, bardzo dużo, większe bym powiedział.
Łukasz Kałużny: Dobrza, i wiesz co, to jest tak, to jest też rzecz, którą zrobię, miałem takie what the fuck, czy ktoś przeskanował mojego Todoista?
Szymon Warda: Możliwe Łukasz, obserwują Cię.
Łukasz Kałużny: Szymon, bo tak jak sobie pójdziemy, ale zobacz ile my ze stosu albo mamy u siebie i używamy…
Szymon Warda: Tak.
Łukasz Kałużny: Albo o tym rozmawiamy, albo mamy zaplanowane, że w coś chcemy wejść i przetestować. I to wszystko tam znajdziesz.
Szymon Warda: Szczególnie z praktyk. Dla mnie na przykład czytanie tego pierwszego, pierwszej ćwiartki można powiedzieć, Technics to było na zasadzie tak, tak, tak, tak tak, tak, lecimy dalej.
Łukasz Kałużny: Dobra, i ja se takie myśli zanotowałem z tego, tak, The challenge of evaluating technology in an agentic world. Tak, jest genialne, bo jest duży problem z tym, że są bardzo rozmyte definicje i toole zaczynają być nieaktualne już w momencie wypuszczenia. I to jest mocno prawdziwe w tym momencie. Druga rzecz, o której kurde, zobacz, że ciągle ten rozmawialiśmy, to jest codebase cognitive debt i ten problem z tym, że jesteśmy w stanie wygenerować o wiele więcej kodu niż go zrozumieć w pewnym momencie. I to jest…
Szymon Warda: Często też użyć, bym powiedział.
Łukasz Kałużny: I to będzie gdzieś ciekawe. To zresztą nasza rozmowa wczoraj w biurze, że powiedz Szymon, bo to jest genialne porównanie, proszę, zostawiam Ci publikę dla Ciebie.
Szymon Warda: Często mówimy o tym, że mamy tyle roboty, że biegamy z pustymi taczkami, a obecnie moje porównanie jest takie, że obecnie taczki mamy pełne, biegamy, ale budujemy nie do końca to, co powinniśmy budować.
Łukasz Kałużny: Budujemy budynek obok.
Szymon Warda: Tak, to co Ty powiedziałeś wtedy, to było na zasadzie, że velocity, wszystko będzie wyglądało fenomenalnie, tylko że to nie będzie w ogóle używane.
Łukasz Kałużny: Tak. Więc to, ta luka poznawcza. I co jeszcze mnie zainteresowało z takich rzeczy? Bo tam będzie dużo, potem jest dużo bullshitu, z którym też można się zgodzić. Ale to co powiedziałeś przy technikach, że wracamy do fundamentów. I oni to podkreślili, że zero trust, gdzieś masz chyba nawet zaznaczone o code smells, które jest w SonarQubie, czyli że wracamy do zasd… Inaczej te zasady prawdziwego engineeringu, nie chciałbym powiedzieć, że rzemiosła, bo niektórzy zaraz się skargoklultem, wiadome, ale te podstawy poprawnej inżynierii będą się bardzo szybko spłacały.
Szymon Warda: Nie zgodzę się z tym teraz. Wydaje mi się, że Technics jest dla mnie to jest to, o czym znowu mówiliśmy w ogóle w poprzednim odcinku albo dwa odcinki wcześniej, to jest budowanie coraz lepszej feedback loopy dla agentów. Czyli właśnie dodawanie wszystkich (…), dodawanie właśnie AST, żeby agenci łatwiej mogli analizować, żeby łatwiej właśnie mogli testować, weryfikować i żeby to nie było na zasadzie, że my mu dajemy hinta co pięć minut, tylko dajemy mu zadanie i on sobie tam rzeźbi w tym powiedzmy przez godzinę. Czyli to jest takie zarządzanie innym developerem.
Łukasz Kałużny: Przejdźmy płynnie czym są te techniki dokładnie.
Szymon Warda: Dobra, techniki są to wszelkie podejścia. To jest taki trochę worek na rzeczy od programów, po rzeczy miękkie, chyba ze skupieniem na rzeczy miękkie tak naprawdę.
Łukasz Kałużny: Na koncepcję.
Szymon Warda: To są podejścia. O, bardzo ładnie.
Łukasz Kałużny: Koncepcje. Dobra, co Tobie się stąd rzuciło w oczy? Bo mamy w sumie bardzo podobne. Dobra, z pierwszym się nie zgodzę, o tak, które sobie wrzuciłeś, więc…
Szymon Warda: Ja jestem browser-based component testing. Ogólnie byłem, jestem zdania tego, że testowanie i systemów od UI-a jest konieczne. UI się rozchrzania i czasami nie działa i tak dalej. Kontynuowanie testowanie jeszcze za czasów Selenium można powiedzieć, było absurdalnie drogie, to było nieutrzymywalne i tak dalej. I to, ja to już mówiłem od dawien dawna, dla mnie LLM-y otwierają furtkę pod tytułem możemy testować UI-a na zasadzie co powinno jak wyglądać i to będzie utrzymywalne. Dla mnie to jest, będę to cisnął, promował jak najbardziej.
Łukasz Kałużny: Dobra, dwie nowe, które są w trialu i to wspólnie mamy i one są, ja bym je połączył teraz już w tym kontekście bardzo mocno. To Ty też to wybrałeś, czyli feedback sensors for coding agents i mapping code smells to refactoring techniques.
Szymon Warda: I Ci się wtrącę z jedną rzeczą, bo mapping code smells to refactoring techniques też pokazuje inny motyw tego raportu - migrowanie starych frameworków.
Łukasz Kałużny: Witamy, witamy. Ale zostawmy to. To patrząc się, feedback sensors to jest tak, żeby agent dostawał jak najwięcej feedback loopu, żeby się nas co chwilę nie pytać. I to jest taki jeden element. Nawet Janek u nas teraz siedzi nad testowaniem UI-a pod tym względem, czy kod ma sens czy nie od strony samego kodu. No i mapping code smells, to jakbyś Ty rozwinął tą część, dlaczego istotne?
Szymon Warda: Jasne to jest podejście takie, bo problem jaki jest, dla starych technologii typu .NET Frameworki 2.0 i tak dalej, ta baza kodu jest niewielka, dla Coboli i tak dalej i tak dalej, to tego nie ma dużo. Więc o co chodzi? Chodzi o to, żeby jawnie agentom powiedzieć: jak masz taki problem to zastosuj tą technikę. Czyli budujemy mu takiego trochę skilla bym powiedział, który po prostu mówi: to znajdziesz, rób tak. To znajdziesz, rób tak. To jest ten element, który ludzie znają, bo znają podejścia, bazę kodu, zwyczaje w firmie, znają to repo, w jaki sposób i tak dalej. I po prostu uczymy, dajemy mu takie mikro skille jak ma się zachowywać. I to też podnosi kwestie jakości i robi ten wynik jego pracy bardziej deterministycznym.
Łukasz Kałużny: Dobra, ja stąd jeszcze wrzucę z assessa i u nas też to jest w assessie i też mam tool wybrany, Ty też go zresztą wybrałeś, zaznaczyłeś: agentic reinforcement learning environments, czyli wsparcie tego, żeby dotune’owywać sobie agentów. I teraz weźcie wyrzućcie te bajki, jak usłyszycie, że manager mówi, że coś się samo uczy na naszych przykładach, weźcie wyrzućcie mu komputer przez okno.
Szymon Warda: Trochę się uczy, ale niewiele.
Łukasz Kałużny: Niczego się nie… Inaczej, agent, jeżeli masz agenta w kodzie biznesowym, to on się przecież niczego nie uczy.
Szymon Warda: Nie, ok, to jak najbardziej generalnie.
Łukasz Kałużny: Coding agent i jego memory w Claude na przykład, to tak, jest, gdzieś tam te memory działa. Ja mówię o takim, wiesz, biznesowym zastosowaniu tutaj. I z moich rzeczy jeszcze istotna rzecz, na którą osobiście patrzę, to są small language models, czyli SLM-y i dotune’owywanie własnych. Rzucił bym przykład z tą Gemmą, która odpala się teraz na telefonie, jest niesamowita.
Szymon Warda: To ja tu jeszcze mam jedną rzecz, właśnie sandboxed execution for coding agents. To wydaje mi się, że jest absolutna przyszłość i to będzie wymagane i to znacząco podnosi bezpieczeństwo, ponieważ agenci potrafią czasami nagle wyjść za daleko, powiedzmy sobie.
Łukasz Kałużny: Dobra.
Szymon Warda: Ale to też inna rzecz. Tu też (…), bardzo łatwo daje możliwość tworzenia wydzielonych takich workspace’ów dla agentów, że dajemy mu dokładnie co możemy, w sytuacji, jak nie mamy wszystkiego w repo. To też jest sensowne. Dobra, lecimy.
Łukasz Kałużny: Platformy. Czym są platformy?
Szymon Warda: Platformy są dużymi systemami, w których coś uruchamiamy, mówiąc bardzo prosto tak naprawdę. Czyli na przykład Kubernetes i tak dalej, i tak dalej. Coś, co wykonuje nasz kod w pewien sposób, albo w czym piszemy nasz kod.
Łukasz Kałużny: Tak, albo odpalamy. Wiesz co, nie mam tu zupełnie, zupełnie nic. I mam z tym problem, bo też z wieloma rzeczami, które są tutaj, są tak napchane, jest częściowo na siłę moim zdaniem te miejsce.
Szymon Warda: A ja mam dwie rzeczy.
Łukasz Kałużny: Wiem, więc zostawiam Ci głos.
Szymon Warda: Pierwsza rzecz, którą przyznaję się, jeszcze nie sprawdzałem, jest na mojej liście, teraz mam większą motywację, jest ClickStack, w assessie jest. Jest to Open Telemetry compatible open source observability platform that unified logs, traces, metrics and sessions in a single high performance DataStore build on ClickHouse. Czyli kolejna platforma.
Łukasz Kałużny: Opakowany ClickHouse.
Szymon Warda: Inaczej, to może być ciekawa alternatywa dla Grafany. Zobaczymy, że tak powiem, muszę się nią pobawić. Wrzucę na moją platformę testową i zobaczymy, zobaczymy. Druga rzecz, to jest Apache APiSiX. Nie wiem czy można mówić w formie jednego słowa…
Łukasz Kałużny: APiSiX.
Szymon Warda: APiSiX, właśnie takie fajne. Co to jest? To jest znowu coś, co zwróciło moją uwagę z kilku powodów. Po pierwsze, jest to… Czym w ogóle to jest? Od tego zacznijmy. Ingress dla Kubernetesa, oparty na Kubernetes Gateway, wiadomo. Co jest ciekawego tam? Wykorzystuje etcd do konfiguracji, więc te przeładowania śmigają ładnie i oparty jest na pluginach opartych na Wasmie. I znowu Wasm to jest taka rzecz, którą uważam, że fajnie byłoby gdyby weszła i to ma przyszłość. Zobaczymy jak to będzie działało. Ogólnie ideowo świetnie, nie wykorzystałem jeszcze.
Łukasz Kałużny: Dobra, to lecimy, słuchajcie, zanim przejdziemy do następnego, to przypomnienie, nie skipnęliście nas jeszcze, to dajcie suba na YouTubie, plusika na Spotify’u, a jeszcze byłoby świetnie jeżeli zostawicie jakiś randomowy komentarz, który będzie zawierał 8 słów na YouTubie, bo algorytm ponoć to lubi.
Szymon Warda: Tak, ja słyszałem, że danie suba poprawia jakość Twojej cery. Nie wiem o co chodzi.
Łukasz Kałużny: Dobra, lecimy sobie teraz do tooli. Gdzie one są? Bożesz, długi raport. Dobra, idziemy. I czym są toole, Szymonie?
Szymon Warda: Narzędzia, programy po prostu, które wykorzystujemy w naszej pracy. Tyle.
Łukasz Kałużny: Dobra. I teraz tak, jak zażartuję, że widzę rzeczy, które wymienię, z których korzystamy na co dzień u nas idąc słuchaj…
Szymon Warda: Powiem tak, tam są rzeczy, z których ciężko jest nie korzystać na co dzień.
Łukasz Kałużny: Dobra, to lecimy tak, Claude Code, korzystamy wszyscy już.
Szymon Warda: Tak.
Łukasz Kałużny: Osoba nietechniczna w postaci Mikołaja, naszego accounta również, to jest istotne i go (…). Od niedawna używamy Claude Code plugin marketplace, więc u nas jest w adopcie. Gdzieś tam się przebąkujemy o wykorzystaniu Codexa z tym, razem z Claudem jako sparring partnera automatycznego. I rzecz, którą używamy, mamy trochę swoją przerobioną, PageIndex. To jest w bazach wiedzy jako wsad do Knowledge Base’ów, RAG-ów, w branży finansowej i strasznych dokumentów, które tam się potrafią walać.
Szymon Warda: Tak, mi tutaj już zwróciły uwagę dwie rzeczy. Pierwsza, Dev Containers, czyli możliwość…
Łukasz Kałużny: Wróciły.
Szymon Warda: Wróciły albo mają też swoje miejsce. To idealnie nawiązuje do tego, co było, do sandbox’owania agentów, czyli jak zbudować, żeby agent był ładnie wysandboxowany, żeby ładnie to wszystko śmigało w jednym miejscu. Druga rzecz, która zwróciła moją uwagę, której akurat my nie wykorzystujemy, to jest Google Mainframe Assessment Tool.
Łukasz Kałużny: To jest ciekawe.
Szymon Warda: I to jest ciekawe, ale to jest ciekawe z punktu, po pierwsze, że Google też wchodzi w ten rynek, czyli chce tam podkopać rynek Claude’owi. Ale druga opcja, która jest bardzo ciekawa, to jest to, jak to jest zbudowane, bo to składa się z dwóch elementów. Jeden to jest deterministyczne parsery języków i zasady, a dopiero na to nałożony jest AI. I to jest dobre i ciekawe podejście moim zdaniem, bo wiele rzeczy odnośnie przepływów, szczególnie w tych starych językach, gdzie nie mieliśmy dynamicznych wywołań, nie mieliśmy refleksji i tak dalej, i tak dalej, tam tą mapę będzie można zbudować deterministyczne. Więc to jest ciekawe narzędzie do sprawdzenia moim zdaniem.
Łukasz Kałużny: Tak. Dobra, coś jeszcze?
Szymon Warda: Tyle.
Łukasz Kałużny: Tyle. Dobra. I ostatni, mój drogi, kawałek, to są Languages and Frameworks, czyli w skrócie języki, frameworki, biblioteki. Dobra i ja trochę zacznę. Z tego używamy DeepEvala. To jest taka jedna rzecz. Druga, słuchajcie, tu jest Token-Oriented Object Notation, jest jako assess. Wiecie co? Sprawdziłem, wyrzucicie, nie używajcie, nie ma sensu. To oszczędzanie tokenów w tym to jest ściema i realnie obiecany wzrost jakości nie istnieje po dłuższych testach.
Szymon Warda: W obecnej chwili jesteśmy w takiej sytuacji, że jeszcze nie musimy oszczędzać, mówiąc prosto. Tokeny jeszcze nie są tak bardzo drogie. One zdrożeją za jakiś czas. Jeszcze…
Łukasz Kałużny: Wiesz co, tylko widziałem na przykład problemy z tym nawet. Więc Szymon, to popatrzy, miałem na przykład, fajnie, że oszczędziło, ale jakoś spadała.
Szymon Warda: Ale matematyka prosta, tak to będzie działało. Dobra, to ja dorzucę kilka. Rzeczy, których nie wykorzystujemy, ale ja bym na nie rzucił okiem. Docling, (…) biblioteka na Pythonie i TypeScripcie do konwersji dokumentów nieustrukturyzowanych do czegoś, co było odczytywalne. Ma tam cały Machine Vision i tak dalej. Korzystamy z innych narzędzi. Jestem ciekawy jak to działa. Tak dla prostego porównania, żeby to wrzucić. Więc może zarzucę.
Łukasz Kałużny: Akurat ktoś mi ze znajomych wrzucił opensourceowy model od Google’a do OCR-ów. Jestem ciekaw czy działa w tym pod spodem, będzie trzeba zobaczyć, bo ponoć jest, działa jak dziki. Dobra, to ja stąd i ty też to miałeś. Ja mam to na to-do liście przy naszych projektach. Mówiłem o reinforcement learningu agentów i tu pojawia się tool od Microsoftu - Agent Lighting. I z nim jest problem, że to jest kobyła.
Szymon Warda: I to jest od Microsoft, nie wiadomo czy się przyjmie.
Łukasz Kałużny: Kobyła z Microsoft Research.
Szymon Warda: Tak, to jest bardzo ciekawy dział Microsoftu. Oni robią często fenomenalne rzeczy, które czasami się przyjmują fajnie, a czasami po prostu umierają momentalnie.
Łukasz Kałużny: Sama idea na papierze jest bardzo dobra, słuchajcie, żeby zbierać… Inaczej, też trzeba powiedzieć, że podłączamy dowolny framework, zbieramy sobie trace’y i na bazie trace’ów, potem robimy fine tuning po prostu naszych promptów na przykład do agentów.
Szymon Warda: Dokładnie. Więc, raczej adresują problem, który istnieje, który na pewno jest ważny, bo mam wrażenie, że agenci obecnie powstają na takiej samej zasadzie, jak powstawały Notebooki Jupyterowe. Jednorazówka, nigdy niemodyfikowane. Więc…
Łukasz Kałużny: Ale wiesz co to jest? Nawet wczoraj miałem rozmowę, że będzie problemem proces utrzymania tego.
Szymon Warda: Oczywiście.
Łukasz Kałużny: (…) danych.
Szymon Warda: Tak, bo to jest, tam nie ma… No dobra, craftsmanship był, że tak powiem, czy jakiekolwiek procesy wokół tego.
Łukasz Kałużny: Dobra, ostatnie od Ciebie, z którym ja mam ciągle problem.
Szymon Warda: GitHubowy Spec Kit. Co to jest? To jest Spec Driven Development, ale w innej formie. I czemu to wrzuciłem? Bo my mamy nie raz rozmowy o tym właśnie jak podejść znowu do migrowania i do pisania nowych rzeczy. I faktycznie ja się z tym zgodzę, że wychodzenie od elementów zewnętrznych, czyli budowanie dla agenta tego feedback loopy czy takich zewnętrznych wymagań, które nasz system musi spełniać, albo spełnia obecnie, bo już istnieje i będziemy go migrowali, jest sensowne bardzo. To wydłuża tą pętlę. Który framework, program, nieważne, wiadomo o co chodzi. Przebije się i będzie standardem? To zobaczymy. Ale ogólnie kierunek jest bardzo mocno sensowny.
Łukasz Kałużny: Dobra i teraz tak, to trzeba dodać, czyli, że mamy specification. Mamy. To jest implementacja Spec Driven Developmentu, Specification Driven, opakowane w skille od GitHub’a gotowe. I gdzieś tam mam pewne rzeczy, z nim problem, ale inaczej, jest… Skille, które warto sobie zobaczyć, to są moim zdaniem następujące cztery i to taki jest must have, który zobaczcie. To jest Spec Kit Specify, czyli budowa specyfikacji, budowa planu, Spec Kit Plan, potem Spec Kit Task, czyli rozbicie tego na taski. I na końcu execute implementation czyli Spec Kit Implements. I te skille warto zobaczyć, bo zobaczycie, tam jest tego o wiele więcej. Ja mam trochę, Szymon, problem, że zaproszeniem jest tego, wygląda jakby ktoś miał rozwolnienie w tym repozytorium w niektórych miejscach.
Szymon Warda: Przyznaję, jest ono słabe. Tutaj nie będę nawet o tym dyskutował.
Łukasz Kałużny: Ale są rzeczy, które warto zobaczyć, zapoznać się i być może zaadoptować. Jeżeli nie mieliście do czynienia ze Specification Driven Development w agentach, żeby dostarczyć kod, warto na to zobaczyć, o tak. Zobaczyć w szczególności te 4, które wymieniłem.
Szymon Warda: Dokładnie, dobrze.
Łukasz Kałużny: Dobra, to jakie jest kontrowersyjne Twoje zdanie na koniec? Bo mi z jednej rzeczy, jest on bardzo realistycznym snapshotem rynku w tym. Jest tam trochę takie wishful thinking, życzeniowego, bo tak zwykle też Thoughtworks próbował promować technologię, ale wygląda to dobrze.
Szymon Warda: Wiesz co, znaczy tak, wygląda realnie, jest tam dużo mniej hype’u, które było. Moje to jest to, że jakby nie ma tam agentów do biznesu, co było hypem poprzednio i mówiliśmy, że tak to w ogóle będzie. A obecnie jest to taki bardzo mocno realny. Agenci tak, ale do deweloperki, koniec.
Łukasz Kałużny: Bo wiesz co, chyba tutaj jest najmniejszy overpromise.
Szymon Warda: Tak, tutaj jak najbardziej, dostarczanie wartości jest kilkukrotne.
Łukasz Kałużny: Dobra, no to trzymajcie się w takim razie, miłego dnia.
Szymon Warda: Na razie. Heja.

Wypełnij poniższy formularz, aby być na bieżąco ze wszystkimi
odcinkami Patoarchitektów
i uzyskać dostęp do dodatkowych
materiałów.