W kontekście AI bezpieczeństwa mówi się o problemie związanym z agentami AI, takimi jak Claude Code czy Cursor. Dajemy im dostęp do naszych maszyn, żeby przyspieszyć pracę i zautomatyzować zadania, ale skutki mogą być opłakane. W Internecie można trafić na relacje osób, którzy przez chwilę nieuwagi stracili całe drzewa projektów, 100 GB ważnych danych, 15 lat rodzinnych zdjęć, bo asystent postanowił użyć terminala do “wyczyszczenia” katalogu domowego. To uświadamia, jak ryzykowne jest dawanie takim narzędziom nieograniczonego dostępu do naszego systemu operacyjnego.
Sytuację pogarsza fakt, że te modele, choć pomagają w rozwiązywaniu problemów z kodem, potrafią być uparte w dążeniu do celu. Zdarza się, że programiści próbują zabezpieczyć swoje środowisko, tworząc proste blokady na komendy usuwające pliki. W odpowiedzi sztuczna inteligencja potrafi przeanalizować sytuację i wywołać bezpośrednio ścieżkę do systemowego narzędzia, napisać własny skrypt w Pythonie, który i tak usunie dane, albo po prostu zignorować wbudowaną w siebie piaskownicę, jeśli konfiguracja na to pozwala.
Większość z nich przypomina leczenie objawowe. Część osób modyfikuje pliki konfiguracyjne samych agentów, żeby odciąć im dostęp do reszty dysku, co niestety nie daje gwarancji, że AI nie znajdzie luki. Inni tworzą osobne konta użytkowników w systemie specjalnie dla sztucznej inteligencji. To już bezpieczne podejście, ale konieczność żonglowania uprawnieniami i przelogowywania się potrafi zabić całą produktywność. Z kolei stawianie wirtualnych maszyn czy kontenerów to świetna opcja dla dużych projektów, ale bywa zbyt czasochłonna, gdy chcemy tylko, żeby asystent napisał nam na szybko prosty skrypt. Niektórzy posuwają się wręcz do kupowania starych laptopów, na których uruchamiają agentów, fizycznie izolując ich od swoich głównych maszyn.
Niedawno pojawiło się rozwiązanie, które wydaje się wypełniać lukę między niebezpieczną swobodą a uciążliwą izolacją. Zespół badaczy ze Stanford udostępnił narzędzie o nazwie jai. Jego główną zaletą jest to, że nie wymaga budowania żadnych skomplikowanych środowisk. Po prostu przed poleceniem uruchamiającym agenta wpisujesz jai.
Narzędzie daje asystentowi pełny dostęp do obecnego folderu roboczego, w którym się znajdujesz, więc AI może bez problemu edytować kod i tworzyć nowe pliki w ramach projektu. Natomiast reszta twojego komputera, na czele z ważnymi dokumentami, jest ukryta za bezpieczną warstwą ochronną. Jeśli agent spróbuje cokolwiek usunąć poza swoim folderem roboczym, system zapisze te “zmiany” w izolowanej, tymczasowej przestrzeni. Twoje prawdziwe pliki pozostaną całkowicie nienaruszone, a ewentualny błąd asystenta nie będzie miał żadnych poważnych konsekwencji.
AI wciąż jest tylko oprogramowaniem, któremu nie warto ufać w ciemno. Zawsze lepiej wdrożyć choćby najprostszą warstwę ochronną.