Czym sa agenci AI? Document, Workflow i Knowledge Agents
Agenci AI to wyspecjalizowane komponenty, ktore autonomicznie realizuja zadania biznesowe. Trzy typy, roznice wobec chatbotow i RPA.
Czym jest agent AI?
Agent AI to wyspecjalizowany komponent programowy, ktory na bazie duzych modeli jezykowych (LLM) autonomicznie realizuje zadania biznesowe. W odroznieniu od chatbota, ktory odpowiada na pytania, agent wykonuje dzialania: odczytuje dokument, ocenia jego zawartosc, podejmuje decyzje i uruchamia akcje w systemie docelowym.
Agenci AI w kontekscie korporacyjnym nie dzialaja dowolnie. Operuja w ramach zdefiniowanych granic: zestawow regul, zakresow obowiazywania, progow pewnosci, regul eskalacji. Kazda decyzja agenta jest przejrzysta i audytowalna.
Podstawa agenta AI jest model jezykowy - Claude, ChatGPT, Gemini, Llama, Mistral, DeepSeek lub gpt-oss. Model dostarcza rozumienie jezyka. Agent dostarcza logike biznesowa, integracje systemowa i governance.
Rozgraniczenie: Agent AI vs. chatbot vs. RPA
Te trzy koncepcje sa czesto mylone. Rozwiazuja rozne problemy.
Chatbot: Chatbot odpowiada na pytania w jezyku naturalnym. Nie ma zdolnosci do dzialania. Gdy pracownik pyta “Ile dni urlopu mi jeszcze zostalo?”, chatbot odpowiada. Nie rezerwuje urlopu, nie sprawdza regul, nie tworzy Audit Trail.
RPA (Robotic Process Automation): RPA automatyzuje powtarzalne zadania oparte na regulach poprzez interfejsy uzytkownika. Bot RPA klika przez SAP, kopiuje dane z A do B, wypelnia formularze. RPA nie rozumie jezyka. Gdy formularz sie zmienia, bot przestaje dzialac.
Agent AI: Agent AI rozumie kontekst, interpretuje nieustrukturyzowane dane i podejmuje decyzje. Odczytuje fakture - niezaleznie od formatu - rozumie jej zawartosc, stosuje zestawy regul i generuje propozycje ksiegowania. Gdy format faktury sie zmienia, agent dziala dalej, bo rozumie tresc, a nie rozpoznaje uklad strony.
| Wlasciwosc | Chatbot | RPA | Agent AI |
|---|---|---|---|
| Rozumienie jezyka | Tak | Nie | Tak |
| Zdolnosc do dzialania | Nie | Tak (oparta na regulach) | Tak (oparta na kontekscie) |
| Nieustrukturyzowane dane | Tak | Nie | Tak |
| Governance/Audyt | Nie | Czesciowo | Tak (przez Decision Layer) |
| Integracja systemowa | Powierzchowna | Przez UI | Przez API/Integration Layer |
| Adaptacja do zmian | Zmiana promptu | Przeprogramowanie bota | Agent uczy sie kontekstu |
Trzy typy agentow AI w organizacji
W architekturze Gosign wyrozniamy trzy typy agentow. Kazdy typ ma zdefiniowany zakres zadan i operuje w granicach, ktore wyznacza Decision Layer.
Document Agents
Document Agents odczytuja, rozumieja i przetwarzaja dokumenty. Faktury, zwolnienia lekarskie, umowy, zaswiadczenia, dowody ksiegowe, korekty.
Kluczowa roznica wobec OCR lub rozpoznawania szablonow: Document Agents maja prawdziwe rozumienie jezyka. Nie rozpoznaja pol na okreslonych pozycjach strony, lecz rozumieja tresc dokumentu. Faktura w formacie PDF, jako zeskanowany obraz lub jako zalacznik e-mail - Document Agent rozumie wszystkie trzy.
Document Agent do przetwarzania dokumentow ksiegowych odczytuje fakture przychodzaca i wyodrebnia: wystawce, kwote, opis uslugi, date, stawke podatkowa, dane bankowe. Generuje ustrukturyzowany zestaw danych, ktory przekazywany jest do Decision Layer.
Document Agents nie dzialaja w izolacji. Sa punktem wejsciowym workflow - po odczytaniu dokumentu przejmuje Workflow Agent.
Workflow Agents
Workflow Agents orkiestruja procesy miedzy systemami. Koordynuja przebieg miedzy Document Agent, Decision Layer i systemem docelowym.
Workflow Agent do przetwarzania faktur koordynuje: Document Agent odczytuje fakture -> Decision Layer sprawdza propozycje ksiegowania -> przy wysokiej pewnosci ksiegowanie trafia do systemu docelowego -> przy niskiej pewnosci eskalacja do referenta -> po zatwierdzeniu ksiegowanie jest finalizowane -> caly proces jest dokumentowany w Audit Trail.
Workflow Agents obsluguja takze wyjatki: Co sie dzieje, gdy system docelowy jest niedostepny? Co sie dzieje przy timeout? Co sie dzieje, gdy referent nie reaguje? Workflow Agent ma reguly eskalacji, mechanizmy ponownych prob i logike timeout.
Orkiestracja workflow odbywa sie przez n8n lub Camunda - w zaleznosci od zlozonosci i wymagan compliance klienta. Workflow sa wizualizowane, wersjonowane i mozliwe do dostosowania bez programowania.
Knowledge Agents
Knowledge Agents dostarczaja odpowiedzi oparte na kontekscie z wiedzy firmowej. Porozumienia zakladowe, regulaminy, uklady zbiorowe, reguly compliance, wewnetrzne polityki.
Roznica wobec funkcji wyszukiwania: Knowledge Agent rozumie pytanie, szuka w odpowiednim kontekscie i dostarcza odpowiedz ze zrodlem i wersja regulaminu. Gdy referent pyta “Czy dodatek za prace nocna obowiazuje rowniez dla pracownikow na pol etatu w regionie zachodnim?”, Knowledge Agent dostarcza odpowiedz z odwolaniem do obowiazujacego porozumienia zakladowego w aktualnej wersji.
Knowledge Agents wykorzystuja RAG (Retrieval Augmented Generation): Wiedza firmowa jest indeksowana w wektorowej bazie danych. Agent wyszukuje odpowiednie fragmenty i generuje odpowiedz na podstawie tych zrodel - nie na podstawie swojego treningu.
Kazda odpowiedz zawiera: zrodlo, wersje regulaminu, date obowiazywania. Zadnych halucynacji, zadnych zmyslonych odniesien do regulaminow.
Jak agenci AI wspoldzialaja w architekturze korporacyjnej
Trzy typy agentow nie dzialaja w izolacji. W typowej implementacji korporacyjnej Workflow Agent orkiestruje caly proces i deleguje do wyspecjalizowanych Document i Knowledge Agents.
Przyklad z obslugi kadrowej: Wplywa zwolnienie lekarskie (e-mail z zalacznikiem PDF). Document Agent odczytuje zwolnienie i wyodrebnia: pracownika, okres, zaswiadczenie lekarskie, zaswiadczenie kontynuacyjne. Knowledge Agent sprawdza: Jakie reguly obowiazuja dla tego pracownika? Uklad zbiorowy, porozumienie zakladowe, indywidualne uzgodnienia dodatkowe. Decision Layer ocenia: Czy kontynuacja wynagrodzenia jest prawidlowo obliczona? Czy terminy sie zgadzaja? Workflow Agent koordynuje caly przebieg i zapewnia aktualizacje wszystkich systemow.
Kazdy agent ma swoj zdefiniowany zakres zadan. Zaden agent nie “decyduje” samodzielnie o krytycznych procesach biznesowych. Decision Layer znajduje sie miedzy agentem a systemem docelowym i zapewnia governance.
Agnostycznosc modelowa: Agent to nie model
Czeste nieporozumienie: Agent to nie model jezykowy. Model (Claude, ChatGPT, Llama) dostarcza rozumienie jezyka. Agent dostarcza logike biznesowa, integracje systemowa, governance.
W architekturze Gosign warstwa modelowa jest wymienna. Gdy pojawia sie nowy model - wydajniejszy, tanszy, z lepsza licencja - moze zostac zintegrowany bez zmian w warstwach wyzszych. Logika biznesowa w Decision Layer, workflow, zestawy regul pozostaja niezmienione.
Agent moze tez korzystac z wielu modeli: Tanszy model open-source do wstepnej klasyfikacji i wydajniejszy model do zlozonych decyzji. Routing miedzy modelami jest konfigurowalny.
Ta agnostycznosc modelowa zapobiega uzaleznieniu od dostawcy (vendor lock-in). Zadna firma nie jest uzalezniona od jednego dostawcy modeli.
Wymagania dla agentow AI w organizacjach
Agenci AI w srodowiskach korporacyjnych wymagaja wiecej niz modelu jezykowego:
Governance: Kazda decyzja agenta musi byc przejrzysta i audytowalna. Decision Layer to zapewnia.
Integracja: Agenci musza byc zintegrowani z istniejacymi systemami - SAP, Comarch, Workday, SuccessFactors, SharePoint. Integration Layer oddziela logike agenta od systemu docelowego.
Infrastruktura: Agenci wymagaja srodowiska uruchomieniowego: hosting LLM, wektorowe bazy danych dla RAG, silnik workflow, API Gateway. Ta infrastruktura moze dzialac w chmurze, self-hosted lub hybrydowo.
Wspoldzialanie z pracownikami: W Polsce Rada Zakladowa lub przedstawiciele pracownikow maja prawo do informacji i konsultacji przy wdrazaniu systemow AI. Architektura musi to uwzgledniac od poczatku.
Wiecej na ten temat: AI Agents - szczegoly
Umow spotkanie - Pokazemy, ktory typ agenta pasuje do Twojego procesu.