Przejdź do treści
Infrastruktura & Technologia

Kiedy Mistral, kiedy Claude Opus? Routing decyzji dla agentów AI w polskim enterprise 2026

Rozłożone decyzje agentów: Mistral Small na on-prem w UE wykonuje 70 procent. Claude Opus zostaje dla 10 procent z prawdziwym ciężarem rozumowania. Akta decyzyjne gotowe zgodnie z EU AI Act art. 13.

Bert Gogolin
Bert Gogolin
CEO i założyciel 13 min czytania

Rynek modeli dojrzał szybciej niż większość architektur enterprise. Claude Opus 4.7, GPT-5.5 i Gemini 3.1 Pro zbiegają się jakościowo. Mistral La Plateforme działa z francuskiego centrum danych pod jurysdykcją UE. OpenAI w sierpniu 2025 wypuściło gpt-oss na licencji Apache 2.0. Meta i Mistral dostarczają modele open-weight, które działają na jednym GPU i osiągają jakość produkcyjną.

A mimo to większość polskich projektów AI nadal wybiera jeden model i kieruje przez niego każde obciążenie. Ta decyzja po cichu określa trzy kolejne rzeczy: pozycję suwerenności chmury, koszt audytu zgodnie z EU AI Act i przestrzeń na optymalizację kosztów. Wybór modelu nie jest decyzją modelową. To decyzja architektoniczna.

W skrócie - Stack agentów AI dla polskiego enterprise 2026

  • Około 70 procent decyzji agenta w dobrze rozłożonym procesie enterprise to stosowanie reguł albo ekstrakcja strukturalna. W typowym setupie hostingowym w UE Mistral Small 3.2 na pojedynczym GPU obsługuje je za mniej więcej 1/30 ceny listowej Claude Opus.
  • Mistral ma dwie odrębne powierzchnie wdrożeniowe: La Plateforme (API hostowane w UE, infrastruktura francuska, własne centrum danych Bruyères-le-Châtel od II kw. 2026) i Mistral Small 3.2 (Apache 2.0, w pełni self-hosted, 24 mld parametrów).
  • Pozostałe 8-10 procent decyzji - złożone rozumowanie, analiza wielojurysdykcyjna, eskalacja przypadków granicznych - uzasadnia użycie Claude Opus 4.7 lub GPT-5.5. To tam token spend jest zarobiony, a nie zmarnowany.
  • Ekspozycja na US CLOUD Act obejmuje również wdrożenia US-providerów w regionach UE. Schrems II + CLOUD Act sprawiają, że self-hosting jest najczystszą opcją pod kątem ekspozycji na obcego providera. Alternatywnie SCC (Klauzule Standardowe Komisji 2021/914) + Tabela Suplementarna (Transfer Impact Assessment zgodnie z Zaleceniami EDPB 01/2020) pozostają prawnie ważną ścieżką, wymagają jednak rygorystycznej oceny równoważności ochrony i dodatkowych środków technicznych. Self-hosted Mistral Small, gpt-oss-120b albo DeepSeek V4-Flash (preview kwiecień 2026, MIT, 284B/13B aktywnych MoE) to architektury z zerową powierzchnią CLOUD Act.
  • Zgodnie z EU AI Act art. 13 systemy wysokiego ryzyka muszą działać przejrzyście. Warstwa routingu decyzji produkuje artefakt audytowy: rekord per decyzja z wejściem, wersją reguły, modelem, pewnością i osobą zatwierdzającą tam, gdzie eskalowano.

Oceniasz Mistral - to, co faktycznie oceniasz, to twoja strategia chmurowa w UE

Typowy ślad poszukiwań w 2026 wygląda tak. Compliance prosi o europejską alternatywę dla OpenAI. Zakupy zbierają oferty dostawców. Architektura zaczyna oceniać Mistral. W ciągu tygodnia rozmowa przesuwa się z “który model” na “jaka jest nasza pozycja wobec ekspozycji na US CLOUD Act” i “jak operacjonalizujemy art. 13 EU AI Act dla systemów wysokiego ryzyka zgodnie z wymogami przejrzystości”.

CLOUD Act podąża za kontrolą providera, nie za lokalizacją danych. US-provider z centrami danych w UE - Azure OpenAI EU, AWS Bedrock Frankfurt, GCP Vertex europe-west - nadal może zostać zmuszony do wydania danych na podstawie amerykańskiego nakazu. Komisja Europejska ma w II kwartale 2026 wydać Tech Sovereignty Package, który ograniczy stosowanie US-providerów w sektorze publicznym dla wrażliwych obciążeń w ochronie zdrowia, finansach i sądownictwie. Zakupy w sektorze prywatnym czytają te sygnały.

Mistral jest interesujący nie dlatego, że pokonuje Claude w rankingu. Jest interesujący, ponieważ zajmuje pozycję, której żaden US-provider nie może zająć: frontowy provider europejski z dedykowaną infrastrukturą w UE i w pełni open-weight linią modeli pod Apache 2.0. Od II kwartału 2026 firma prowadzi własne centrum danych pod Paryżem z 13 800 procesorami NVIDIA GB300 i mocą 44 megawatów. Czyni to Mistral jedynym frontowym dostawcą, który może zaoferować pełną rezydencję w UE na infrastrukturze pod jurysdykcją UE.

Ale to źle stawia pytanie. Prawdziwe pytanie nie brzmi “Mistral czy OpenAI”. Brzmi “które decyzje idą gdzie i jak to udowodnisz audytorowi”.

Mistral to dwa światy: La Plateforme we Francji albo Mistral Small na Apache 2.0

Zamieszanie zaczyna się od traktowania “Mistral” jako jednego produktu. To dwie rodziny produktów z różnymi powierzchniami wdrożenia i różnymi implikacjami compliance.

Produkt MistralWdrożenieLicencja / kosztSuwerenny UE
Mistral Medium 3.1La Plateforme (API hostowane we Francji) lub Azure AI FoundryToken-based, własnościowyTak przez La Plateforme
Mistral Small 3.2Self-hosted on-premApache 2.0, tylko koszt GPUTak przy sprzęcie w UE
Mixtral 8x22BSelf-hosted on-premApache 2.0, tylko koszt GPUTak przy sprzęcie w UE
CodestralLa PlateformeToken-based, własnościowyTak przez La Plateforme

“Suwerenny UE” oznacza: poza zasięgiem US CLOUD Act. Zarówno La Plateforme (jurysdykcja francuska) jak i self-hosted na sprzęcie w UE spełniają ten warunek. Azure AI Foundry nie, nawet z rezydencją danych w UE, ponieważ Microsoft pozostaje podmiotem podlegającym nakazom CLOUD Act.

Mistral Medium 3.1 to własnościowy flagowiec klasy frontowej. Działa na własnej francuskiej infrastrukturze Mistral, dostępny przez API. Rozliczany tokenowo. Domyślnie suwerenny w UE. Od II kwartału 2026 dedykowane centrum Bruyères-le-Châtel obsługuje inferencję dla klientów wymagających gwarantowanej rezydencji we Francji.

Mistral Small 3.2 to koń roboczy open-weight. 24 miliardy parametrów. Kontekst 128K tokenów. Rozumienie wizualne wbudowane. Wydany w czerwcu 2025 jako aktualizacja 3.1, na licencji Apache 2.0. Działa na pojedynczym NVIDIA RTX 4090 albo Macu z 32 GB RAM. Przepustowość około 150 tokenów na sekundę na sprzęcie konsumenckim.

Te dwa nie są redundantne. La Plateforme ma sens, gdy chcesz suwerenności UE bez prowadzenia infrastruktury GPU. Mistral Small 3.2 ma sens, gdy decyzja jest tak wysokowolumenowa, że rozliczenie tokenowe staje się sterownikiem kosztu, albo gdy dane są tak wrażliwe, że nawet ruch API w UE to za duża powierzchnia.

Pytanie architektoniczne brzmi: która powierzchnia wdrożeniowa dla której decyzji, nie który dostawca dla którego rankingu.

Porównanie profili modeli na sześciu wymiarach enterprise (maj 2026) Spider-chart porównanie czterech reprezentatywnych modeli na sześciu wymiarach enterprise, każdy w skali 0 do 10. Claude Opus 4.7 (chmura, Anthropic): Rozumowanie 10, Kodowanie 10, Multimodalność 7, Efektywność kosztowa 3, Latencja 6, Suwerenność UE 4. GPT-5.5 (chmura, OpenAI/Azure): Rozumowanie 10, Kodowanie 10, Multimodalność 9, Efektywność 3, Latencja 7, Suwerenność 4. Mistral Small 3.2 (self-host, Apache 2.0): Rozumowanie 6, Kodowanie 7, Multimodalność 8, Efektywność 10, Latencja 9, Suwerenność 10. DeepSeek V4-Pro (self-host, MIT): Rozumowanie 9, Kodowanie 8, Multimodalność 5, Efektywność 7, Latencja 7, Suwerenność 9. Flagowce chmurowe dominują w Rozumowaniu, Kodowaniu i Multimodalności, ale tracą przy Efektywności kosztowej i Suwerenności. Modele self-host odwracają ten kształt. Warstwa decision-routingu łączy oba kształty per mikro-decyzja zamiast wybierać jednego mistrza. 108642 Rozumowanie Kodowanie Multimodalność Efektywność kosztowa Latencja inferencji Suwerenność UE Claude Opus 4.7chmura, Anthropic GPT-5.5chmura, OpenAI/Azure Mistral Small 3.2self-host, Apache 2.0 DeepSeek V4-Proself-host, MIT
Profil modelu na sześciu wymiarach enterprise - widok porównawczy w stylu c't, w skali 0 do 10. Flagowce chmurowe (Claude Opus 4.7, GPT-5.5) dominują w Rozumowaniu, Kodowaniu, Multimodalności, ale tracą przy Efektywności kosztowej i Suwerenności UE. Modele self-host (Mistral Small 3.2, DeepSeek V4-Pro) odwracają ten kształt. Nie istnieje "najlepszy" model - warstwa routingu wybiera właściwy kształt per mikro-decyzja.

Dlaczego Mistral Small jako domyślny, a nie gpt-oss czy DeepSeek

Słuszne pytanie, kiedy decydujesz się na self-hosting: dlaczego Mistral Small 3.2 wygrywa rolę konia roboczego nad gpt-oss-120b (Apache 2.0, 117B parametrów MoE, 5 sierpnia 2025) lub DeepSeek V4 (MIT, preview z 24 kwietnia 2026; V4-Flash 284B/13B aktywnych, V4-Pro 1.6T/49B aktywnych, kontekst 1M)? Wszystkie trzy są legalnie self-hostowalne w jakiejś konfiguracji. Różnicują się progiem sprzętowym, pokryciem językowym i modalnością.

Model open-sourceSprzęt CAPEX / OPEX hostowanyMocna stronaSłabośćIdealne zastosowanie
Mistral Small 3.2 (24B, Apache 2.0)1x RTX 4090 ~1 500 EUR (kwantyzacja) lub 1x H100 80GB ~30k EUR / OPEX ~1 500-2 500 EUR/miesiąc hostowanyVolume, wielojęzyczność (PL/DE/EN/ES/BR), zdolność wizualna, ~150 tok/sNie najwyższa półka rozumowaniaDomyślny koń roboczy dla 70 procent wolumenu
gpt-oss-120b (117B MoE, Apache 2.0)1x H100/A100 80GB ~30k EUR / OPEX ~1 200-2 500 EUR/miesiąc hostowanyRozumowanie na poziomie o4-mini, MoE-efektywnyBrak wizji, sprzęt klasy data centerAlternatywa dla Claude Opus przy ciężkim rozumowaniu, gdy nawet to musi pozostać on-prem
DeepSeek V4-Flash (MIT, preview kwiecień 2026)1-4x H100 ~30-120k EUR / OPEX ~1 500-5 000 EUR/miesiąc hostowanyRozumowanie klasy frontowej przy umiarkowanym sprzęcie, kontekst 1M, natywny multimodalStatus preview - benchmarki należy potwierdzić przed produkcjąSpecjalista matematyka/logika + analiza portfeli z kontekstem 1M
DeepSeek V4-Pro (MIT, preview kwiecień 2026)8x H100 ~240 000 EUR CAPEX / OPEX ~10-12k EUR/miesiąc hostowanyZbliża się do wydajności GPT-5.5/Gemini 3.1 Pro, zoptymalizowany pod agentówPróg sprzętowy realny dla dużych korporacji; MSP via API/hostedFrontowe rozumowanie pod otwartą licencją - korporacje on-prem, MSP via API
DeepSeek R1 (MIT, dojrzały)4-8x H100 ~120-240k EUR / OPEX ~5-10k EUR/miesiąc hostowanySpecjalista matematyka/logika, szerokie wsparcie frameworkówZastąpiony przez V4-Flash w nowych wdrożeniachMature mathematics/logic workloads, sustained reasoning at scale
Llama 4 Scout (Meta Llama License)1x H100 ~30k EUR / OPEX ~1 500 EUR/miesiąc hostowanyKontekst 10M tokenówOgraniczenie licencyjne przy >700M MAUUltra-długi kontekst dla całych portfeli kontraktów

Trzy konkretne powody, dla których Mistral Small zdobywa rolę domyślną:

Próg sprzętowy. Mistral Small działa na sprzęcie konsumenckim. gpt-oss-120b wymaga GPU klasy data center. Dla pipeline enterprise z pięcioma do dziesięciu worker node’ami różnica per-node sprzętowa jest znacząca. Gdy 70 procent decyzji to klasyfikacja albo ekstrakcja, moc rozumowania klasy gpt-oss jest przerostem do wolumenu.

Wielojęzyczny korpus treningowy. Mistral od początku był trenowany na danych francuskich, niemieckich, hiszpańskich i włoskich. gpt-oss jest US-centric z dominacją angielskiego w treningu. Dla pipeline polskiego enterprise przetwarzającego dokumenty po polsku, niemiecku, hiszpańsku czy portugalsku Mistral Small jest lepszym koniem roboczym od pierwszego dnia.

Wizja w zestawie. Mistral Small 3.2 ma natywną zdolność wizualną. gpt-oss nie. Dla onboardingu HR (skany dowodów, certyfikaty, formularze podatkowe) albo AP (faktury PDF z layoutem) to twardy nokaut.

gpt-oss-120b albo DeepSeek V4-Flash wchodzą do stacku jako on-prem opcje ciężkiego rozumowania, gdy Claude Opus 4.7 API nie może być użyty z powodów compliance. DeepSeek V4-Pro zbliża się do wydajności zamkniętych modeli frontowych pod otwartą licencją MIT - waga modelu jest swobodnie dostępna na Hugging Face. Pytanie nie brzmi “czy licencja pozwala”, tylko “czy rozmiar przedsiębiorstwa uzasadnia 240 000 EUR CAPEX (8x H100) plus 10-12 000 EUR OPEX miesięcznie”. Dla korporacji WIG20, gospodarki regulowanej i większych Mittelstand (>2000 prac.) ten próg mieści się w standardowym budżecie infrastruktury IT - V4-Pro on-prem jest realny i atrakcyjny pod kątem suwerenności. Dla MSP poniżej 500 pracowników racjonalna ścieżka prowadzi przez API albo hostowane warianty (Together.ai, Fireworks, DeepSeek API) - ta sama jakość rozumowania bez CAPEX. Żaden z tych modeli nie zastępuje Mistral Small jako konia roboczego volumenowego - uzupełniają go dla trudniejszych decyzji. Szczegółowe porównanie self-hosted opisuje Open Source AI na własnym hostingu 2026: Mistral, gpt-oss, DeepSeek V4, Llama 4 w stacku enterprise (osobny artykuł).

Który model do czego? Rozkład złożoności decyzji agenta

Typowy agent enterprise rozkłada się na 14 do 50 mikro-decyzji. Złożoność nie jest rozłożona równo. W dobrze oprzyrządowanym pipeline HR albo finansowym wygląda to tak:

Typ decyzjiUdział decyzjiZłożonośćNajlepszy modelRealny koszt na 1M tokenów
Stosowanie reguł (klasa podatkowa z danych podstawowych, klasyfikacja typu umowy, sprawdzenie progów)50%NiskaCzęsto bez LLM; w innym razie Mistral Small 3.2, Llama 4 Scout, gpt-oss-20b~0 do ~0,50 USD
Ekstrakcja strukturalna (pola z PDF, normalizacja tabel, pozycje z OCR)25%ŚredniaMistral Small 3.2, Mistral Medium 3.1, gpt-oss-120b~0,50 do ~2 USD
Klasyfikacja kontekstowa (analiza klauzul pod kątem prawa pracy, wykrywanie anomalii w raportach kosztów, flagowanie ryzyka dostawcy)15%Średnio-wysokaMistral Medium 3.1, Claude Haiku 4.5, GPT-5 mini~1 do ~5 USD
Złożone rozumowanie (analiza antydyskryminacyjna międzykrajowa, wieloetapowa synteza argumentu, redakcja eskalacji)8%WysokaClaude Opus 4.7, GPT-5.5~15 do ~25 USD
Multimodal (korelacja obraz plus tekst, segmenty wideo, przegląd rysunku technicznego)2%WysokaGemini 3.1 Pro~5 do ~10 USD

Implikacja jest prosta. Jeśli kierujesz każdą decyzję przez Claude Opus, płacisz stawki flagowe za 75 procent pracy, która nie potrzebuje flagowego rozumowania. Jeśli kierujesz wszystko przez Mistral Small, oszczędzasz koszt tokenów, ale poniesiesz porażkę na tych 8 procentach, gdzie rozumowanie klasy Opus naprawdę ma znaczenie - i zapłacisz za to ustaleniami audytora, nie tokenami.

Stanford HAI 2025 AI Index odnotowuje, że 65,7 procent nowo wydanych modeli bazowych w 2023 było open-source, w porównaniu z 33,3 procent w 2021. Adopcja AI w przedsiębiorstwach przekroczyła 78 procent. Rynek już nie wybiera między własnościowym a otwartym. Wybiera, jak je komponować.

Mistral Small jako koń roboczy: agent onboardingu HR z 14 mikro-decyzjami

Konkretny przykład. Agent onboardingu HR przyjmuje podpisaną umowę nowego pracownika plus dokumenty wspierające (skan dowodu osobistego, oświadczenie PIT-2, dane do przelewu, certyfikaty kwalifikacji). Jego zadanie: utworzyć kartotekę pracownika, przeprowadzić sprawdzenia compliance pre-employment, zaplanować onboarding, zarejestrować ZUS ZUA. Czternaście mikro-decyzji łącznie, od walidacji regex po analizę antydyskryminacyjną zgodnie z Kodeksem Pracy art. 18(3a).

Naiwna implementacja wysyła każdy krok do Claude Opus 4.7. Implementacja rozłożona kieruje per krok. Decision Layer trzyma reguły routingu: każdy krok jest klasyfikowany jako REGUŁY, SI AUTONOMICZNE albo CZŁOWIEK przed wykonaniem.

REGUŁY: Decyzja jest deterministyczna. Format numeru PESEL podlega regule sumy kontrolnej, IBAN podlega ISO 13616. Bez interpretacji, bez modelu. Tu agent jest wykonawcą, nie rozumującym.

SI AUTONOMICZNE: Decyzja jest klasyfikacją albo ekstrakcją z wystarczającą pewnością. Wykrycie typu dokumentu, klasyfikacja typu umowy, ekstrakcja pól strukturalnych. Mały model z czystym schematem pokonuje flagowca z mglistym promptem.

CZŁOWIEK: Decyzja dotyka swobody uznania, ryzyka dyskryminacji, zakresu konsultacji rady pracowników albo przekroczenia progów. Analiza zgodnie z Kodeksem Pracy art. 18(3a) ff., zakres informowania rady pracowników, anomalia wynagrodzenia powyżej uzgodnionego limitu. Model przygotowuje sprawę; człowiek podpisuje decyzję.

Poniższe osiem kroków to reprezentatywny wzorzec routingu z typowego pipeline 14-krokowego. Pełna tabela reguł routingu dla 14 kroków żyje w konfiguracji Decision Layer klienta.

KrokDecyzjaWarstwaCel routingu
1Wykryj typy dokumentów w uploadSI AUTONOMICZNEMistral Small 3.2 on-prem
2Wyciągnij dane osobowe (imię, adres, data urodzenia, NIP/PESEL)SI AUTONOMICZNEMistral Small 3.2 on-prem
3Waliduj format PESEL i IBAN (PL ISO 13616)REGUŁYSilnik reguł, bez LLM
4Klasyfikuj typ umowy (czas określony, nieokreślony, próbny - zgodnie z Kodeksem Pracy art. 25 ff.)SI AUTONOMICZNEMistral Small 3.2
5Sprawdź klauzule umowy względem ramy rady pracowników v2024-3SI AUTONOMICZNEMistral Medium 3.1 (La Plateforme)
6Oflaguj klauzule potencjalnie dyskryminacyjne (zgodnie z Kodeksem Pracy art. 18(3a)-(3e))CZŁOWIEK (przygotowane przez AI)Claude Opus 4.7 przygotowuje analizę, Specjalista HR podpisuje
7Wykryj anomalie płacowe względem roli, lokalizacji, stażuSI AUTONOMICZNEMistral Medium 3.1
8Zdecyduj, czy informowanie rady pracowników jest wymagane (zgodnie z Ustawą o radach pracowników, art. 13-15)CZŁOWIEK (przygotowane przez AI)Mistral Medium 3.1 wstępnie klasyfikuje, łącznik rady pracowników podpisuje

Z pełnych 14 kroków sześć to REGUŁY (bez LLM: sprawdzenie IBAN, kompletność dokumentów, zgłoszenie ZUS ZUA, NFZ-OW, deterministyczne pliki rejestracyjne). Sześć to SI AUTONOMICZNE (Mistral Small albo Medium). Dwa to CZŁOWIEK z przygotowaniem AI (Claude Opus dla pytania o dyskryminację, Mistral Medium dla wstępnej klasyfikacji informowania rady pracowników).

W typowym setupie hostingowym w UE ten rozkład przekłada się na około 1 do 3 USD na onboarding na inferencji. Architektura wyłącznie flagowa (każdy krok przez Claude Opus) ląduje bliżej 25 do 40 USD na onboarding - i przetwarza krok 1 i 2 na infrastrukturze USA pod ekspozycją CLOUD Act. Ten sam efekt biznesowy. Inny audit trail. Inna krzywa kosztu. Inna pozycja suwerenności.

Co widzi audytor: akta decyzyjne zgodnie z EU AI Act art. 13

EU AI Act art. 13 wymaga, by systemy AI wysokiego ryzyka działały na tyle przejrzyście, by użytkownicy mogli interpretować wyniki i używać ich właściwie. System musi przyjść z instrukcjami określającymi metryki dokładności, odporność, przetestowane poziomy cyberbezpieczeństwa, środki nadzoru człowieka zgodnie z art. 14 oraz wymagane zasoby sprzętowe.

Pytanie audytora w dniu kontroli nie brzmi “którego modelu użyłeś”, tylko “pokaż mi rekord decyzji dla sprawy kadrowej 2026-01-1873, krok 8”.

Akt decyzyjny produkowany przez warstwę routingu zawiera per mikro-decyzję:

  • Snapshot wejścia (istotne pola z kontekstu poprzedzającego, z zastosowaną obsługą PII zgodnie z RODO art. 28)
  • Wersja reguły (która wersja ramy rady pracowników została użyta; v2024-3)
  • Typ decyzji (stosowanie reguły, klasyfikacja AI, rozumowanie AI, akceptacja człowieka)
  • Użyty model (jeśli AI: Mistral-Small-3.2-Instruct-2503, wdrożony na klastrze A04, region eu-de-fra)
  • Ocena pewności (jeśli AI: 0,94)
  • Łańcuch rozumowania (jeśli dotyczy: pośrednie rozumowanie modelu, dosłownie utrwalone)
  • Wynik (etykieta klasyfikacji, wyekstrahowana wartość albo flaga eskalacji)
  • Osoba zatwierdzająca (jeśli eskalowano: imię, rola, znacznik czasu)
  • Przycisk zaskarżenia dla decyzji AI (osoba, której to dotyczy, może zakwestionować automatyczną decyzję, co uruchamia ponowną decyzję pod nadzorem człowieka - mechanizm wymagany przez RODO art. 22)

Pipeline, który produkuje takie rekordy, zamienia pytanie modelowe w pytanie routingowe. Audytor nie pyta “czy Mistral jest tak dobry jak Claude”. Audytor pyta “czy decyzja jest udokumentowana od początku do końca i czy da się ją odtworzyć”. Pytanie zarządu idzie o krok dalej: kto podpisuje decyzję, gdy zgodnie z Kodeksem Pracy art. 18(3a) wymóg został naruszony przez cel routingu, który powinien był eskalować do człowieka? Warstwa routingu czyni ten podpis śledzonym.

Sektor regulowany: KNF, DORA, KSeF, NIS2, URE, UODO

Dla branż regulowanych dyskusja “który model” jest pod-pytaniem do “który regulator nadzoruje twoje wdrożenie AI i jakie artefakty kontroluje”. Cztery sektory dominują w polskim enterprise AI 2026: usługi finansowe (KNF + DORA + EBA), administracja podatkowa (KSeF + EU AI Act Annex III), infrastruktura krytyczna (NIS2 + KSC + URE) oraz ochrona danych horyzontalna (UODO + RODO DPIA).

Dla instytucji finansowych zgodnie z KNF. KNF Rekomendacja D (zarządzanie obszarem IT) wraz z DORA art. 28-30 (zarządzanie ryzykiem zewnętrznym ICT) od 17 stycznia 2025 wymaga rejestru dostawców ICT. EBA Wytyczne o outsourcingu (EBA/GL/2019/02) uzupełniają te wymogi. KSeF (Krajowy System e-Faktur, obowiązkowy od kwietnia 2026) traktuje klasyfikację faktur przez AI jako system wysokiego ryzyka zgodnie z EU AI Act art. 6 Annex III ust. 8 (administracja sprawiedliwości i procesy demokratyczne / podatki). UKNF (Urząd KNF) bezpośrednio nadzoruje banki, ubezpieczycieli, fundusze inwestycyjne i SKOK-i w zakresie tych wymogów.

Dla podmiotów krytycznych zgodnie z NIS2 + Krajowym Systemem Cyberbezpieczeństwa. KSC (transpozycja NIS2 do prawa polskiego) operacjonalizuje obowiązki Critical Entity. URE (Urząd Regulacji Energetyki) nadzoruje użycie AI w sektorze energii. Resolucja URE wymaga 24h/72h raportowania incydentów cybernetycznych. Predictive maintenance, SCADA-AI i grid anomaly detection są workloadami wysokiego ryzyka. Chmura Krajowa (OChK, joint venture PKO + PFR + Google Cloud Polska) oferuje sovereign cloud dla podmiotów publicznych i krytycznej infrastruktury.

Dla IOD i Inspektorów Ochrony Danych. Art. 35 RODO Ocena Skutków dla Ochrony Danych (DPIA) jest obowiązkowa dla systemów AI klasyfikowanych jako wysokiego ryzyka. Art. 11 RODO (dane wrażliwe) dotyczy danych zdrowotnych w ATS admisyjnym. Art. 6 ust. 1 lit. f (legitymny interes) z testem proporcjonalności jako podstawa prawna dla AI bez zgody. Urząd Ochrony Danych Osobowych (UODO) jest bezpośrednim regulatorem RODO w PL. Inspekcja UODO sprawdza: politykę prywatności, mapowane podstawy prawne, RIPD (Rejestr Czynności Przetwarzania, art. 30 RODO), wyznaczonego IOD, plan reakcji na incydent (art. 33 ust. 1 + art. 34 RODO).

Dla branży farmaceutycznej. GMP Annex 11 + Eudralex Vol. 4 dla walidacji systemów IT z AI. URPL (Urząd Rejestracji Produktów Leczniczych) guidance na użycie AI w pharmacovigilance. Prawo Farmaceutyczne art. 38a wymaga pseudonimizacji danych pacjentów w Clinical Trial AI Pipelines.

Decyzja routingu modelu wpada w te ramy. Mistral Small 3.2 on-prem na sprzęcie w UE eliminuje pytanie ekspozycji CLOUD Act dla większości wymienionych regulatorów. Claude Opus 4.7 albo GPT-5.5 dla 8-10 procent ciężkiego rozumowania wymaga oddzielnej oceny DPIA i klasyfikacji w rejestrze dostawców ICT zgodnie z DORA art. 28.

Pytanie architektoniczne: Decision Layer albo vendor lock-in

Decision Layer agnostyczny modelowo to nie feature. To warunek wstępny niemal wszystkiego, co opisaliśmy. Bez niego wzorce routingu powyżej pozostają abstrakcją.

Bez Decision LayerZ Decision Layer
Wybór modelu jest lepki. Zmiana dostawcy oznacza ponowną implementację całego agenta.Przełączenie dostawcy to jedna zmiana konfiguracji. Modele są wymienne per krok decyzji.
Optymalizacja kosztu dzieje się ex post, w renegocjacji z jednym dostawcą.Optymalizacja kosztu jest wbudowana: decyzje o niskiej złożoności automatycznie trafiają do najtańszego sensownego modelu.
Suwerenność jest binarna: albo akceptujesz ekspozycję US CLOUD Act, albo self-hostujesz wszystko.Suwerenność jest per decyzja: wrażliwe kroki działają on-prem w UE, niewrażliwe mogą używać API w chmurze.
Audit trail istnieje w rozproszonych logach i jest rekonstruowany na żądanie.Audit trail jest logiem routingu. Zgodność z EU AI Act art. 13 to zapytanie, nie projekt.
Dodanie nowego modelu to nowa integracja.Dodanie nowego modelu to dodanie go do routera. Reguły routingu już istnieją.

Ta tabela pokazuje różnice architektoniczne, nie oceny jakości.

Decision Layer to miejsce, w którym wybór modelu staje się operacyjny. Rynek modeli zmienia się miesięcznie. Ceny spadają. Wypływają nowe flagowce. Open-weight dogania. Architektura Decision Layer wchłania tę zmianę. Architektura związana z dostawcą płaci koszt migracji za każdym razem.

Dla kogo jest Decision Layer w polskim enterprise?

Dyrektor IT / CIO: ocenia oferty Mistral, OpenAI, Anthropic. Ma trzy pitche w tym tygodniu. Wie, że wybór dostawcy to za pięć lat dług architektoniczny. Pyta o exit-strategy, nie o demo.

Compliance Officer / Inspektor Ochrony Danych: ma na biurku ekspozycję na US CLOUD Act, art. 22 i 28 RODO oraz nadchodzący art. 13 EU AI Act. Wie, że obietnice handlowe nie przejdą kontroli UODO ani Prezesa UODO.

Dyrektor HR: po polskim post-merger (PKN ORLEN + Lotos + PGNiG, Allegro + Mall, Bank Pekao + Alior) wie, że trzy systemy IT to trzy ramy compliance. Pyta, czy Decision Layer skaluje się przy fuzji, nie czy ma ładny dashboard.

Rada Pracowników: w polskim enterprise rada nie ma prawa weta jak niemiecki Betriebsrat, ale ma prawo informacji i konsultacji (zgodnie z Ustawą o radach pracowników, art. 13-15). Pyta, jak ramy konsultacji są udokumentowane i jak działa zaskarżenie zgodnie z RODO art. 22.

Hosting w Polsce i UE: Atman, Polcom, Scaleway, OVHcloud

Pytanie suwerenności w polskim kontekście ma dwie warstwy. Pierwsza: lokalizacja danych. Druga: jurysdykcja providera.

Atman (Warszawa). Największy polski operator data center, oferuje colocation oraz GPU-cloud z RTX i A100. Polska jurysdykcja, jasny kontekst RODO. Wybór, gdy zakupy wymagają polskiego operatora.

Polcom (Kraków). Polski operator chmury z naciskiem na sektor regulowany. Dobre dopasowanie pod sektor bankowy i ubezpieczeniowy z wymogami KNF Rekomendacja D i DORA.

Chmura Krajowa / OChK (Polska, joint venture PKO + PFR + Google Cloud Polska). Sovereign cloud dla podmiotów publicznych i krytycznej infrastruktury zgodnie z NIS2 + KSC. Preferowany dla zakupów wymagających polskiej jurysdykcji i certyfikacji suwerennej dla Critical Entity Operations.

Scaleway (Francja). H100 SXM za ok. 3,50 EUR/h, A100 za ok. 2,50 EUR/h, pełne RODO. Jurysdykcja francuska, brak ekspozycji CLOUD Act.

OVHcloud (Francja). Największy europejski provider chmury, ze “Sovereign Cloud” dla sektora publicznego i regulowanego. Portfolio: H100, RTX 5000, A10 plus “AI Deploy” do notebooków i inferencji.

Hetzner (Niemcy). Lider cenowy w dedykowanych serwerach GPU. Aktualne opcje GPU obejmują RTX 4000 SFF Ada i RTX 6000 Ada w parze z nowoczesnymi CPU. Ścieżka dla Mistral Small 3.2 z kwantyzacją albo dla środowisk deweloperskich.

T-Systems (Niemcy). Subsidiary Deutsche Telekom. Sovereign cloud jawnie zaprojektowany dla sektora publicznego i krytycznej infrastruktury. Wybór wygodny dla zakupów, gdy zarząd wymaga certyfikacji suwerennej.

Wniosek

Ciekawe pytanie dla CTO polskiego enterprise w 2026 nie brzmi “Mistral czy OpenAI”. Brzmi “jaki procent moich decyzji agenta wymaga flagowego rozumowania i jak udowodnię to audytorowi”.

W dobrze rozłożonym agencie Mistral Small 3.2 na jednym GPU w UE wykonuje większość pracy za znikomy koszt per token. Mistral Medium 3.1 na La Plateforme obsługuje pas środkowy z zachowaną suwerennością UE. Claude Opus 4.7 albo GPT-5.5 obsługują naprawdę trudne przypadki. Routing jest architekturą. Audit trail jest artefaktem compliance. Decision Layer jest miejscem, w którym to wszystko jest doprecyzowane.

Inni publikują tabele porównawcze modeli. My budujemy warstwę routingu, która je operacjonalizuje. Rynek modeli zmienia się miesięcznie; architektura routingu przetrwa pięć generacji modeli. Kod źródłowy zostaje u klienta. Modele pozostają wymienne. Zgodność z EU AI Act art. 13 jest właściwością architektury, nie projektem na końcu.

Jeśli chcesz wiedzieć, jak naprawdę wygląda rozkład złożoności twojego agenta, umów konsultację.

Bert Gogolin

Bert Gogolin

Dyrektor Generalny, Gosign

AI Governance Briefing

Enterprise AI, regulacje i infrastruktura - raz w miesiącu, bezpośrednio ode mnie.

Bez spamu. Możliwość rezygnacji w każdej chwili. Polityka prywatności

Mistral Claude GPT-5 gpt-oss DeepSeek Decision Layer EU AI Act RODO Suwerenność UE Routing modeli 2026
Udostępnij artykuł

Najczęściej zadawane pytania

Kiedy Mistral ma sens w porównaniu do Claude czy GPT-5?

Mistral jest koniem roboczym dla około 70 procent decyzji agentów, jeśli proces zostanie poprawnie rozłożony: stosowanie reguł, ekstrakcja strukturalna, klasyfikacja. Claude Opus 4.7 albo GPT-5.5 zostają dla 8-10 procent z prawdziwym ciężarem rozumowania. Pytanie nie brzmi 'który model jest najlepszy', tylko 'który model do której mikro-decyzji'.

Czy Mistral naprawdę spełnia wymóg suwerenności w UE?

Mistral La Plateforme jest domyślnie hostowany w UE na francuskiej infrastrukturze. Od II kwartału 2026 firma uruchamia własne centrum danych w Bruyères-le-Châtel pod Paryżem z 13 800 procesorami NVIDIA GB300 i mocą 44 megawatów. Mistral Small 3.2 z licencją Apache 2.0 działa w pełni na własnej infrastrukturze już na pojedynczym RTX 4090. Oba warianty pozostają poza zasięgiem US CLOUD Act, w przeciwieństwie do Azure OpenAI EU.

Czym jest gpt-oss i czym różni się od Mistral?

gpt-oss-120b to pierwszy model open-weight OpenAI od czasu GPT-2, wydany 5 sierpnia 2025 na licencji Apache 2.0. Osiąga poziom rozumowania o4-mini na jednym GPU 80 GB. W porównaniu do Mistral Small 3.2 (24 mld parametrów, działa na pojedynczym GPU klasy konsumenckiej) gpt-oss-120b celuje w cięższe zadania rozumowania. Oba są realnymi opcjami self-hosting pod kątem suwerenności danych w UE.

Jak routing decyzji spełnia EU AI Act art. 13?

Art. 13 wymaga, by systemy AI wysokiego ryzyka działały przejrzyście, aby użytkownicy potrafili interpretować ich wyniki. Warstwa routingu decyzji wymusza to technicznie: każda decyzja jest rejestrowana z wejściem, wersją reguły, użytym modelem, oceną pewności (jeśli AI), łańcuchem rozumowania (jeśli dotyczy) i osobą zatwierdzającą (jeśli eskalowano). Audit trail jest artefaktem zgodności zgodnie z art. 13.

Jaki proces powinien obsłużyć Twój pierwszy agent?

Zostaw swój email - otrzymasz osobisty link do rezerwacji natychmiast.