“Gdzie to działa?” - Decydujące pytanie
Zanim wybierzesz model, zanim zbudujesz agentów, zanim wdrożysz interfejs, stoi jedno pytanie: Gdzie działają Twoje modele AI? Ta decyzja określa, jakie gwarancje ochrony danych możesz dać, jakie wymagania regulacyjne spełniasz, jak wysokie są Twoje bieżące koszty i jak bardzo uzależniasz się od zewnętrznych dostawców.
W skrócie - Strategia hostingu AI dla enterprise
- Trzy poziomy: EU SaaS (Cloud API), europejskie IaaS (Self-Hosted GPU) i on-premises (własny sprzęt) - plus kombinacja hybrydowa.
- Architektura hybrydowa kieruje zapytania według wrażliwości danych: 60-70% chmura, 25-35% europejskie IaaS, 5-10% on-premises.
- Gartner (2025) szacuje, że 40% dużych firm będzie prowadzić hybrydowe architektury hostingu AI do 2027, w porównaniu z poniżej 10% w 2024.
- Modele open source self-hosted (gpt-oss-120b) działają na jednym GPU za ok. 1200 EUR miesięcznie u europejskich dostawców.
- Całkowite koszty ze strategią hybrydową są o 30-40% niższe niż przy strategii opartej wyłącznie na Cloud API, przy wyższej suwerenności danych.
Istnieją trzy podstawowe strategie - i czwarta, która w praktyce stała się standardem: architektura hybrydowa, która łączy wszystkie trzy.
Poziom 1: EU SaaS - Cloud API z rezydencją danych w UE
Najprostsza i najszybsza opcja: korzystasz z API dostawców modeli bezpośrednio. Claude przez Anthropic API (region UE), GPT-5.5 przez Azure OpenAI (centrum danych UE), Gemini przez Google Cloud Platform (region UE). Dane opuszczają Twoją sieć, ale są przetwarzane w centrach danych UE.
Zalety
Najszybszy start: Bez budowania infrastruktury, bez provisioningu serwerów GPU, bez potrzeby ekspertyzy ML-Ops. Konfiguracja klucza API, podpisanie umowy powierzenia, produktywność w kilka godzin.
Automatyczne aktualizacje: Aktualizacje modeli, łatki bezpieczeństwa i usprawnienia wydajności wdrażane przez dostawcę. Bez własnego nakładu na utrzymanie.
Skalowalność: Bez zarządzania pojemnością. Przy skokach obciążenia dostawca chmury skaluje automatycznie. Bez nadplanowania, bez niedoboru.
Różnorodność modeli: Dostęp do wszystkich wariantów modeli dostawcy - flagowy, cena-jakość i budżetowy - przez to samo API.
Ryzyka i ograniczenia
Dane opuszczają sieć firmową. Nawet przy rezydencji danych w UE Twoje zapytania są przetwarzane na infrastrukturze, której nie kontrolujesz. Dostawca ma techniczny dostęp do danych podczas przetwarzania.
CLOUD Act. Dostawcy amerykańscy - w tym Anthropic, OpenAI i Google - podlegają amerykańskiej ustawie CLOUD Act. W określonych warunkach władze USA mogą żądać dostępu do danych, nawet jeśli są przechowywane w centrach danych UE. Dla większości danych firmowych ryzyko to jest ocenialne i akceptowalne. Dla tajemnic handlowych, danych niejawnych czy informacji dotyczących infrastruktury krytycznej - nie.
Zależność od dostawcy. Przy strategii jednego dostawcy jesteś zależny od polityki cenowej, zmian API i dostępności jednego dostawcy. Architektura model-agnostic (zob. Porównanie modeli AI 2026) redukuje to ryzyko.
Wymagana umowa powierzenia. Do korzystania zgodnego z RODO wymagana jest umowa powierzenia przetwarzania danych z dostawcą. Wszyscy trzej wielcy dostawcy oferują standardowe umowy - zweryfikuj je z działem prawnym. Uwaga: Standardowe umowy powierzenia SaaS nie obejmują tematów specyficznych dla AI, takich jak logowanie promptów, separacja środowisk i łańcuchy dostawców modeli. Nasz katalog wymagań dla umów powierzenia AI identyfikuje dziesięć luk i zawiera 25 pytań weryfikacyjnych.
Odpowiednie dla
- Standardowych zadań z danymi niewrażliwymi: podsumowania, tłumaczenia, ogólne odpowiadanie na pytania
- Proof of Concept i projektów pilotażowych
- Zadań o zmiennym wolumenie, gdzie dedykowana infrastruktura GPU byłaby nieekonomiczna
- Organizacji bez ekspertyzy ML-Ops, które chcą szybko zacząć produkcyjnie
Poziom 2: Europejskie IaaS - hosting GPU u europejskich dostawców
Środkowa opcja: wynajmujesz serwery GPU u europejskiego dostawcy Infrastructure-as-a-Service - np. Hetzner, IONOS lub specjalistycznego dostawcy chmury GPU. Na tych serwerach samodzielnie uruchamiasz modele open source, takie jak gpt-oss, Llama 4 czy Mistral Medium 3.1.
Konkretne wymagania sprzętowe i koszty
| Model | Wymaganie GPU | Szacunkowy koszt/miesiąc |
|---|---|---|
| gpt-oss-120b | 1x A100/H100 (80 GB) | ok. 1200 EUR |
| gpt-oss-20b | CPU/16 GB RAM (lub mały GPU) | ok. 200-400 EUR |
| Llama 4 Scout | 1x A100 (80 GB) | ok. 1200 EUR |
| Llama 4 Maverick | 4x A100 (80 GB) | ok. 3500 EUR |
| Mistral Medium 3.1 | 4x A100 (80 GB) | ok. 3500 EUR |
Zalety
Dane pozostają w Europie. Serwer stoi w europejskim centrum danych, obsługiwany przez europejskiego dostawcę. Bez CLOUD Act, bez transatlantyckiego transferu danych. Dla zgodności z RODO to najbezpieczniejsza opcja chmurowa.
Brak vendor lock-in. Obsługujesz modele open source na licencji Apache 2.0 lub Meta Llama License. Gdy chcesz zmienić dostawcę hostingu, migrujesz model - bez pytań o licencje, bez negocjacji kontraktowych.
Pełna kontrola nad modelem. Decydujesz, który model w jakiej wersji działa. Możesz modele dostrajać, kwantyzować lub zastępować nowszymi wersjami - bez czekania na dostawcę.
Przewidywalne koszty. Serwery GPU mają stałe koszty miesięczne. Bez zmiennych kosztów tokenów, bez niespodzianek przy skokach obciążenia. Dla organizacji z wysokim, stałym wolumenem często bardziej ekonomiczne niż Cloud API.
Wymagania
Kompetencje ML-Ops. Potrzebujesz kogoś, kto wdroży, monitoruje, aktualizuje i interweniuje w razie problemów. Może to być wewnętrzny inżynier ML lub zewnętrzny usługodawca - ale to nie jest zerowy nakład pracy.
Planowanie pojemności. Serwer GPU ma zdefiniowaną pojemność. Jeśli masz 500 równoczesnych zapytań, jeden GPU nie wystarczy. Musisz rozumieć profile obciążenia i planować pojemności.
Brak automatycznych aktualizacji. Gdy pojawia się nowy model, wdrażasz go sam. Gdy wystąpi problem bezpieczeństwa, łatasz sam.
Odpowiednie dla
- Poufnych danych firmowych (poziom wrażliwości 2-3)
- Organizacji, które muszą wyeliminować ryzyko CLOUD Act
- Zastosowań ze stałym, wysokim wolumenem (przewaga kosztowa nad Cloud API)
- Organizacji z istniejącą kompetencją DevOps/ML-Ops
Poziom 3: On-Premises - AI na własnym sprzęcie
Opcja maksymalnej kontroli: obsługujesz serwery GPU we własnym centrum danych lub w kolokacji. Żadne dane nie opuszczają Twojej sieci - pod żadnym warunkiem.
Zalety
Maksymalna suwerenność danych. Brak dostępu zewnętrznego, brak zewnętrznego dostawcy, brak zewnętrznej zależności. Sprzęt należy do Ciebie, model należy do Ciebie, dane nigdy nie opuszczają Twojej sieci.
Pewność regulacyjna. Dla operatorów infrastruktury krytycznej, instytucji państwowych, sektora obronnego i organizacji z danymi niejawnymi on-premises to często jedyna opcja spełniająca wymagania compliance.
Brak bieżących kosztów licencji czy API. Po początkowej inwestycji pozostają tylko koszty prądu, chłodzenia i utrzymania. Przy długookresowej eksploatacji i wysokim wolumenie on-premises może być najtańszą opcją.
Wyzwania
Wysoka inwestycja początkowa. Produkcyjny serwer GPU z NVIDIA H100 (80 GB) kosztuje 25 000-40 000 EUR. Dla bardziej wydajnych setupów (multi-GPU, redundancja) koszty sięgają 60 000-120 000 EUR lub więcej.
Wymagany zespół ML-Ops. On-premises oznacza: jesteś odpowiedzialny za wszystko. Utrzymanie sprzętu, deployment modeli, monitoring, aktualizacje, bezpieczeństwo. To wymaga dedykowanego zespołu lub doświadczonego usługodawcy.
Skalowanie nie jest trywialne. Gdy obciążenie rośnie, nie możesz dodać kolejnego GPU jednym kliknięciem. Zakup sprzętu trwa tygodnie do miesięcy.
Odpowiednie dla
- Operatorów infrastruktury krytycznej i instytucji państwowych
- Danych niejawnych i najwyższych poziomów poufności
- Organizacji z własnym centrum danych i kompetencją ML-Ops
- Długookresowej gotowości inwestycyjnej przy bardzo wysokim wolumenie
Darmowy eBook: Infrastruktura AI
Build, Buy, Hybrid - infrastruktura zgodna z EU AI Act z B/B/H-Framework i 7-Layer Reference Architecture.
Pobierz za darmoDrzewo decyzyjne
Następująca logika decyzyjna pomaga w przypisaniu:
Czy Twoje dane zawieraja PII lub tajemnice handlowe?
+-- NIE -> EU SaaS (Poziom 1)
+-- TAK -> Infrastruktura krytyczna lub dane niejawne?
+-- TAK -> On-Premises (Poziom 3)
+-- NIE -> Europejskie IaaS (Poziom 2) lub Hybrid
W praktyce odpowiedzią rzadko jest jeden poziom. Większość organizacji ma dane o różnej wrażliwości - i dlatego potrzebuje architektury obejmującej wszystkie poziomy.
Hybrid jako standard: Architektura routingu
Strategia hybrydowa łączy wszystkie trzy poziomy w jednej architekturze. Warstwa routingu automatycznie decyduje, które zapytanie przechodzi jakim kanałem - na podstawie wrażliwości danych, nie na podstawie decyzji poszczególnych pracowników.
Jak działa routing
Poziom wrażliwości 1-2 (publiczne, wewnętrzne): Zapytania idą przez Cloud API. Szybko, tanio, skalowalnie. Przykład: podsumowanie publicznego whitepapera, tłumaczenie komunikatu prasowego, szkic ogólnego maila.
Poziom wrażliwości 3 (poufne): Zapytania są kierowane do modeli self-hosted w europejskim centrum danych. Brak wycieku danych, brak CLOUD Act. Przykład: analiza wewnętrznych umów, przetwarzanie danych personalnych, analiza poufnych danych finansowych.
Poziom wrażliwości 4 (ściśle poufne / regulowane): Zapytania przechodzą wyłącznie przez infrastrukturę on-premises. Przykład: dokumenty niejawne, systemy infrastruktury krytycznej, dane pod szczególną ochroną.
Warunek: Klasyfikacja danych
Aby routing działał, organizacja musi sklasyfikować swoje dane. Brzmi to pracochłonnie, ale w wielu organizacjach już istnieje - np. w ramach istniejących Systemów Zarządzania Bezpieczeństwem Informacji (SZBI) lub krajowych ram klasyfikacji bezpieczeństwa. Reguły routingu odwzorowują tę istniejącą klasyfikację na infrastrukturę AI.
Implementacja techniczna
Warstwa routingu siedzi między Enterprise AI Portal (interfejsem, którego używają pracownicy) a endpointami modeli. Składa się z trzech komponentów:
- Klasyfikator: Automatycznie rozpoznaje wrażliwość danych zapytania - na podstawie słów kluczowych, systemu źródłowego lub jawnego oznaczenia przez użytkownika.
- Silnik routingu: Przypisuje zapytanie do odpowiedniego endpointu modelu - Cloud API, europejskie IaaS lub on-premises.
- Audit Log: Rejestruje każdą decyzję routingową - jakie zapytanie, jaki poziom wrażliwości, jaki endpoint. Śledzalne i eksportowalne.
Efekt kosztowy
Architektura hybrydowa optymalizuje nie tylko bezpieczeństwo danych, ale też koszty. Cloud API są tanie za zapytanie, ale zmienne. Modele self-hosted mają koszty stałe, które amortyzują się przy wysokim wolumenie. Połączenie wykorzystuje oba: tanie Cloud API do grosu niekrytycznych zapytań, modele self-hosted z optymalizacją kosztów stałych do wolumenu poufnego.
W praktyce widzimy u organizacji z 1000+ pracownikami typowo następujący rozkład: 60-70% zapytań przechodzi przez Cloud API (poziom 1-2), 25-35% przez europejskie IaaS (poziom 3) i 5-10% przez on-premises (poziom 4). Całkowite koszty są o 30-40% niższe niż przy strategii opartej wyłącznie na Cloud API, przy jednocześnie wyższej suwerenności danych.
Podsumowanie: Trzy poziomy w skrócie
| Kryterium | EU SaaS (Poziom 1) | Europejskie IaaS (Poziom 2) | On-Premises (Poziom 3) |
|---|---|---|---|
| Suwerenność danych | Region UE, umowa powierzenia | Europa, brak CLOUD Act | Maksymalna |
| Koszty początkowe | Brak | Niskie (wynajem) | Wysokie (60-120 tys. EUR+) |
| Koszty bieżące | Zmienne (tokeny) | Stałe (wynajem GPU) | Stałe (prąd, utrzymanie) |
| Nakład ML-Ops | Brak | Średni | Wysoki |
| Skalowalność | Automatyczna | Ręczna | Ręczna, wolna |
| Odpowiednie dla | Dane poziomu 1-2 | Dane poziomu 2-3 | Dane poziomu 3-4 |
Właściwa strategia to prawie zawsze kombinacja. Gosign implementuje warstwę routingu, która łączy wszystkie trzy poziomy - tak że Twoi pracownicy korzystają z jednego interfejsu, a system automatycznie wybiera właściwą ścieżkę.
Dalej: Infrastruktura AI | Decision Layer & Shadow AI
Enterprise AI Infrastructure Blueprint 2026 - Seria artykułów
| Poprzedni | Przegląd | Następny |
|---|---|---|
| Modele AI 2026: Który model do jakiego zastosowania? | Przegląd | Enterprise AI Portal: Cztery interfejsy open source w porównaniu |
Wszystkie artykuły z tej serii: Enterprise AI Infrastructure Blueprint 2026
Chcesz wiedzieć, która strategia hostingu jest odpowiednia dla Twoich danych? Gosign analizuje Twoją klasyfikację danych i projektuje odpowiednią architekturę hybrydową.
Umów rozmowę - W 30 minut wyjaśnimy, jakie poziomy hostingu potrzebujesz.

Bert Gogolin
Dyrektor Generalny, Gosign
AI Governance Briefing
Enterprise AI, regulacje i infrastruktura - raz w miesiącu, bezpośrednio ode mnie.