Czy korzystanie z Cloud API AI jest zgodne z RODO?

Cloud API AI można wykorzystywać zgodnie z RODO, gdy dostawca gwarantuje rezydencję danych w UE i obowiązuje umowa powierzenia przetwarzania danych. Claude (Anthropic), GPT (Azure OpenAI) i Gemini (Google) oferują regiony UE. Dla danych poziomu 3-4 rekomendujemy self-hosting.

Ile kosztuje self-hosting modeli AI?

gpt-oss-120b działa na jednym GPU (80 GB) - ok. 1200 EUR/miesiąc u europejskiego dostawcy hostingu. Większe modele jak Llama 4 Maverick wymagają 4+ GPU, ok. 3500 EUR/miesiąc.

Na czym polega strategia hybrydowa?

Architektura hybrydowa automatycznie kieruje zapytania wg wrażliwości danych: dane publiczne przez Cloud API (szybko, tanio), dane poufne przez modele self-hosted (brak wycieku danych). Warstwa routingu decyduje automatycznie.

Jak polskie firmy powinny podejść do hostingu AI?

Polskie firmy podlegają RODO jako członkowie UE, co oznacza te same wymagania dotyczące rezydencji danych co w całej Unii. Strategia hybrydowa - Cloud API do danych publicznych, self-hosting na serwerach w UE do danych poufnych - łączy zgodność regulacyjną z efektywnością kosztową.

Hosting AI: EU SaaS, centrum danych czy Self-Hosted?

“Gdzie to działa?” - Decydujące pytanie

Zanim wybierzesz model, zanim zbudujesz agentów, zanim wdrożysz interfejs, stoi jedno pytanie: Gdzie działają Twoje modele AI? Ta decyzja określa, jakie gwarancje ochrony danych możesz dać, jakie wymagania regulacyjne spełniasz, jak wysokie są Twoje bieżące koszty i jak bardzo uzależniasz się od zewnętrznych dostawców.

W skrócie - Strategia hostingu AI dla enterprise

Trzy poziomy: EU SaaS (Cloud API), europejskie IaaS (Self-Hosted GPU) i on-premises (własny sprzęt) - plus kombinacja hybrydowa.
Architektura hybrydowa kieruje zapytania według wrażliwości danych: 60-70% chmura, 25-35% europejskie IaaS, 5-10% on-premises.
Gartner (2025) szacuje, że 40% dużych firm będzie prowadzić hybrydowe architektury hostingu AI do 2027, w porównaniu z poniżej 10% w 2024.
Modele open source self-hosted (gpt-oss-120b) działają na jednym GPU za ok. 1200 EUR miesięcznie u europejskich dostawców.
Całkowite koszty ze strategią hybrydową są o 30-40% niższe niż przy strategii opartej wyłącznie na Cloud API, przy wyższej suwerenności danych.

Istnieją trzy podstawowe strategie - i czwarta, która w praktyce stała się standardem: architektura hybrydowa, która łączy wszystkie trzy.

Poziom 1: EU SaaS - Cloud API z rezydencją danych w UE

Najprostsza i najszybsza opcja: korzystasz z API dostawców modeli bezpośrednio. Claude przez Anthropic API (region UE), GPT-5.5 przez Azure OpenAI (centrum danych UE), Gemini przez Google Cloud Platform (region UE). Dane opuszczają Twoją sieć, ale są przetwarzane w centrach danych UE.

Zalety

Najszybszy start: Bez budowania infrastruktury, bez provisioningu serwerów GPU, bez potrzeby ekspertyzy ML-Ops. Konfiguracja klucza API, podpisanie umowy powierzenia, produktywność w kilka godzin.

Automatyczne aktualizacje: Aktualizacje modeli, łatki bezpieczeństwa i usprawnienia wydajności wdrażane przez dostawcę. Bez własnego nakładu na utrzymanie.

Skalowalność: Bez zarządzania pojemnością. Przy skokach obciążenia dostawca chmury skaluje automatycznie. Bez nadplanowania, bez niedoboru.

Różnorodność modeli: Dostęp do wszystkich wariantów modeli dostawcy - flagowy, cena-jakość i budżetowy - przez to samo API.

Ryzyka i ograniczenia

Dane opuszczają sieć firmową. Nawet przy rezydencji danych w UE Twoje zapytania są przetwarzane na infrastrukturze, której nie kontrolujesz. Dostawca ma techniczny dostęp do danych podczas przetwarzania.

CLOUD Act. Dostawcy amerykańscy - w tym Anthropic, OpenAI i Google - podlegają amerykańskiej ustawie CLOUD Act. W określonych warunkach władze USA mogą żądać dostępu do danych, nawet jeśli są przechowywane w centrach danych UE. Dla większości danych firmowych ryzyko to jest ocenialne i akceptowalne. Dla tajemnic handlowych, danych niejawnych czy informacji dotyczących infrastruktury krytycznej - nie.

Zależność od dostawcy. Przy strategii jednego dostawcy jesteś zależny od polityki cenowej, zmian API i dostępności jednego dostawcy. Architektura model-agnostic (zob. Porównanie modeli AI 2026) redukuje to ryzyko.

Wymagana umowa powierzenia. Do korzystania zgodnego z RODO wymagana jest umowa powierzenia przetwarzania danych z dostawcą. Wszyscy trzej wielcy dostawcy oferują standardowe umowy - zweryfikuj je z działem prawnym. Uwaga: Standardowe umowy powierzenia SaaS nie obejmują tematów specyficznych dla AI, takich jak logowanie promptów, separacja środowisk i łańcuchy dostawców modeli. Nasz katalog wymagań dla umów powierzenia AI identyfikuje dziesięć luk i zawiera 25 pytań weryfikacyjnych.

Odpowiednie dla

Standardowych zadań z danymi niewrażliwymi: podsumowania, tłumaczenia, ogólne odpowiadanie na pytania
Proof of Concept i projektów pilotażowych
Zadań o zmiennym wolumenie, gdzie dedykowana infrastruktura GPU byłaby nieekonomiczna
Organizacji bez ekspertyzy ML-Ops, które chcą szybko zacząć produkcyjnie

Poziom 2: Europejskie IaaS - hosting GPU u europejskich dostawców

Środkowa opcja: wynajmujesz serwery GPU u europejskiego dostawcy Infrastructure-as-a-Service - np. Hetzner, IONOS lub specjalistycznego dostawcy chmury GPU. Na tych serwerach samodzielnie uruchamiasz modele open source, takie jak gpt-oss, Llama 4 czy Mistral Medium 3.1.

Konkretne wymagania sprzętowe i koszty

Model	Wymaganie GPU	Szacunkowy koszt/miesiąc
gpt-oss-120b	1x A100/H100 (80 GB)	ok. 1200 EUR
gpt-oss-20b	CPU/16 GB RAM (lub mały GPU)	ok. 200-400 EUR
Llama 4 Scout	1x A100 (80 GB)	ok. 1200 EUR
Llama 4 Maverick	4x A100 (80 GB)	ok. 3500 EUR
Mistral Medium 3.1	4x A100 (80 GB)	ok. 3500 EUR

Zalety

Dane pozostają w Europie. Serwer stoi w europejskim centrum danych, obsługiwany przez europejskiego dostawcę. Bez CLOUD Act, bez transatlantyckiego transferu danych. Dla zgodności z RODO to najbezpieczniejsza opcja chmurowa.

Brak vendor lock-in. Obsługujesz modele open source na licencji Apache 2.0 lub Meta Llama License. Gdy chcesz zmienić dostawcę hostingu, migrujesz model - bez pytań o licencje, bez negocjacji kontraktowych.

Pełna kontrola nad modelem. Decydujesz, który model w jakiej wersji działa. Możesz modele dostrajać, kwantyzować lub zastępować nowszymi wersjami - bez czekania na dostawcę.

Przewidywalne koszty. Serwery GPU mają stałe koszty miesięczne. Bez zmiennych kosztów tokenów, bez niespodzianek przy skokach obciążenia. Dla organizacji z wysokim, stałym wolumenem często bardziej ekonomiczne niż Cloud API.

Wymagania

Kompetencje ML-Ops. Potrzebujesz kogoś, kto wdroży, monitoruje, aktualizuje i interweniuje w razie problemów. Może to być wewnętrzny inżynier ML lub zewnętrzny usługodawca - ale to nie jest zerowy nakład pracy.

Planowanie pojemności. Serwer GPU ma zdefiniowaną pojemność. Jeśli masz 500 równoczesnych zapytań, jeden GPU nie wystarczy. Musisz rozumieć profile obciążenia i planować pojemności.

Brak automatycznych aktualizacji. Gdy pojawia się nowy model, wdrażasz go sam. Gdy wystąpi problem bezpieczeństwa, łatasz sam.

Odpowiednie dla

Poufnych danych firmowych (poziom wrażliwości 2-3)
Organizacji, które muszą wyeliminować ryzyko CLOUD Act
Zastosowań ze stałym, wysokim wolumenem (przewaga kosztowa nad Cloud API)
Organizacji z istniejącą kompetencją DevOps/ML-Ops

Poziom 3: On-Premises - AI na własnym sprzęcie

Opcja maksymalnej kontroli: obsługujesz serwery GPU we własnym centrum danych lub w kolokacji. Żadne dane nie opuszczają Twojej sieci - pod żadnym warunkiem.

Zalety

Maksymalna suwerenność danych. Brak dostępu zewnętrznego, brak zewnętrznego dostawcy, brak zewnętrznej zależności. Sprzęt należy do Ciebie, model należy do Ciebie, dane nigdy nie opuszczają Twojej sieci.

Pewność regulacyjna. Dla operatorów infrastruktury krytycznej, instytucji państwowych, sektora obronnego i organizacji z danymi niejawnymi on-premises to często jedyna opcja spełniająca wymagania compliance.

Brak bieżących kosztów licencji czy API. Po początkowej inwestycji pozostają tylko koszty prądu, chłodzenia i utrzymania. Przy długookresowej eksploatacji i wysokim wolumenie on-premises może być najtańszą opcją.

Wyzwania

Wysoka inwestycja początkowa. Produkcyjny serwer GPU z NVIDIA H100 (80 GB) kosztuje 25 000-40 000 EUR. Dla bardziej wydajnych setupów (multi-GPU, redundancja) koszty sięgają 60 000-120 000 EUR lub więcej.

Wymagany zespół ML-Ops. On-premises oznacza: jesteś odpowiedzialny za wszystko. Utrzymanie sprzętu, deployment modeli, monitoring, aktualizacje, bezpieczeństwo. To wymaga dedykowanego zespołu lub doświadczonego usługodawcy.

Skalowanie nie jest trywialne. Gdy obciążenie rośnie, nie możesz dodać kolejnego GPU jednym kliknięciem. Zakup sprzętu trwa tygodnie do miesięcy.

Odpowiednie dla

Operatorów infrastruktury krytycznej i instytucji państwowych
Danych niejawnych i najwyższych poziomów poufności
Organizacji z własnym centrum danych i kompetencją ML-Ops
Długookresowej gotowości inwestycyjnej przy bardzo wysokim wolumenie

Darmowy eBook: Infrastruktura AI

Build, Buy, Hybrid - infrastruktura zgodna z EU AI Act z B/B/H-Framework i 7-Layer Reference Architecture.

Pobierz za darmo

Drzewo decyzyjne

Następująca logika decyzyjna pomaga w przypisaniu:

Czy Twoje dane zawieraja PII lub tajemnice handlowe?
+-- NIE -> EU SaaS (Poziom 1)
+-- TAK -> Infrastruktura krytyczna lub dane niejawne?
+-- TAK -> On-Premises (Poziom 3)
+-- NIE -> Europejskie IaaS (Poziom 2) lub Hybrid

W praktyce odpowiedzią rzadko jest jeden poziom. Większość organizacji ma dane o różnej wrażliwości - i dlatego potrzebuje architektury obejmującej wszystkie poziomy.

Hybrid jako standard: Architektura routingu

Strategia hybrydowa łączy wszystkie trzy poziomy w jednej architekturze. Warstwa routingu automatycznie decyduje, które zapytanie przechodzi jakim kanałem - na podstawie wrażliwości danych, nie na podstawie decyzji poszczególnych pracowników.

Jak działa routing

Poziom wrażliwości 1-2 (publiczne, wewnętrzne): Zapytania idą przez Cloud API. Szybko, tanio, skalowalnie. Przykład: podsumowanie publicznego whitepapera, tłumaczenie komunikatu prasowego, szkic ogólnego maila.

Poziom wrażliwości 3 (poufne): Zapytania są kierowane do modeli self-hosted w europejskim centrum danych. Brak wycieku danych, brak CLOUD Act. Przykład: analiza wewnętrznych umów, przetwarzanie danych personalnych, analiza poufnych danych finansowych.

Poziom wrażliwości 4 (ściśle poufne / regulowane): Zapytania przechodzą wyłącznie przez infrastrukturę on-premises. Przykład: dokumenty niejawne, systemy infrastruktury krytycznej, dane pod szczególną ochroną.

Warunek: Klasyfikacja danych

Aby routing działał, organizacja musi sklasyfikować swoje dane. Brzmi to pracochłonnie, ale w wielu organizacjach już istnieje - np. w ramach istniejących Systemów Zarządzania Bezpieczeństwem Informacji (SZBI) lub krajowych ram klasyfikacji bezpieczeństwa. Reguły routingu odwzorowują tę istniejącą klasyfikację na infrastrukturę AI.

Implementacja techniczna

Warstwa routingu siedzi między Enterprise AI Portal (interfejsem, którego używają pracownicy) a endpointami modeli. Składa się z trzech komponentów:

Klasyfikator: Automatycznie rozpoznaje wrażliwość danych zapytania - na podstawie słów kluczowych, systemu źródłowego lub jawnego oznaczenia przez użytkownika.
Silnik routingu: Przypisuje zapytanie do odpowiedniego endpointu modelu - Cloud API, europejskie IaaS lub on-premises.
Audit Log: Rejestruje każdą decyzję routingową - jakie zapytanie, jaki poziom wrażliwości, jaki endpoint. Śledzalne i eksportowalne.

Efekt kosztowy

Architektura hybrydowa optymalizuje nie tylko bezpieczeństwo danych, ale też koszty. Cloud API są tanie za zapytanie, ale zmienne. Modele self-hosted mają koszty stałe, które amortyzują się przy wysokim wolumenie. Połączenie wykorzystuje oba: tanie Cloud API do grosu niekrytycznych zapytań, modele self-hosted z optymalizacją kosztów stałych do wolumenu poufnego.

W praktyce widzimy u organizacji z 1000+ pracownikami typowo następujący rozkład: 60-70% zapytań przechodzi przez Cloud API (poziom 1-2), 25-35% przez europejskie IaaS (poziom 3) i 5-10% przez on-premises (poziom 4). Całkowite koszty są o 30-40% niższe niż przy strategii opartej wyłącznie na Cloud API, przy jednocześnie wyższej suwerenności danych.

Podsumowanie: Trzy poziomy w skrócie

Kryterium	EU SaaS (Poziom 1)	Europejskie IaaS (Poziom 2)	On-Premises (Poziom 3)
Suwerenność danych	Region UE, umowa powierzenia	Europa, brak CLOUD Act	Maksymalna
Koszty początkowe	Brak	Niskie (wynajem)	Wysokie (60-120 tys. EUR+)
Koszty bieżące	Zmienne (tokeny)	Stałe (wynajem GPU)	Stałe (prąd, utrzymanie)
Nakład ML-Ops	Brak	Średni	Wysoki
Skalowalność	Automatyczna	Ręczna	Ręczna, wolna
Odpowiednie dla	Dane poziomu 1-2	Dane poziomu 2-3	Dane poziomu 3-4

Właściwa strategia to prawie zawsze kombinacja. Gosign implementuje warstwę routingu, która łączy wszystkie trzy poziomy - tak że Twoi pracownicy korzystają z jednego interfejsu, a system automatycznie wybiera właściwą ścieżkę.

Dalej: Infrastruktura AI | Decision Layer & Shadow AI

Enterprise AI Infrastructure Blueprint 2026 - Seria artykułów

Poprzedni	Przegląd	Następny
Modele AI 2026: Który model do jakiego zastosowania?	Przegląd	Enterprise AI Portal: Cztery interfejsy open source w porównaniu

Wszystkie artykuły z tej serii: Enterprise AI Infrastructure Blueprint 2026

Chcesz wiedzieć, która strategia hostingu jest odpowiednia dla Twoich danych? Gosign analizuje Twoją klasyfikację danych i projektuje odpowiednią architekturę hybrydową.

Umów rozmowę - W 30 minut wyjaśnimy, jakie poziomy hostingu potrzebujesz.

Bert Gogolin

Dyrektor Generalny, Gosign

AI Governance Briefing

Enterprise AI, regulacje i infrastruktura - raz w miesiącu, bezpośrednio ode mnie.

Hosting AI: EU SaaS, centrum danych czy Self-Hosted?

“Gdzie to działa?” - Decydujące pytanie

Poziom 1: EU SaaS - Cloud API z rezydencją danych w UE

Zalety

Ryzyka i ograniczenia

Odpowiednie dla

Poziom 2: Europejskie IaaS - hosting GPU u europejskich dostawców

Konkretne wymagania sprzętowe i koszty

Zalety

Wymagania

Odpowiednie dla

Poziom 3: On-Premises - AI na własnym sprzęcie

Zalety

Wyzwania

Odpowiednie dla

Drzewo decyzyjne

Hybrid jako standard: Architektura routingu

Jak działa routing

Warunek: Klasyfikacja danych

Implementacja techniczna

Efekt kosztowy

Podsumowanie: Trzy poziomy w skrócie

AI Governance Briefing

Najczęściej zadawane pytania

Czy korzystanie z Cloud API AI jest zgodne z RODO?

Ile kosztuje self-hosting modeli AI?

Na czym polega strategia hybrydowa?

Jak polskie firmy powinny podejść do hostingu AI?

Jaki proces powinien obsłużyć Twój pierwszy agent?