Anotace: |
Pro většinu koncových uživatelů není snadné ověřit zabezpečeni jejich síťového provozu pomoci strojového učeni (ML). Existuji tři hlavni důvody: (i) neexistuji dobré dostupné nástroje; ii) uživatelé nemají přistup k dobrým datovým sadám pro učeni modelů; a (iii) uživatelé raději nesdílejí svůj provoz z důvodu ochrany osobních údajů. Decentralizované federované strojové učeni již koncovým uživatelům nabizi možnost chránit jejich informace a současně uchovávat jejich citlivá data v jejich zařízeni. Kromě toho je v některých scénářích, jako jsou mobilní telefony nebo zařízeni loT, žádoucí také minimální síťová komunikace, kterou federované učeni umožňuje.
Tento projekt navrhuje řešeni s názvem FEEL. Využívá Federated Learning k trénováni modelů na zařízeních koncového uživatele bez sdíleni jakéhokoliv typu síťových informaci od uživatele.
Federované učeni je rodina algoritmů strojového učeni, která umožňuje mnoha klientům společně
trénovat modely strojového učení. Data koncového uživatele se zobrazuji a používají pouze lokálně v jeho zařízeni, zatímco sdílí pouze parametry modelu s centrálními servery. Centrální servery přijímají všechny malé modely ze zařízeni (matice čísel), agreguji je do většího aktualizovaného modelu. Tento komplexní model poté aktualizuji a odešlou zpět na koncová zařízeni.
Tento projekt navrhuje implementovat pomoci infrastruktury CESNET systém založený na federovaném učeni pro detekci zabezpečeni sítě, který bude nasazen a udržován v ČVUT. Pracovní cyklus systému by byl následovný: (i) centrální služba odesílá model klientům, aby lépe detekovali hrozby v jejich místních sítích; ii) ústřední služba pravidelně požaduje, aby koncová zařízeni přetrénovala lokální model (pod dohledem nebo bez dozoru); (iii) okrajová zařízeni lokálně aktualizuji své modely pomoci vlastního síťového provozu; (iv) okrajová zařízeni odesílají aktualizaci svých modelů do centrální služby (matice čísel, nikoli síťová data); (v) centrální služba zprůměruje modely všech koncových zařízeni a odešle aktualizovaný model klientům. Existuji varianty tohoto schématu podle použitého algoritmu, ale základní princip je totožný.
Službu mohou využívat koncová zařízeni, jako jsou routery, zařízeni loT, mobilní telefony atd. Tento projekt bude rovněž odrazovým můstkem pro výzkum nových, nejmodernějších algoritmů, které jsou vhodné pro zabezpečeni sítě. Projekt se dále zaměří na integraci a využiti informaci, jako jsou bezpečnostní výstrahy ze stávajících systémů CESNET, jako jsou NEMEA a Nerd. Pro trénováni a evaluaci modelů bude systém potlebovat některý z GPU clusteru CESNET T4. Náš navrhovaný systém umožni koncovým uživatelům přidat další vrstvu zabezpečeni připojením se k federované sili a pomůže zlepšit celkovou bezpečnost celé komunity. |