Come classificare i dati con Macie

Come classificare i dati con Macie

Amazon Macie è un servizio per la  sicurezza in cloud. Utilizza l’apprendimento automatico per la rilevazione, classificazione e protezione automatica dei dati sensibili in AWS.

Macie  consente di riconoscere i dati sensibili come informazioni personali (PII) o proprietà intellettuali, e con la sua interfaccia e suoi alert permette di visualizzare le modalità di accesso o di spostamento dei dati.

Cosa è importante sapere:

  • Macie può aiutarti nel classificazione i tuoi dati sensibili e business-critical che sono memorizzati nel cloud.
  • Macie analizza e elabora i dati memorizzati nei bucket AWS S3.
  • Per classificare i tuoi dati, Macie utilizza anche la capacità che ha CloudTrail di catturare l’attività API a livello di oggetti sugli oggetti S3 (eventi di dati).
  • Se specifichi almeno un bucket S3 da monitorare, Macie controlla solo dati eventi CloudTrail.
  • Indicato il bucket S3 che Macie dovrà monitorare, abiliti Macie per il controllo e la rilevazione di nuovi dati in entrata nell’infrastruttura AWS.

Metodi di classificazione

Una volta che Macie inizia a monitorare tuoi dati, utilizza diversi metodi di classificazione automatica dei contenuti per identificare e dare priorità ai dati sensibili e critici e per assegnare loro un valore di business.

In particolare utilizza i seguenti metodi:

  • Tipo di contenuto;
  • Estensione del file;
  • Tema;
  • Regex;
  • Informazioni personali identificabili (PII);
  • Support Vector Machine.

Scopriamoli ad uno ad uno.

Tipo di contenuto

Per poter classificare gli oggetti dei dati per tipo di contenuto, Macie utilizza un identificatore incorporato nell’intestazione del file.

Macie offre un insieme di tipi di contenuti gestiti (Macie-curated), ciascuno con un livello di rischio designato compreso tra 1 e 10.

Macie può assegnare un solo tipo di contenuto a un oggetto.
Non è consentito modificare i tipi esistenti o aggiungere nuovi tipi di contenuto.

Ma è possibile abilitare o disattivare i tipi di contenuto esistenti, permettendo così a  Macie di includerli o di escluderli nel processo di classificazione dei dati.

Per visualizzare, abilitare o disattivare i tipi di contenuto

  1. Nella console Macie, passare alla pagina Settings.
  2. Nella sezione Classify data scegli i Content types.
  3. Seleziona dall’elenco un tipi di contenuto gestito per visualizzare i dettagli.
  4. Per attivare o disattivare un tipo di contenuto, nella pagina dettagli, utilizza il drop-down menu Enabled/Disabled e quindi scegliere Save.

Estensione del file

Macie può anche classificare i tuoi oggetti secondo le loro estensioni di file. Macie offre una serie di estensioni di file gestite, ciascuna con un livello di rischio attribuito da 1 e 10.

Macie è in grado di assegnare una solo estensione di file per oggetto.

Non è possibile modificare le esistenti o aggiungere nuove estensioni di file. È consentito abilitare o disabilitare le estensioni dei file esistenti, insegnando a Macie di includervi o di escluderli nel processo di classificazione dei dati.

Per visualizzare, abilitare o disabilitare le estensioni dei file

  1. Nella console Macie, passa alla pagina Settings.
  2. Nella sezione Classify data, selezione File extensions.
  3. Scegli dall’elenco una qualsiasi delle estensioni di file gestita per visualizzare i dettagli.
  4.  Per attivare o disattivare un’estensione di file, sulla pagina dettagli, utilizza  il drop-down menu,Enabled/Disabled, quindi seleziona Save.

Tema

La classificazione degli oggetti per tema si basa sulle parole chiave che Macie cerca quando esamina il contenuto degli oggetti.

Macie offre una serie di temi gestiti, ciascuno con un livello di rischio designato tra 1 e 10. Macie può assegnare uno o più temi a un oggetto.
Non è possibile modificare temi esistenti o aggiungerne di nuovi. È permesso abilitare o disabilitare i temi esistenti, insegnando a Macie di includerli o di escluderli nel processo di classificazione dei dati.

Per visualizzare, attivare o disattivare i temi

  1.  Nella console Macie, passare alla pagina Settings.
  2. Nella sezione Classify data, scegliere Themes.
  3. Scegliere uno dei temi gestiti elencati per visualizzare i dettagli.
  4. Per attivare o disattivare un tema, nella pagina dettagli, utilizzare il menudrop-down menu Enabled/Disabled e quindi scegliere Save.

Regex

La classificazione degli oggetti da regex è incentrata su dati specifici o modelli di dati che Macie cerca quando esamina il contenuto degli oggetti. Macie offre una serie di regex gestiti, ognuno con un livello di rischio designato compreso tra 1 e 10. Macie può assegnare una o più regex ad un oggetto.

Non è permesso modificare la regex esistente o aggiungerne. È possibile abilitare o disattivare la regex esistente, consentendo a Macie di includerli o di escluderli nel processo di classificazione dei dati.

Per visualizzare, abilitare o disattivare Regex

  1.  Nella console Macie, passare alla pagina Settings.
  2.  Nella sezione Classify data , scegliere Regex.
  3.  Scegliere dall’elenco una qualsiasi delle regex gestite per visualizzare i dettagli.
  4. Per abilitare o disabilitare un regex, nella sua pagina dettagli,  il menudrop-down menu Enabled/Disabled e quindi scegliere Save.

Informazioni personali identificabili (PII)

La classificazione degli oggetti da PII è basata sul riconoscimento di eventuali manufatti identificabili in base a standard industriali come NIST-80-122 e FIPS 199.

Macie è in grado di riconoscere i seguenti artefatti PII:

  • Nomi completi
  •  Indirizzi di posta elettronica
  •  Indirizzi email
  •  Numeri di carta di credito
  • Indirizzi IP (IPv4 e IPv6)
  • ID di licenza dei driver (USA)
  • Numeri nazionali di identificazione (USA)
  • Date di nascita

Per la  classificazione di oggetti PII, Macie assegna a ciascun oggetto corrispondente un impatto PII di alto, moderato e basso livello utilizzando i seguenti criteri:

  •  Alto
    > = 1 nome completo e carta di credito
    > = 50 nomi o e-mail e qualsiasi combinazione di altri PIl
  • Moderato
    > = 5 nomi o email e qualsiasi combinazione di altri PII
  •  Basso
    1-5 nomi o email e qualsiasi combinazione di PII
    Qualsiasi quantità di attributi PII (senza nomi o messaggi di posta elettronica)

Support Vector Machine

Un altro metodo che Macie utilizza per catalogare gli oggetti S3 è il classificatore Support Vector Machine (SVM) che capace di ordinare in classi il contenuto all’interno degli oggetti S3 monitorati da Macie (testo, n-grammi di simboli e n-grammi di caratteri) così come le caratteristiche di metadati, (lunghezza del documento, estensione, codifica, intestazioni).

SVM gestito da Macie è stato addestrato per essere utilizzato per grande corpus di dati di varia tipologia.  Inoltre, è stato ottimizzato per supportare l’esatta rilevazione di vari tipi di contenuto, inclusi il codice sorgente, i registri delle applicazioni, i documenti regolamentari ei backup dei database.

Anche, Il classificatore ha la capacità di generalizzare le proprie rilevazioni. Ad esempio, se ha rilevato un nuovo tipo di codice sorgente che non corrisponde a nessuno delle tipologie di codice sorgente che è addestrato a riconoscere, può generalizzare la rilevazione come semplice codice sorgente.

Nota
Questo metodo di classificazione dei dati non viene esplicitato nelle impostazioni di Macie. L’elenco seguenti di artefatti è gestito da Macie e non può essere modificato, abilitato o disattivato.

Il classificatore SVM a supporto di Macie è addestrato per rilevare i seguenti tipi di contenuto:

  • E-books
  • E-mail
  • Chiavi di crittografia generiche
  • Financial
    Forme regolatorie SEC
  • JSON
    Registri AWS CloudTrail
    Notebook di Jupyter
  • Application logs
    Formato Apache
    Registri server AWS S3
    Syslog di Linux
  • Data Base
    Backup MongoDB
    MySQLbackup
    Script MySQL
  • Codice sorgente: F#, VimL, ActionScript, Assembly, Bash, Batchfile, C, Clojure, Cobol, CoffeeScript, CUDA, Erlang, Fortran, Go, Haskell, Java, JavaScript, LISP, Lua, Matlab, ObjectiveC, Perl, PHP, PowerShell, Processing, Python, R, Ruby, Scala, Swift, VHDL.
  • Linguaggi web
    CSS
    HTML
    XML

Livello di Rischio dell’oggetto

Grazie ai metodi di classificazione automatici sopra descritti, ad un oggetto monitorato da Macie viene assegnato un diverso livelli di rischio in base a ciascun tipo di contenuto, file estensione, tema, regex, PII e artefatto SVM.

Il livello di rischio composto (finale) dell’oggetto viene quindi impostato sul valore più elevato dei livelli di rischio assegnati.

Durata di conservazione per metadati S3

Macie memorizza i metadati relativi agli oggetti S3 per una durata predefinita di un mese. È possibile estendere la durata fino a 12 mesi.

Comments are closed.

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi