Infrastruttura ICT
Uno degli obiettivi realizzati nell'ambito di GARR-X Progress è stata la creazione di una piattaforma tecnologica in grado di offrire servizi ICT e Cloud, con accesso semplice, sicuro e affidabile a risorse di calcolo e storage geograficamente distribuite secondo i paradigmi IaaS e SaaS.
La piattaforma è stata implementata attraverso tre fasi principali:
- Acquisizione ed installazione degli apparati di calcolo, storage e rete
- Definizione ed implementazione dell’infrastruttura di rete per l’interconnessione e l’accesso alle risorse di calcolo e storage
- Progettazione e realizzazione della piattaforma software su cui erogare i servizi Cloud
Acquisizione ed installazione degli apparati di calcolo, storage e rete
L’acquisizione degli apparati di calcolo, storage e rete del Sistema di Calcolo e Storage Distribuito previsto in GARR-X Progress è passata attraverso una gara pubblica, aggiudicata a DELL SpA. Le risorse acquisite ammontano a 8448 core virtuali, 66 TB di memoria RAM e 10.3 PB di spazio disco, installati su 11 rack. Gli apparati garantiscono un alto grado di affidabilità hardware, grazie alla richiesta espressa in fase di gara di ridondanza di tutte le loro componenti (alimentatori, controller RAID, schede di rete, ecc.) e all’interconnessione tra i moduli mediante link multipli.
Definizione ed implementazione dell’infrastruttura di rete per l’interconnessione e l’accesso alle risorse di calcolo e storage
Le risorse acquisite sono state distribuite su 5 siti (co-locati a PoP GARR) nelle 4 regioni di Convergenza. I tre siti nei PoP di Palermo, Catania e Bari ospitano ciascuno 3 rack/moduli; i restanti due rack/moduli sono stati installati nei due PoP a Napoli e Cosenza. I siti a tre moduli sono interconnessi in un anello di backbone ridondato in fibra, con capacità attuale pari a 40 Gbps espandibile fino a 100 Gbps. I siti a singolo modulo sono collegati ciascuno a due siti a tre moduli mediante link in fibra a 10 Gbps.
Progettazione e realizzazione della piattaforma software su cui erogare i servizi Cloud
La piattaforma Cloud GARR-X Progress è stata disegnata e realizzata sulle risorse di Palermo, Bari e Catania, con l’obiettivo di sfruttare le caratteristiche di robustezza, modularità, sicurezza e capacità dell’infrastruttura hardware sottostante, declinandole nelle seguenti linee guida:
- Gestione unificata dei meccanismi di identificazione ed autorizzazione alla piattaforma, in modo da consentire l’accesso trasparente alle risorse geograficamente distribuite;<
- Massimizzazione dello SLA (Service Level Agreement) dei servizi offerti, con l’obiettivo di garantire continuità nell’erogazione dei servizi a fronte dell’indisponibilità di una parte delle risorse all’interno di un sito e facilitare le procedure di disaster recovery in caso di indisponibilità di un intero sito;
- Architettura che permetta l’allocazione elastica delle risorse assegnate ad un gruppo di utenti, in grado di superare la capacità del singolo sito;
- Disponibilità ad implementare politiche di sicurezza a livello di risorse e di utenti.
Si è stabilito inoltre di utilizzare software open source, per evitare di essere dipendenti da soluzioni proprietarie.
Sul fronte della sicurezza, il totale controllo da parte del GARR dell’infrastruttura fisica di rete ha permesso di gestire al meglio le problematiche di sicurezza e throughput nel disegno della sua Cloud: a livello infrastrutturale è stata implementata la segregazione tra le reti di gestione degli apparati fisici, le reti di gestione dei server e le reti dedicate ai servizi erogati.
A livello applicativo, il servizio di networking di OpenStack (Neutron) realizza le funzionalità di rete della piattaforma Cloud, fornisce la connettività tra le risorse virtuali e verso l’esterno e garantisce la possibilità di estendere il datacenter virtuale su scala geografica. Come già accennato, Neutron offre inoltre un meccanismo interno di gestione della sicurezza, tramite il quale gli utenti possono impostare le politiche di sicurezza sulla loro infrastruttura virtuale.
L’infrastruttura Cloud GARR è attualmente in corso di espansione sui tre siti a tre moduli. Al fine di cominciare a sfruttare le risorse Progress il prima possibile, il GARR ha intanto provveduto a migrare i servizi già offerti (potenziandoli) e nuovi servizi su cluster OpenStack ridotti e VMWare. Il GARR sta inoltre ricevendo numerose nuove richieste per la fornitura di servizi IaaS. Contemporaneamente, nei siti a singolo modulo del sistema di Calcolo e Storage distribuito a Cosenza e Napoli si conducono le attività di pre-produzione e di testing di nuovi Servizi applicativi e piattaforme software.
Approfondimenti
Caratteristiche tecniche
L’infrastruttura ICT di GARR-X Progress ha le seguenti caratteristiche:
- Sistema operativo Linux per i server;
- Piattaforma Cloud basata su OpenStack;
- Ceph per la fornitura di Block Storage;
- Swift per la fornitura di Object Storage.
Le componenti della piattaforma Cloud sono state suddivise in globali (gestite come un’unica entità sull’intera infrastruttura) e locali (gestite in maniera indipendente su ciascun sito).
Le componenti globali:
- consentono agli utenti di accedere a tutte le risorse della Cloud con le stesse credenziali;
- offrono un archivio di immagini e snapshot di macchine virtuali (VM) unico per tutta la Cloud;
- offrono uno storage ad oggetti unico per tutta la Cloud e disponibile anche nel caso di problemi ad uno dei siti che lo rendano temporaneamente inaccessibile.
Le componenti che completano la piattaforma Cloud, installate su ciascuno dei siti principali (e denominate quindi componenti locali) realizzano su ciascun sito un ambiente (“regione” nella terminologia di OpenStack) su cui gli utenti possono realizzare la loro infrastruttura virtuale:
- creare infrastrutture di rete virtuali (router e network);
- Creare VM dimensionate e configurate secondo le esigenze, metterle in comunicazione tra di loro e col mondo esterno attraverso l’infrastruttura di rete virtuale, salvarne lo stato e replicarle tramite snapshot;
- creare volumi virtuali da collegare alle VM in forma di block storage;
- definire politiche personalizzate di accesso e sicurezza sull’infrastruttura virtuale.
Per tutto questo gli utenti hanno a disposizione un’interfaccia web (dashboard) dalla quale hanno accesso alle regioni della Cloud, allo storage ad oggetti e all’archivio delle immagini delle VM. Le componenti locali sono realizzate in modo da garantire bilanciamento e continuità dei servizi erogati anche a fronte della perdita di uno dei tre rack ospitati nei siti maggiori.
Servizi
Elenco dei primi servizi disponibili sulla piattaforma Cloud GARR
Servizio | Risorse utilizzate (CPU/storage) | Note |
---|---|---|
IdP in the Cloud | VCPU: 70; Storage: 4.1 TB | Servizio potenziato |
Filesender | VCPU: 8; Storage: 10 TB | Servizio potenziato |
Mirror | VCPU: 100; Storage: 200 TB | Servizio potenziato |
Progress in Training | VCPU: 60; Storage: 7 TB | Servizio potenziato |
GARRbox | VCPU: 336; Storage: 111 TB | Servizio potenziato |
Spazio backup per IZS Torino | VCPU: 2; Storage: 4 TB | Servizio potenziato |
Servizio | Risorse utilizzate (CPU/storage) | Note |
---|---|---|
IaaS per Università di Modena e Reggio Emilia | VCPU: 3; Storage: 1 TB | Nuovo servizio |
IaaS per IRCCS Bari | VCPU: 18; Storage: 10 TB | Nuovo servizio |
IaaS per progetto INNI-MS | VCPU: 4; Storage: 10 TB | Servizio potenziato |
IaaS per Università di Palermo | VCPU: 134; Storage: 100 TB | Nuovo servizio |
Infrastruttura per progetto EU AARC | VCPUs: 2; Storage: 1 TB | Nuovo servizio |
Piattaforma KALI per intrusion detection | VCPU: 8; Storage: 40 GB | Nuovo servizio |