JOB SUBMISSION WORK-FLOW
Per autenticarsi sul sistema pi2s2 bisogna appartenere ad una Organizzazione Virtuale(VO) abilitata ad operare sulla griglia ed essere in possesso di un valido certificato digitale personale emesso da una Autorita' di Certificazione.
Una volta autenticato, l'utente, tramite l'uso di un'interfaccia grafica, quale un portale web, puo' quindi descrivere il processo che vuole eseguire ed inviarlo al Resource Broker (in alto, al centro della figura), il vero cervello della griglia, corredandolo di tutte le informazioni necessarie alla sua esecuzione (file di input, condizioni iniziali, richieste particolari da essere soddisfatte in fase di esecuzione, etc.), riunite nella InputSandbox.
Il Resource Broker interroga quindi il Sistema Informativo della griglia (a destra, al centro della figura), che contiene, dinamicamente, l'informazione sullo stato di tutte le risorse di calcolo e di immagazzinamento dei dati presenti sulla griglia (in basso a destra nella figura), analizza i requisiti del processo voluto dall'utente, interrogando eventualmente il Catalogo delle Repliche (in alto a destra nella figura) per sapere dove sono localizzati sulla griglia i file eventualmente necessari all'esecuzione, e stabilisce la migliore risorsa che lo puo' eseguire (al centro, in basso nella figura).
Il processo viene quindi eseguito ed, al suo completamento, i dati di output, raggruppati nella OutputSandbox, vengono trasferiti al Resource Broker dal quale l'utente puo' recuperarli in qualsiasi momento.
Tutti i passi relativi al trattamento del programma ed alla sua esecuzione sono registrati in un sistema informativo (in basso a sinistra nella figura) al quale l'utente puo' procedere in ogni momento per conoscere lo stato del suo processo.
Da quanto detto fin qui emerge chiaramente come la griglia computazionale sia un complesso sistema di elementi diversi che operano sinergicamente quali servizi disponibili sulla rete. Ogni elemento corrisponde fisicamente ad una o piu' macchine collegate tra di loro. Tra questi elementi, citiamo in particolare:
- la User Interface (UI): la macchina dalla quale si possono sottomettere processi sulla griglia computazionale e che contiene il portale web che puo' essere acceduto da qualsiasi parte mediante un comune web browser (Internet Explorer, Netscape, etc.);
- lo Storage Element (SE): la macchina di un sito che contiene i dischi per conservare i file degli utenti;
- il Computing Element (CE): la macchina di accesso di un sito della griglia che riceve i programmi degli utenti e li distribuisce, usando un sistema locale, sui Worker Nodes ad esso collegati;
- il Worker Node (WN): la macchina da calcolo dove il programma dell'utente viene effettivamente eseguito;
- il Resource Broker (RB): la macchina che riceve le richieste di processamento degli utenti e le smiste sui CE distribuendo al meglio il carico di lavoro sulla griglia e soddisfacendo i requirements contenuti nei programmi degli utenti;
- il Logging & Bookkeeping server (LB): la macchina (normalmente piu' di una per ragioni di scalabilita'che contiene tutte le informazioni sullo stato di tutti i processi di tutti gli utenti;
- l'Information Index (II): la macchina che contiene la base di dati che descrive le risorse di calcolo (CE) e di immagazzinamento dei dati (SE) disponibili in tempo reale sulla griglia;
- il Replica Catalogue (RC): la macchina che contiene la base di dati di corrispondenza tra i nomi logici dei file di una data Organizzazione Virtuale e le locazioni fisiche di tali file sui vari SE disponibili sulla griglia. A questi va aggiunto uno o più server dove viene conservato il software da installare in modo automatico sui vari elementi della griglia.
Da un punto di vista tecnico/logistico la griglia computazionale del progetto PI2S2 sara' articolata nella maniera seguente.
- In ciascuna delle tre sedi principali (Catania, Messina e Palermo) saranno installati delle UI, dei CE, degli SE e dei WN nonche' dei server per la distribuzione del software.
Ove possibile, per minimizzare lo spazio e le complicazioni dovute al cablaggio, per i le UI, i CE ed i WN si fara' ricorso a PC montabili su armadi rack standard da 19 pollici equipaggiati con due CPU di frequenza almeno pari a 3.2 Ghz e 2 GBytes di memoria RAM per processore (per permettere l'esecuzione di piu' processi concorrenti).
I PC saranno dotati di dischi interni da almeno 40 GB e 1 o 2 schede di rete a 1000 Mbit/secondo e saranno connessi, mediante cavi UTP cat. 6 o 6e, a switch di rete con funzionalita' Layer 2 o 3 con piu'porte autosensing a 10/100/1000 Mbit/secondo. - Sui CE e sui WN sara' installato un sistema locale di distribuzione del carico detto job manager. Per ragioni di versatilità, affidabilita' ed elevata configurabilita'i intende far uso, ove possibile, ed in analogia a quanto accade nella griglia nazionale dell'INFN ed in quella Europea, ove possibile, a LSF (Load Sharing Facility), un prodotto commerciale della ditta americana Platform che viene commercializzato in Italia a prezzi molto vantaggiosi per le Universita' gli Enti di ricerca dalla ditta NICE s.r.l. che e' partner del Progetto.
- Come portale grid verso le applicazioni, da installarsi sulle UI, si intende avvalersi dell'ottima esperienza accumulata in ambito INFN con il portale GENIUS ed il framework sottostante EnginFrame , commercializzato dalla ditta NICE s.r.l. che e' uno dei partecipanti al Progetto.
- Per gli SE, si intende far uso, per limitare i costi pur mantenendo un elevato livello di prestazioni ed affidabilità si intende far uso di file server integrati costituiti da PC montabili su armadi rack standard da 19 pollici equipaggiati con due CPU di frequenza almeno pari a 3.2 Ghz e 2 GBytes di memoria RAM per processore (per migliorare le performance dei file system condivisi quali NFS). I file server conterranno dischi EIDE da almeno 400 GBytes ciascuno (nel numero di 16 o 32) che saranno indirizzabili attraverso schede EIDE-to-SCSI ad alte prestazioni. I file server saranno anche equipaggiati con almeno due schede di rete da 1000 Mbit/secondo con funzionalita' di trunking e load balancing.
- La sede di Catania ospitera' invece gli elementi di griglia relativi alle varie organizzazioni virtuali quali RB , LB, II e RC. Inoltre, Catania ospitera' tutti i server delle varie Organizzazioni Virtuali che conterranno i soggetti dei certificati digitali personali dei relativi utenti ed il web server del Progetto che conterra' tutte le informazioni sul Progetto, sul suo stato e sullo stato, in tempo reale, del Laboratorio Virtuale.
- I certificati digitali personali potranno essere forniti dall' Autorita' di Certificazione dell'INFN ,valida e riconosciuta a livello mondiale, a condizione che nelle sedi di tutti i Soggetti partecipanti vengano attivate delle Autorita' di Registrazione per la corretta identificazione degli utenti. Inoltre, nell'ambito delle attivita' di disseminazione, la sede di Catania gestira' pure un'Autorita' di Certificazione meno restrittiva per poter consentire un accesso rapido alla griglia regionale anche a persone non appartenenti a specifiche Organizzazioni Virtuali in occasione di tutorial ed eventi dimostrativi.
- Nelle sedi di tutti i Soggetti partecipanti saranno poi installati UI e piccole "computing farm" composte da CE+WN per i test locali delle applicazioni prima della loro distribuzione sulla griglia di produzione. Inoltre, nell'ambito e nella misura dei finanziamenti ricevuti, tutti i Soggetti privati provvederanno a migliorare qualitativamente e quantitativamente il loro accesso alla rete telematica al fine di usufruire al meglio dei servizi messi a disposizione dalla griglia computazionale siciliana.
- Per minimizzare i costi del software, ove possibile, si intende usare Linux come Sistema Operativo di tutte le macchine. Ciò al fine di sfruttare i benefici della compatibilità con il middleware sviluppato dai Progetti Grid Nazionali ed Europei