280 likes | 416 Vues
La comunicazione nei Network-On-Chip. Esame corso ESD Cristiano Ressi di Cervia. Una sguardo verso il futuro: tecnologie Deep Sub Micron. Il futuro prossimo delle tecnologia VLSI secondo la National Technology Roadmap for Semiconductors 2010. Frequenza di lavoro >10 GHz.
E N D
La comunicazione nei Network-On-Chip Esame corso ESD Cristiano Ressi di Cervia
Una sguardo verso il futuro: tecnologie Deep Sub Micron Il futuro prossimo delle tecnologia VLSI secondo la National Technology Roadmap for Semiconductors 2010 Frequenza di lavoro >10 GHz Dimensioni Transistor <50 nm Numero Transistor > 4 Bilioni Costi produzione delle sole maschere > 1 Milione di dollari
Riutilizzo delle Intellectual Property (IP) Network On Chip Piattaforme flessibili e facilmente riadattabili Piattaforme capaci di integrare IP fornite da terzi La sfida economica delle tecnologie DSM “What do you do with a billion transistors?” Jacob A. Abraham Computer-Aided IC Design, Fall 2002 Le tecnologie DSM forniscono le potenzialità per la realizzazione di sistemi complessi. Le tecnologie DSM necessitano di: • Abbattere i costi di sviluppo non ricorrenti • Aumentare i volumi di produzione • Ridurre il time-to-market per divenire una reltà commercialmente vantaggiosa
Frequenze di lavoro dimensioni delle piattaforme Modello fisico delle tecnologie DSM Unione di molteplici IP eterogenee concorrenti Ortogonalizzazione tra computazione e comunicazione Network-On-Chip:comunicazione e computazione E’ fondamentale lo sviluppo di metodologie e tool che tengano conto delle
Modello OSI per i NOC Adozione del modello OSI per affrontare in modo sistematicoemodulare il problema della comunicazione nei NOC
Il mezzo trasmissivo non è più affidabile Physical Layer I modelli classici per transistor e connessioni non sono più validi Dimensioni delle connessioni Tecnologie DSM Frequenze di lavoro • Problemi di segnalazione • Distinzione tra connessioni in base alla lunghezza • Problemi di Interferenza Elettromagnetica (EMI) • Problemi di Cross-talk • Problemi di rumore
Processo (m) 0.25 45-50 2.5 0.625 0.18 30-40 1.8 0.450 0.13 25-30 1.5 0.375 • Transistor 0.10 20-25 1.2 0.3 • dipendenza lineare tensione-corrente • fenomeni di Hard e Soft Breakdown 0.07 15-20 0.9 0.225 0.05 12-15 0.7 0.175 Transistor (1) Diminuizione tensioni d’alimentazione Problemi di comunicazione legati al ridotto swing di tensione disponibile.
Transistor (2) Soluzioni proposte • Livello fisico: sviluppando tecnologie DSM capaci di massimizzare le tensioni sopportabili e/o le correnti generabili (Tecnologia SiGE o HP, Dual Gate MOSFETs). • Livello circuitale: adottando topologie circuitali che permettano di essere pilotate livelli ridotti di tensione o correnti: • Segnalazione differenziale e pseudo-differenziale (DIFF-PDIFF) • Pulse Controlled Driver (PCD) • Charge Intershared Bus (CISB) • Charge Recycling bus (CRB) • Asymmetric Source-Follower Driver + Level Converter (ASDLC) • Level Converter + Low Vt device (LCLVD) • Capacitive-Coupled Level Converter (CCLC) • Level Converter Register (LCR)
C – funzione del: • Materiale • Lunghezza • Sezione • Contributi dovuti ad effetto miller, capacità di fringe e laterali • L – funzione del: • Lunghezza • Frequenze di lavoro • R – funzione del: • Materiale • Lunghezza • Sezione Connessioni (1) Il modello della connessione è una linea di trasmissione distribuita caratterizata dai parametri R L C
Connessioni (2) Le linee di connessione non sono isolate elettromagneticamente Accoppiamento Capacitivo Accoppiamento Induttivo
Connessioni (3) Effetti legati alla natura distribuita delle connessioni • Ritardi di propagazione e fenomeni oscillatori, trascurare la componente induttiva può portare ad errori grossolani di valutazione. • Cross-talk tra linee di connessione adiacenti per accoppiamento induttivo e capacitivo che nel secondo caso per effetto miller è influenzato dalle condizioni di transizione del segnale. • Cross-talk dovuto all’accoppiamento induttivo tra linee non adiacenti. • Cadute di tensione dovute alla componente resistiva non più trascurabili rispetto ai valori di alimentazione disponibili • Elettromigrazione
Connessioni (4) Soluzioni proposte - Ripetitori opportunamente inseriti lungo la linea – unidirezionali e contribusicono al delay totale - Booster opportunamente inseriti lungo la linea – bidirezionali e non contribusicono al delay totale
Data LinkUna Questione di Affidabilità • Probabilità di errore non nulla • Presenza di rumore Protocolli e codifiche per rendere affidabile la trasmissione • Minime tensioni d’alimentazione • Vincoli sul consumo di energia Opportuna codifica dell’informazione
Data link (2) Soluzioni proposte Molteplici soluzioni proposte in ambito dei macro network • Identificazione errore e ritrasmissione dell’informazione • Codifiche per l’individuazione e la correzione dell’errore • Codifica per maggiore robustezza del segnale rispetto al rumore Occorre definire opportune metriche e metodologie di confronto dal punto di vista energetico
Network layerEnergia Complessità Scalabilità “Route Packets, Not Wires” William J. Dally and Brian Towles Computer Systems Laboratory Stanford University Network di connessione tra IP Predirre il comportamento elettrico ed ottimizzare le connessione Condividere le connessioni tra IP aumentando le performance Facilitare l’intermodularità introducendo interfaccie di comunicazione standard
NOC vs BUS Comunicazione broadcast energeticamente non efficiente Intrinsecamente non scalabile oltre certe dimensioni
Network layerMetriche di qualità (1) Introdurre oltre alle metriche classiche l’area come funzione costo nei NOC e la scalabiltà come parametro di confronto Latency Scalability Bandwidth
Topologie generiche (1) N = 1024 Type Degree Diameter Ave Dist Bisection Diam Ave D 1D mesh < 2 N-1 N/3 1 2D mesh < 4 2(N1/2 - 1) 2N1/2 / 3 N1/2 63 21 3D mesh < 6 3(N1/3 - 1) 3N1/3 / 3 N2/3 ~30 ~10 nD mesh < 2n n(N1/n - 1) nN1/n / 3 N(n-1) / n (N = kn) Ring 2 N / 2 N/4 2 2D torus 4 N1/2 N1/2 / 2 2N1/2 32 16 k-ary n-cube 2n n(N1/n) nN1/n/2 15 8 (3D) (N = kn) nk/2 nk/4 2kn-1 Hypercube n n = LogN n/2 N/2 10 5 Cube-Connected Cycles Hypercube 23
Topologie generiche (2) N = 1024 Type Degree Diameter Ave Dist Bisection Diam Ave D 2D Tree 3 2Log2 N ~2Log2 N 1 20 ~20 4D Tree 5 2Log4 N 2Log4 N - 2/3 1 10 9.33 kD k+1 Logk N 2D fat tree 4 Log2 N N 2D butterfly 4 Log2 N N/2 20 20 Fat Tree CM-5 Thinned Fat Tree
! Topologie gerarchiche • Network regolari di IP eterogenee • Migliori prestazioni energetiche • Scalabilità • Distribuzione modulare delle risorse di connesione • Agevola la distribuzione della computazione
Struttura concettuale connesioni Connessione di IP Nodo di Connessione Isole sincrone in un mare asincrono
Protocolli di instradamento -Routing Statico – Percorsi determinati in fase di compilazione • Data delivery garantito e delay noti a priori -Routing dinamico • Necessari metodi dinamici di determinazione del percorso • Source-based routing: il messaggio specifica il percorso verso la destinazione • Virtual Circuit: percorso determinato in fase di instaurazione della comunicazione • Destination-based routing: il messaggio specifica solo la destinazione, percorso determinato dagli switch in modo • deterministico: il percorso è sempre lo stesso • adattivo: scelta del percorso migliore per evitare congestioni od errori • Randomico: scelta di uno a caso fra I percorsi disponibili
Tecniche di attraversamento • Store-and-forward : ogni switch aspetta che sia ricevuto interamente il pacchetto prima di ritrasmetterlo • Cut-through routing e worm hole routing: lo switch esamina l’header del pacchetto e decide dove instradarlo trasmettendolo immediatamente al prossimo • worm hole routing, quando l’head del messaggio è bloccata il resto rimane distibuito nel network bloccanto potenzialmente altri messaggi • Cut through routing quando l’head è bloccata la trasmissione continua fino a quando il messaggio è interamente bufferizzato nello switch
MIT Raw Architechture Workstation Network diretto IP omogenee Inizialmente solo Netwok Statico Necessaria aggiunta del Network dinamico • · Un router statico • · Due router dinamici che sfruttano la tecnica Wormhole. • · CPU unit • · Quattro unità a virgola mobile munite di pipeline • · 32-Kbyte di data cache • · 96 Kbytes cache per le istruzioni
Performance Variability Cost Figuradi Meritoper NOC Scalability Efficiency Computation Energy consumption Utilisation Storage Fault tolerance Capacity Communication Result quality (accuracy) Functionality Responsiveness Materials Structural Licencing Functional System Quality Production Control Implementation Complexity Development Effort Time Flexibility Modifiability Volume Risk Applicability Coupling Lifetime Cohesion Configurability Manufacturability Programmability Modularity Usability