From dataflow models to energy efficient application specific processors
Hautala, Ilkka (2019-10-11)
https://urn.fi/URN:ISBN:9789526223681
Kuvaus
Tiivistelmä
Abstract
The development of wireless networks has provided the necessary conditions for several new applications. The emergence of the virtual and augmented reality and the Internet of things and during the era of social media and streaming services, various demands related to functionality and performance have been set for mobile and wearable devices. Meeting these demands is complicated due to minimal energy budgets, which are characteristic of embedded devices. Lately, the energy efficiency of devices has been addressed by increasing parallelism and the use of application-specific hardware resources. This has been hindered by hardware development as well as software development because the conventional development methods are based on the use of low-level abstractions and sequential programming paradigms. On the other hand, deployment of high-level design methods is slowed down because of final solutions that are too much compromised when energy efficiency and performance are considered.
This doctoral thesis introduces a model-driven framework for the development of signal processing systems that facilitates hardware and software co-design. The design flow exploits an easily customizable, re-programmable and energy-efficient processor template. The proposed design flow enables tailoring of multiple heterogeneous processing elements and the connections between them to the demands of an application. Application software is described by using high-level dataflow models, which enable the automatic synthesis of parallel applications for different multicore hardware platforms and speed up design space exploration. Suitability of the proposed design flow is demonstrated by using three different applications from different signal processing domains. The experiments showed that raising the level of abstraction has only a minor impact on performance.
Video processing algorithms are selected to be the main application area in this thesis. The thesis proposes tailored and reprogrammable energy-efficient processing elements for video coding algorithms. The solutions are based on the use of multiple processing elements by exploiting the pipeline parallelism of the application, which is characteristic of many signal processing algorithms. Performance, power and area metrics for the designed solutions have been obtained using post-layout simulation models. In terms of energy efficiency, the proposed programmable processors form a new compromise solution between fixed hardware accelerators and conventional embedded processors for video coding.
Tiivistelmä
Langattomien verkkojen kehittyminen on luonut edellytykset useille uusille sovelluksille. Muiden muassa sosiaalisen media, suoratoistopalvelut, virtuaalitodellisuus ja esineiden internet asettavat kannettaville ja puettaville laitteille moninaisia toimintoihin, suorituskykyyn, energiankulutukseen ja fyysiseen muotoon liittyviä vaatimuksia. Yksi isoimmista haasteista on sulautettujen laitteiden energiankulutus. Laitteiden energiatehokkuutta on pyritty parantamaan rinnakkaislaskentaa ja räätälöityjä laskentaresursseja hyödyntämällä. Tämä puolestaan on vaikeuttanut niin laite- kuin sovelluskehitystä, koska laajassa käytössä olevat kehitystyökalut perustuvat matalan tason abstraktioihin ja hyödyntävät alun perin yksi ydinprosessoreille suunniteltuja ohjelmointikieliä. Korkean tason ja automatisoitujen kehitysmenetelmien käyttöönottoa on hidastanut aikaansaatujen järjestelmien puutteellinen suorituskyky ja laiteresurssien tehoton hyödyntäminen.
Väitöskirja esittelee datavuopohjaiseen suunnitteluun perustuvan työkaluketjun, joka on tarkoitettu energiatehokkaiden signaalikäsittelyjärjestelmien toteuttamiseen. Työssä esiteltävä suunnitteluvuo pohjautuu laitteistoratkaisuissa räätälöitävään ja ohjelmoitavaan siirtoliipaistavaan prosessoritemplaattiin. Ehdotettu suunnitteluvuo mahdollistaa useiden heterogeenisten prosessoriytimien ja niiden välisten kytkentöjen räätälöimisen sovelluksien tarpeiden vaatimalla tavalla. Suunnitteluvuossa ohjelmistot kuvataan korkean tason datavuomallien avulla. Tämä mahdollistaa erityisesti rinnakkaista laskentaa sisältävän ohjelmiston automaattisen sovittamisen erilaisiin moniprosessorijärjestelmiin ja nopeuttaa erilaisten järjestelmätason ratkaisujen kartoittamista. Suunnitteluvuon käyttökelpoisuus osoitetaan käyttäen esimerkkinä kolmea eri signaalinkäsittelysovellusta. Tulokset osoittavat, että suunnittelumenetelmien abstraktiotasoa on mahdollista nostaa ilman merkittävää suorituskyvyn heikkenemistä.
Väitöskirjan keskeinen sovellusalue on videonkoodaus. Työ esittelee videonkoodaukseen suunniteltuja energiatehokkaita ja uudelleenohjelmoitavia prosessoriytimiä. Ratkaisut perustuvat usean prosessoriytimen käyttämiseen hyödyntäen erityisesti videonkäsittelyalgoritmeille ominaista liukuhihnarinnakkaisuutta. Prosessorien virrankulutus, suorituskyky ja pinta-ala on analysoitu käyttämällä simulointimalleja, jotka huomioivat logiikkasolujen sijoittelun ja johdotuksen. Ehdotetut sovelluskohtaiset prosessoriratkaisut tarjoavat uuden energiatehokkaan kompromissiratkaisun tavanomaisten ohjelmoitavien prosessoreiden ja kiinteästi johdotettujen video-kiihdyttimien välille.
Original papers
Original papers are not included in the electronic version of the dissertation.
Hautala, I., Boutellier, J., Hannuksela, J., & Silvén, O. (2015). Programmable Low-Power Multicore Coprocessor Architecture for HEVC/H.265 In-Loop Filtering. IEEE Transactions on Circuits and Systems for Video Technology, 25(7), 1217-1230. https://doi.org/10.1109/TCSVT.2014.2369744
Hautala, I., Boutellier J., & Silvén, O. (2016). Programmable 28 nm coprocessor for HEVC/H.265 in-loop filters. IEEE International Symposium on Circuits and Systems (ISCAS), Montreal, QC, 2016, (pp. 1570-1573). https://doi.org/10.1109/ISCAS.2016.7538863
Hautala, I., Boutellier, J., & Hannuksela, J. (2013). Programmable lowpower implementation of the HEVC Adaptive Loop Filter. IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, 2013, (pp. 2664-2668). https://doi.org/10.1109/ICASSP.2013.6638139
Hautala, I., Boutellier, J., Nyländen, T., & Silvén, O. (2018). Toward Efficient Execution of RVC-CAL Dataflow Programs on Multicore Platforms. Journal of Signal Processing Systems, 90(11), 1507–1517. https://doi.org/10.1007/s11265-018-1339-x
Hautala, I., Boutellier, J., & Silvén, O. (in press). TTADF: Power Efficient Dataflow-Based Multicore Co-Design Flow. IEEE Transactions on Computers. https://doi.org/10.1109/TC.2019.2937867
Osajulkaisut
Osajulkaisut eivät sisälly väitöskirjan elektroniseen versioon.
Hautala, I., Boutellier, J., Hannuksela, J., & Silvén, O. (2015). Programmable Low-Power Multicore Coprocessor Architecture for HEVC/H.265 In-Loop Filtering. IEEE Transactions on Circuits and Systems for Video Technology, 25(7), 1217-1230. https://doi.org/10.1109/TCSVT.2014.2369744
Hautala, I., Boutellier J., & Silvén, O. (2016). Programmable 28 nm coprocessor for HEVC/H.265 in-loop filters. IEEE International Symposium on Circuits and Systems (ISCAS), Montreal, QC, 2016, (pp. 1570-1573). https://doi.org/10.1109/ISCAS.2016.7538863
Hautala, I., Boutellier, J., & Hannuksela, J. (2013). Programmable lowpower implementation of the HEVC Adaptive Loop Filter. IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, 2013, (pp. 2664-2668). https://doi.org/10.1109/ICASSP.2013.6638139
Hautala, I., Boutellier, J., Nyländen, T., & Silvén, O. (2018). Toward Efficient Execution of RVC-CAL Dataflow Programs on Multicore Platforms. Journal of Signal Processing Systems, 90(11), 1507–1517. https://doi.org/10.1007/s11265-018-1339-x
Hautala, I., Boutellier, J., & Silvén, O. (in press). TTADF: Power Efficient Dataflow-Based Multicore Co-Design Flow. IEEE Transactions on Computers. https://doi.org/10.1109/TC.2019.2937867
Kokoelmat
- Avoin saatavuus [34184]