Nagy teljesítményű és jó hatásfokú mesterséges intelligencia és gépi tanulás gyors megvalósítása a Renesas RA8M1 mikrovezérlő termékcsalád segítségével
Contributed By DigiKey's North American Editors
2024-03-20
A mesterséges intelligencia (MI vagy az angol artificial intelligence kifejezésből alkotott betűszóval AI), a gépi tanulás (ML, machine learning) és a dolgok internete (IoT, Internet of Things) alkotta hálózat peremén lévő helyi gépeken jelentkező más számításigényes munkaterhelések terjedése kimondottan nagy feldolgozási terhet ró a mikrovezérlőkre (MCU, microcontroller unit). Ezeknek az új munkaterheléseknek a kezelése növeli a fogyasztást, miközben a tervezőktől azt várják, hogy csökkentsék a fogyasztást minél kisebbre, és rövidítsék le a piacra kerülés idejét is.
A tervezőknek olyan számítási lehetőségre van szükségük, amely megtartja a mikrovezérlő hatásfokát, ugyanakkor kifejezetten a kis fogyasztású felhasználási módokra szabott nagy teljesítményű funkciókkal egészíti ki a mikrovezérlőt. Ennek a lehetőségnek meg kell őriznie a hagyományos mikrovezérlőkre jellemző egyszerű kiépítési módokat, ugyanakkor elegendő pluszfunkcióra kell alkalmasnak lennie, hogy támogassa a mesterséges intelligencia és a gépi tanulás által lehetővé tett kifinomult felhasználási módokat, például a hangvezérlést és a megelőző karbantartást.
Ez a cikk a mesterséges intelligencia és a gépi tanulás iránti keresletet ösztönző tényezőket tárgyalja, és elmagyarázza, miért van szükség új felépítésű processzorokra ahhoz, hogy ezeket a képességeket hatékonyan lehessen megvalósítani. Ezután bemutatja a Renesas RA8M1 mikrovezérlő termékcsaládját, és ismerteti, hogyan használható az ezeknek a követelményeknek a teljesítésére.
A helyi gépeken használt mesterséges intelligencia és a gépi tanulás által támasztott követelmények
A mesterséges intelligencia és a gépi tanulás iránti kereslet a dolgok internetére kapcsolódó eszközökben egyre nő, az épületautomatizálástól kezdve az ipari eszközökön át az otthoni készülékekig. Még a viszonylag kis teljesítményű, kis fogyasztású beágyazott rendszerekre is olyan feladatokat bíznak, mint a kulcsszavak felismerése, a hangutasításos vezérlés és a hang- és képfeldolgozás. A célalkalmazások közé tartoznak az érzékelőközpontok, a drónok navigációja és vezérlése, a kiterjesztett valóság (AR, augmented reality), a virtuális valóság (VR, virtual reality) és a távközlési berendezések.
Az energiafelhasználás, a járulékos (meddő) terhelések és a késleltetés minimálisra csökkentése, valamint az adatvédelem biztosítása érdekében a felhőbe küldéssel szemben gyakran előnyben részesítik az adatok helyi eszközökön történő feldolgozását. Ez komoly kihívást jelent a tervezők számára, mivel a helyi eszközök gyakran szűkében vannak az erőforrásoknak, különösen, ha akkumulátorról működnek.
Továbbfejlesztett mikrovezérlők a helyi eszközökön végzett számításokhoz
A mesterséges intelligencia és a gépi tanulás jelentette munkaterhelés jellemzően ugyanazon matematikai művelet sokszor ismételt végrehajtását jelenti egy nagy adathalmazon. Ezek a munkaterhelések alkalmasak arra, hogy SIMD (single instruction, multiple data, egyutasításos, többadatos) feldolgozással gyorsítsuk őket. Az egyutasításos, többadatos feldolgozás során a processzor több matematikai műveletet hajt végre párhuzamosan, ami a hagyományos feldolgozásnál lényegesen nagyobb teljesítményt és jobb hatásfokot tesz lehetővé.
Mivel a hagyományos mikrovezérlők nem rendelkeznek SIMD funkciókkal, segítségre van szükségük a mesterséges intelligencia és a gépi tanulás jelentette munkaterhelések végrehajtásához. Az egyik megoldás, ha a digitális jelfeldolgozó processzort (DSP, digital signal processor) vagy más SIMD-gyorsítókat használunk a mikrovezérlő mellett. Ez a többprocesszoros kialakítás azonban bonyolultabbá teszi a rendszertervezést.
Egy másik lehetőség a SIMD képességekkel ellátott nagyobb teljesítményű mikroprocesszorokra (MPU, microprocessor unit) váltás. Ezek egyprocesszoros környezetben is képesek a szükséges teljesítményt nyújtani, de a mikroprocesszorok esetében kompromisszumot kell kötni a fogyasztás és a funkciókészlet között. Például nem minden mikroprocesszort terveztek úgy, hogy a mikrovezérlőre épülő készülékekben megkövetelt determinisztikus, kis késleltetésű számításokat végezzen.
A mesterséges intelligencia és a gépi tanulás lehetővé tétele a mikrovezérlőkben
A Renesas felismerte, hogy a mesterséges intelligencia és gépi tanulás jelentette munkaterhelések támogatásához szükség van egy optimalizált mikrovezérlő termékcsaládra, ezért kifejlesztette az RA8M1 mikrovezérlő-sorozatot (1. ábra). A sorozat a Helium és TrustZone funkcióval ellátott ARM® Cortex®-M85 processzorra épül. Ezek a mikrovezérlők 480 MHz-es órajellel működnek, jellemzően 225 µA/MHz fogyasztás mellett.
1. ábra: A Renesas RA8M1 mikrovezérlő az ARM Cortex-M85 processzormagon alapul, és el van látva a mesterséges intelligencia és gépi tanulás feldolgozásának felgyorsítására szolgáló Helium technikával (ábra: Renesas)
A jó hatásfokúra és kis fogyasztásúra tervezett RA8M1 mikrovezérlők olyan funkciókkal vannak ellátva, mint a determinizmus, a rövid megszakítási idő és a legkorszerűbb energiagazdálkodás. A processzor MHz-enként 6,39 CoreMark-pontos (CoreMark/MHz) hatásfokot ér el.
A Helium egy SIMD MVE (M-Profile Vector Extension, M-profilos vektorgrafikus bővítés) nevű technika, amely jelentősen felgyorsítja a jelfeldolgozást és a gépi tanulást. Ez 150 skaláris és vektoros utasítással egészíti ki az utasításkészletet, és lehetővé teszi a 128 bites regiszterek feldolgozását (2. ábra). A technika a szűkös erőforrású, kisebb fogyasztású mikrovezérlőkhöz van optimalizálva. A Helium például a lebegőpontos egység (FPU, floating-point unit) regisztereit használja újra ahelyett, hogy új SIMD-regisztereket venne igénybe. Ez segít csökkenteni a processzor fogyasztását és a tervezés bonyolultságát.
2. ábra: A Helium technika a vektoros jelfeldolgozáshoz újra felhasználja a lebegőpontos egység regiszterbankját (ábra: ARM)
Amint a 3. ábrán látható, az RA8M1 Cortex-M85 processzora tartalmazza az ARM TrustZone technikáját. A TrustZone hardveres elkülönítést nyújt a kritikus firmware, az eszközök és a bizalmas adatok számára. A Cortex-M85 emellett új biztonsági és védelmi képességekkel is bővült, ilyen például a PACBTI (pointer authentication and branch target identification, mutatóhitelesítő és elágazásicél-azonosító) bővítmény. Ezek a biztonsági funkciók különösen a mesterséges intelligenciás környezetben értékesek, ahol az eszköz személyes adatokkal kerülhet kapcsolatba.
3. ábra: A Cortex-M85 TrustZone hardveres elkülönítést nyújt a kritikus firmware, az eszközök és a bizalmas adatok számára (ábra: ARM)
A mesterséges intelligencia használatára képes mikrovezérlőkben szükséges hardverjellemzők
A mikrovezérlőnek a mesterséges intelligencia támogatásához hatékony funkciókészlettel kell kombinálnia a jó hatásfokot. Az RA8M1 felszereltsége kiválóan alkalmas például a villanymotor-vezérléshez, a programozható logikai vezérlőegységekhez (PLC), a mérésekhez és az ipari és a dolgok internetéhez kapcsolódó egyéb felhasználási területekhez.
A mesterségesintelligencia-algoritmusok például sok memóriát igényelnek. Az RA8M1 rendszermemóriája legfeljebb 2 MB flashmemóriából és 1 MB SRAM memóriából áll. Az SRAM 128 kB szorosan csatolt memóriát (TCM, tightly coupled memory) tartalmaz, amely gyors memóriaelérést tesz lehetővé a nagy teljesítményű számításokhoz.
A megbízható működés érdekében a felhasználói SRAM-ból 384 kB és mind a 128 kB TCM memória ECC (hibajavító kód, error correction code) memóriaként van beállítva. A 32 kB-os utasítás- és adatgyorsítótárak szintén ECC-védelemmel vannak ellátva.
Az RA8M1 több biztonsági funkciót is tartalmaz az ARM processzormagban foglaltakon kívül. Ezek közé tartozik az RSIP (Reprogrammable Secure Intellectual Property, újraprogramozható biztonságos szellemi tulajdon) titkosítómotor a biztonságos adatfeldolgozáshoz, a kritikus adatok védelmét szolgáló felülírhatatlan tárhely és az illetéktelen hozzáférés ellen védő mechanizmusok.
Ami a kommunikációs illesztőfelületeket illeti, a mikrovezérlő a hálózati csatlakoztathatósághoz Ethernet-, a gépjárműipari és ipari felhasználási területekhez CAN FD-, az általános csatlakoztathatósághoz pedig nagy sebességű vagy teljes sebességű USB illesztőfelületet használ. El van látva kamera-illesztőfelülettel, valamint a külső memóriához egy menet közbeni titkosítást végző nyolccsatornás SPI (Serial Peripheral Interface, soros perifériás illesztőfelület) illesztőfelülettel is.
Az analóg eszközök között találhatók 12 bites analóg–digitális átalakítók (ADC), digitális–analóg átalakítók (DAC) és nagy sebességű analóg komparátorok, valamint három mintavételező és tartóáramkör is. A soros kommunikációhoz az RA8M1 többféle protokollt támogat, többek közt az SCI-t (Serial Communication Interface, soros kommunikációs illesztőfelületet) SPI-vel, az UART-ot (Universal Asynchronous Receiver/Transmitter, univerzális aszinkron adó-vevő) és a I²C-t (Inter-Integrated Circuit, integrált áramkörök közötti illesztőfelület). A mikrovezérlő az I3C (Improved Inter-Integrated Circuit, továbbfejlesztett integrált áramkörök közötti illesztőfelület) révén nagyobb adatátviteli sebességet és hatásfokot is kínál.
Azok a fejlesztők, akiknek teljes hozzáférésre van szükségük ezekhez a be- és kimeneti (I/O) képességekhez, használhatnak olyan BGA (ball grid array, gömblábas rácselrendezésű) tokozású eszközt, mint a 224 lábú, R7FA8M1AHECBD#UC0 jelű mikrovezérlő. Azok, akik egyszerűsíteni szeretnék a nyomtatott áramköri lap (nyák) tervezési és összeszerelési folyamatát, megfontolhatják egy LQFP (low-profile quad flat package, lapos, négyoldalas lábkiosztású) tokozású eszköz, például a 144 lábú, R7FA8M1AHECFB#AA0 jelű mikrovezérlő használatát.
Fejlesztési környezetek mesterséges intelligenciás felhasználási területekre
Az RA8M1 sorozattal való kísérletezés iránt érdeklődő tervezők kezdhetik a termékcsaláddal való ismerkedést az EK-RA8M1 R7FA8M fejlesztőkártyával (4. ábra). Ez a kártya tartalmaz egy RJ45 RMII Ethernet-csatlakozót, egy nagy sebességű USB gazda- és eszközcsatlakozót, valamint egy háromérintkezős CAN FD-csatlakozót. Memóriaként 64 MB-nyi nyolccsatornás SPI flashmemóriával van ellátva.
4. ábra: Az EK-RA8M1 fejlesztőkártya sokféle be- és kimenettel (I/O) van ellátva az RA8M1 mikrovezérlővel való kísérletezéshez (kép: Renesas)
Az RA8M1 sorozathoz használható a Renesas Flexible Software Package (FSP) szoftvercsomag, egy olyan átfogó keretrendszer, amelyet úgy terveztek, hogy felhasználóbarát, méretezhető és kiváló minőségű szoftveralapot biztosítson a beágyazott rendszerekhez.
A csomag többféle fejlesztőeszközt kínál, köztük a népszerű Eclipse beépített fejlesztőkörnyezeten (IDE, integrated development environment) alapuló e² studio IDE-t. Két díjmentesen használható, kiváló minőségű valós idejű operációs rendszert is tartalmaz, ezek az Azure RTOS és a FreeRTOS.
A szoftvercsomagban olyan kis méretű, tömeggyártásra kész illesztőprogramok is találhatóak, amelyek támogatják a beágyazott rendszerek általános használati módjait. A fejlesztőkártyával együtt ezek az illesztőprogramok lehetővé teszik, hogy a fejlesztők gyorsan elkezdhessenek kísérletezni az RA8M1 be- és kimeneti lehetőségeivel.
Összegzés
Az RA8M1 új lehetőséget kínál a fejlesztőknek a mesterséges intelligencia és a gépi tanulás jelentette munkaterhelések megvalósítására a dolgok internetére kapcsolódó eszközökben, amivel energiát lehet megtakarítani, növelhető a teljesítmény, csökkenthető a tervezés bonyolultsága, és lerövidíthető a piacra kerülési idő.
Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

