Xilinx KCU116: A költséghatékony 100 Gbps sebességű hálózati és tárolási FPGA fejlesztői platform

By Thanaporn Sangpaithoon

A Kintex® UltraScale+™ családot a legjobb ár/teljesítmény/watt arányú TSMC 16 nm FinFET technológiájú FPGA eszköznek tartják a Xilinx® termékei közül. Az új UltraRAM és az új összekapcsolás-optimalizálási technológia (SmartConnect) kombinálásával ez az eszköz a legköltséghatékonyabb megoldást nyújtja olyan alkalmazások számára, amelyek 100 Gbps-os összekapcsoló magokhoz nagy teljesítményű adó-vevő egységeket igényelnek. Ezt a családot kifejezetten hálózati és tárolási alkalmazásokhoz tervezték, ilyenek például a hálózati csomagfeldolgozás és a vezeték nélküli MIMO technológia, a 100 Gbps-os vezetékes hálózat, az ipari és adatközponti hálózatok gyorsítása, valamint az NVMe SSD-k (SSD meghajtók) tárolási műveleteinek gyorsítása. Ez a cikk a Xilinx KCU116 kiértékelő készletén mutatja be a TCP Offload Engine hálózati és NVMe SSD implementációjának 100 Gbps-os megoldását a Design Gateway TOE100G-IP Core eszközének használatával, amely CPU megoldásokhoz 12 GB/s TCP átvitelt biztosít 100 GbE interfészen keresztül, valamint az NVMeG4-IP Core-t, amely hihetetlenül gyors, SSD-nként körülbelül 4 GB/s-os teljesítményt képes elérni.

A Kintex® UltraScale+ KCU116 kiértékelő készlet bemutatása

A KCU116 ideálisan használható a Kintex UltraScale+ kulcsfontosságú jellemzőinek kiértékelésére, különös tekintettel a 28 Gbps-os adó-vevő teljesítményre. Egy XCKU5P-2FFVB676E FPGA eszközre alapozva kiválóan alkalmas prototípusok gyors elkészítésére.

A kártyán található egy 1 GB 32 bites DDR4-2666 RAM modul, FMC bővítő portok 1 x M.2 NVMe SSD-hez, valamint PCIe Gen4 x8 sávok maximum 2 x M.2 NVMe SSD interfészhez. A 16 x 28 Gbps GTY adó-vevő mind a PCIe Gen4, mind a 100 GbE interfész megvalósításához rendelkezésre áll és számos perifériás interfésszel, valamint FPGA logikával is rendelkezik a testre szabott felhasználói fejlesztésekhez.

A Xilinx KCU116 kiértékelő készlet képe (kattintson a nagyításhoz)1. ábra: A KCU116 kiértékelő készlet. (Kép: Xilinx Inc. Inc.)

A KCU116 a Design Gateway IP magjaival együtt mindent biztosít, ami a legkorszerűbb 100 Gbps-os hálózati és tárolási megoldások fejlesztéséhez kell, anélkül, hogy MPSoC támogatásra lenne szükség.

100 Gbps-os hálózati és tárolási megoldások megvalósítása

KCU116-on megvalósított 100 Gbps-os hálózati és tárolási megoldás diagramja2. ábra: KCU116-on megvalósított 100 Gbps-os hálózati és tárolási megoldás. (Kép: Design Gateway)

Bár a Kintex UltraScale+ eszközök nem rendelkeznek olyan MPSoC technológiával, mint a Zynq UltraScale+, a hálózati és NVMe tárolási protokollok feldolgozása a Design Gateway IP Cores megoldásait felhasználva processzorok és operációs rendszer nélkül is megvalósítható:

  1. TOE100G-IP: 100 GbE Full TCP protokoll stack IP Core CPU nélkül
  2. NVMeG4-IP: Önálló NVMe hostvezérlő beépített PCIe Gen4 SoftIP-vel

Mind a TOE100G-IP, mind az NVMeG4-IP képes CPU/OS/Driver nélkül működni. A felhasználói logika a vezérlési és adatútvonalhoz mindkét IP-vel megvalósítható tiszta hardverlogikával vagy a Microblaze bare-metal operációs rendszerével, lehetővé téve a magas szintű alkalmazások és algoritmusok gyorsabb és egyszerűbb fejlesztését anélkül, hogy a bonyolult hálózati és NVMe protokollok miatt kellene aggódni. Ez új lehetőségeket nyit a fejlett rendszerszintű megoldások, például az érzékelőadatok rögzítése, az on-board számítás és a mesterséges intelligencián alapuló Edge computing eszközök számára.

Design Gateway TOE100G-IP UltraScale+ eszközhöz

A TOE100G-IP rendszerek képe3. ábra: TOE100G-IP rendszerek. (Kép: Design Gateway)

A TOE100G IP mag TCP/IP stacket valósít meg (hardwire logikában), amely összekapcsolódik a Xilinx alsó szintű hardverhez tartozó 100 Gb-os Ethernet alrendszer moduljával. A TOE100G IP felhasználói interfésze egy regiszter interfészből áll a vezérlőjelek és egy FIFO interfészből az adatjelek számára. A TOE100G IP-t a 100 Gb-os Ethernet alrendszerhez való csatlakozásra tervezték, amely 512 bites AXI4-ST-t használ a felhasználói interfészhez való csatlakozáshoz. A Xilinx által biztosított Ethernet alrendszer EMAC, PCS és PMA funkciókat tartalmaz. A 100 Gb-os Ethernet alrendszer felhasználói interfészének órajele 322,265625 MHz.

A TOE100G-IP jellemzői

  • Full TCP/IP stack megvalósítása
  • Egy munkamenet támogatása egy TOE100G IP-vel (több munkamenet több TOE100G IP használatával valósítható meg)
  • Szerver és kliens üzemmód támogatása (passzív/aktív nyitás és zárás)
  • Jumbo keret támogatása
  • Egyszerű adatinterfész szabványos FIFO interfészen keresztül
  • Egyszerű vezérlőfelület egyportos RAM interfészen keresztül

Az XCKU5P-2FFVB676E FPGA eszköz FPGA erőforrás-felhasználását az alábbi 1. táblázat mutatja.

Család Példa eszköz Fmax (MHz) CLB regiszterek CLB LUT-k CLB IOB BRAMTile URAM GTY Tervezési eszközök
Kintex-Ultrascale+ XCKU5P-FFVB676-2E 350 12883 17535 3208 - 53 - 4 Vivado2019.1

1. táblázat: Példa megvalósítási statisztikák a Kintex Ultrascale+ eszközre vonatkozóan

A TOE100G-IP további leírását az adatlapja tartalmazza, amely letölthető a Design Gateway weboldaláról.

A Design Gateway NVMe PCIe Gen4 hostvezérlője GTY adó-vevő egységekhez

A Kintex UltraScale+ rendelkezik egy GTY adó-vevővel, amely képes a PCIe Gen4 interfész támogatására, de PCIe Gen4 integrált blokk és ARM processzor nem áll rendelkezésre.

A Design Gateway ezt a problémát az NVMeG4-IP mag kifejlesztésével oldotta meg, amely képes önálló NVMe hostvezérlőként működni, beépített PCIe soft IP-vel és PCIe bridge logikával egyetlen magban. Az NVMe PCIe Gen4 SSD-k elérésének engedélyezése leegyszerűsíti a felhasználói felületet és lehetővé teszi a szabványos funkciók egyszerű használatát anélkül, hogy az NVMe protokollt ismerni kellene.

Az NVMeG4-IP blokkvázlata4. ábra: Az NVMeG4-IP blokkvázlata. (Kép: Design Gateway)

Az NVMeG4-IP jellemzői

  • Képes az alkalmazási réteg, a tranzakciós réteg, az adatkapcsolati réteg és a fizikai réteg egyes részeinek megvalósítására az NVMe SSD eléréséhez CPU vagy külső DDR memória nélkül
  • Xilinx PCIe PHY IP-vel működik, amely 4 sávos PCIe Gen4-ként (256 bites buszinterfész) van konfigurálva
  • 256 kB RAM adatpuffert tartalmaz
  • Hat parancsot támogat: azonosítás, leállítás, írás, olvasás, SMART és kiürítés (opcionálisan további parancsok támogatása is elérhető)
  • A felhasználói órajel frekvenciájának meg kell haladnia a PCIe órajeléét (250 MHz a Gen4 esetében), vagy meg kell egyeznie vele

Az XCKU5P-2FFVB676E FPGA eszköz FPGA erőforrás-felhasználását az alábbi 2. táblázat mutatja.

Család Példa eszköz Fmax (MHz) CLB regiszterek CLB LUT-k CLB IOB BRAMTile URAM GTY Tervezési eszközök
Kintex-Ultrascale+ XCKU5P-FFVB676-2E 300 19214 21960 4382 - 12 8 4 Vivado2019.1

2. táblázat: Példa megvalósítási statisztikák a Kintex Ultrascale+ eszközre vonatkozóan.

Az NVMeG4-IP további leírását az adatlapja tartalmazza, amely letölthető a Design Gateway weboldaláról.

Példa TOE100G-IP implementációra és eredményre a KCU116-on

Az 5. ábra a KCU116-on alapuló referenciaterv áttekintését mutatja a TOE100G-IP implementáció bemutatására. A demó rendszer bare-metal OS Microblaze rendszereket, felhasználói logikát és Xilinx 100 Gb Ethernet alrendszereket tartalmaz.

A TOE100G-IP demó rendszerek blokkvázlata5. ábra: A TOE100G-IP demó rendszerek blokkvázlata. (Kép: Design Gateway)

A demó rendszert úgy tervezték, hogy a TOE100G-IP működését kliens és szerver üzemmódban is ki tudja értékelni. A tesztlogika lehetővé teszi az adatok tesztmintával történő küldését és fogadását a lehető legnagyobb adatsebesség elérése érdekében a felhasználói interfész oldalán. A KCU116-tal megvalósított 100 GbE interfészhez négy SFP+ adó-vevőre (25GBASE-R) és optikai kábelre van szükség a 6. ábrán látható módon.

A KCU116-on megvalósított TOE100G-IP demó környezet képe6. ábra: KCU116-on megvalósított TOE100G-IP demó környezet. (Kép: Design Gateway)

Az 100G és a többi (1G/10G/25G/40G) összehasonlításának teszteredményeit a 7. ábra mutatja.

A TOE100G-IP teljesítményének összehasonlítása az 1G/10G/25G/40G teljesítményével a KCU116-on7. ábra: A TOE100G-IP teljesítményének összehasonlítása az 1G/10G/25G/40G teljesítményével a KCU116-on. (Kép: Design Gateway)

A teszteredmény azt mutatja, hogy a TOE100G-IP körülbelül 12 GB/s TCP átviteli sebesség elérésére képes.

Példa NVMeG4-IP implementációra és eredményre a KCU116-on

Az 8. ábrán a KCU116-on alapuló referenciaterv áttekintése látható az 1CH NVMeG4 implementáció bemutatására. Nagyobb tárolási teljesítmény elérése érdekében lehetőség van az NVMeG4-IP több példányának implementálására, ha az FPGA erőforrások rendelkezésre állnak a testreszabott felhasználói tervből.

Az NVMeG4-IP referenciaterv további részleteiért olvassa el a Design Gateway weboldalán található NVMeG4-IP referenciaterv című dokumentumot.

Az NVMeG4-IP referenciaterv áttekintő diagramja8. ábra: Az NVMeG4-IP referenciaterv áttekintése. (Kép: Design Gateway)

A demó rendszer célja adatok írása/ellenőrzése NVMe SSD-vel a KCU116-on. A felhasználó egy soros konzolon keresztül vezérli a tesztműveletet. Ahhoz, hogy az NVMe SSD csatlakoztatható legyen a KCU116-hoz, a 9. ábrán látható AB18-PCIeX16 adapterkártyára van szükség.

A KCU116-on megvalósított NVMeG4 demó környezet képe (kattintson a nagyításhoz)9. ábra: KCU116-on megvalósított NVMeG4 demó környezet. (Kép: Design Gateway)

A 10. ábra a demó rendszer KCU116-on történő futtatási példájának eredményét mutatja, 512 GB-os Samsung 970 Pro használata mellett.

NVMe SSD írási/olvasási teljesítményének grafikonja a KCU116-on Samsung 970 PRO S használata mellett10.ábra: NVMe SSD írási/olvasási teljesítménye a KCU116-on Samsung 970 PRO S használata mellett. (Kép: Design Gateway)

Összegzés

Mind a TOE100G-IP, mind az NVMeG4-IP Core megoldást nyújt a KCU116 kártya 100 Gbps csatlakozási képességének kihasználására hálózati és NVMe tárolási alkalmazások megvalósításához. Egy TOE100G-IP körülbelül 12 GB/s TCP átviteli sebességre képes 100 GbE-n keresztül. Az NVMeG4-IP nagyon nagy teljesítményű tárolást biztosít az NVMe PCIe Gen4 révén, SSD-nként körülbelül 4 GB/s sebességgel. Az NVMeG4-IP több példánya RAID0 vezérlő kialakítására használható, így növelhető a tárolási teljesítmény a 100 GbE átviteli sebességhez igazodva.

A KCU116 kiértékelő készlet és a Design Gateway hálózati és tárolási IP-megoldásai a lehető legnagyobb teljesítmény elérését teszik lehetővé a lehető legkevesebb FPGA-erőforrás felhasználása mellett egy nagyon költséghatékony, Xilinx® Kintex UltraScale+® eszközön alapuló megoldás vagy termék létrehozásához.

A TOE100G-IP-re és az NVMeG4-IP-re vonatkozó további részletek, az adatlap, a rendelkezésre álló referenciaterv és a demó környezet beállítása a Design Gateway weboldalán találhatók:

https://dgway.com/TOE100G-IP_X_E.html

https://dgway.com/NVMeG4-IP_X_E.html

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

About this author

Image of Thanaporn Sangpaithoon

Thanaporn Sangpaithoon

Thanaporn Sangpaithoon has been working at Design Gateway Co., Ltd. since 2001. He has been involved in FPGA design projects and successfully developed Serial ATA IP Core on Xilinx Virtex-4 in 2006. Now he is General Manager, responsible for sales and business development.