10 гениальных пылесосов с хорошей всасывающей способностью, сделанных своими руками
May 03, 202310 идей для корзин STEAM и как их использовать в классе
Oct 11, 202312 важных советов, которые должен знать каждый владелец автомобиля
Jul 01, 202314 крутых автомобильных гаджетов для более разумного и безопасного вождения
Aug 21, 202314 крутых автомобильных гаджетов для более разумного и безопасного вождения
Dec 20, 2023Xilinx запускает Versal HBM
Ни для кого не секрет, что мы тонем в данных. Сегодняшние приложения и алгоритмы требуют почти непостижимых объемов данных, а это означает, что требования к пропускной способности растут быстрее, чем могут справиться сетевые технологии и технологии памяти. Даже при наличии самых совершенных ускорителей, которые мы можем построить с помощью наших FPGA, мы можем захлебнуться, пытаясь передать данные на чип и вывести его из него, а также найти места для хранения информации во время ее обработки.
Несмотря на то, что пропускная способность памяти быстро увеличивается, спрос растет быстрее. Распространение зеттабайт информации по всему миру привело к тому, что современные технологии оказались на пределе возможностей. Перенесение критически важных для производительности задач на FPGA не поможет, если системе не хватает пропускной способности памяти.
В то же время все больше и больше этих данных необходимо защищать, и каждый раз, когда данные перемещаются через интерфейс, они становятся уязвимыми.
Что нам нужно, так это переместить память ближе к обработке.
Компания Xilinx сделала большой шаг в направлении локализации памяти, выпустив новую серию устройств ACAP Versal HBM (мы думаем о них как о FPGA). HBM (или память с высокой пропускной способностью) предназначена для размещения в одном корпусе с другими процессорными элементами и взаимодействует через передовую технологию упаковки многослойных кремниевых соединений (SSI). Сохраняя память внутри корпуса, становятся возможными соединения с гораздо более высокой пропускной способностью, а отказ от внешних интерфейсов памяти значительно снижает энергопотребление и задержку интерфейса.
Это далеко не первое родео Xilinx с SSI. Компания была пионером в производстве кремниевых интерпозеров с FPGA много лет назад, и это новое устройство построено на SSI четвертого поколения. Вначале SSI использовался в первую очередь для увеличения эффективной производительности за счет упаковки нескольких микросхем FPGA меньшего размера в один корпус для создания более крупной FPGA. Но сегодня SSI также используется для того, чтобы сделать микросхемы Xilinx более масштабируемыми и универсальными. Например, для создания Versal HBM они просто заменили один чиплет «Super Logic Region» (SLR) на стек HBM2e из своего устройства Versal Premium для создания Versal HBM. (Хорошо, это немного сложнее, но идею вы поняли.)
По сравнению с внешней памятью DDR5 встроенный HBM обеспечивает в 8 раз большую пропускную способность при снижении энергопотребления на 63%. И это очень важно. Размещение стека HBM внутри вашей FPGA дает вам большую пропускную способность памяти, сохраняя при этом бюджет мощности для обработки.
Это не первый раз, когда Xilinx внедряет HBM в одно из своих устройств. Одна из версий их FPGA Virtex Ultrascale+ предыдущего поколения имела встроенный HBM. Однако новый Versal HBM превосходит его по всем осям: пропускная способность памяти в 1,8 раза выше (с 460 Гбит/с до 820 Гбит/с), при снижении энергопотребления на 15 % и в 2 раза больше объём памяти HBM (32 ГБ против 16 ГБ).
Однако Versal HBM имеет гораздо больше, чем просто большую пропускную способность памяти. Они также значительно увеличили размер каналов SerDes для передачи данных на устройство и с него, удвоив общую пропускную способность до умопомрачительных 5,6 Тбит/с. SerDes масштабируется для максимальной гибкости приложений: NRZ 32 Гбит/с для оптимизированных по мощности интерфейсов 100G, PAM4 58 Гбит/с для текущего наращивания и развертывания 400G, а также суперспортивный PAM4 112 Гбит/с для будущего развития сети 800 Гбит/с с оптикой 100G на полосу.
Многие стандартные интерфейсы предварительно созданы и усилены для вас, в том числе масштабируемая полоса пропускания Ethernet 2,4 Тбит/с, обеспечивающая многоскоростную передачу: 400/200/100/50/40/25/10G с FEC и многостандартную: FlexE, Flex-O, eCPRI, FCoE и OTN. Безопасность может быть достигнута быстро благодаря пропускной способности шифрования со скоростью линии 1,2 Тбит/с, обеспечиваемой массовым шифрованием AES-GCM-256/128, MACsec, IPsec, который, по утверждению Xilinx, является «единственным в мире усиленным криптографическим механизмом 400G на адаптируемой платформе».
Если вас беспокоит PCIe, Versal HBM обеспечивает 1,5 Тбит/с совокупной пропускной способности канала PCIe через PCIe Gen5 с DMA, CCIX и CXL (да, сейчас играю за любую команду). Интерфейс PCIe имеет выделенное соединение через программируемую сеть на кристалле (NoC) с памятью.
Таким образом, Versal HBM, очевидно, может выполнять отличную работу по передаче данных на чип и обратно, а также по хранению их в памяти, пока они там находятся. Но как насчет способности выполнять реальную работу?