Компания Tachyum выпустила 1600-страничное руководство по оптимизации производительности своего оборудования Prodigy Universal Processor FPGA. Несмотря на то что компания еще не выпустила свои процессоры Prodigy после многолетних задержек, она выпустила руководство по оптимизации производительности чипов, которые имеют уникальную архитектуру набора команд и стратегии оптимизации, задолго до того, как реальные продукты начнут поступать в продажу или выйдут на рынок.
Универсальный процессор Prodigy неоднократно сталкивался с задержками с момента своего появления. Первоначально планировалось выпустить его в 2019 году и запустить в 2020-м, но сроки неоднократно сдвигались: с 2021-го на 2022-й, затем на 2023-й и на 2024-й. В начале этого года Tachyum еще раз обновила свои планы, заявив, что выпустит чип в 2025 году, тем самым отложив выборку эталонных серверов, намеченную на первый квартал следующего года. Хотя формально компания по-прежнему планирует начать массовое производство своих процессоров Prodigy в 2025 году, пока неясно, сможет ли она завершить все необходимые этапы (выпуск, отладка, сэмплирование, начало массового производства) всего за один год.
Дизайн Prodigy от Tachuym включает 192 пользовательских 64-битных вычислительных ядра, основанных на совершенно новой микроархитектуре, которая, как утверждается, одинаково хорошо подходит как для вычислений общего назначения, так и для высокопараллельных вычислений в области искусственного интеллекта и высокопроизводительных вычислений.
В частности, в ISA включены обширные векторные и матричные инструкции для решения задач искусственного интеллекта и супервычислений, а новое руководство по оптимизации производительности включает рекомендации по разработке программного обеспечения для ИИ и HPC.
Архитектура набора инструкций (ISA) Prodigy сочетает в себе элементы RISC- и CISC-проектов; по словам Tachyum, ISA позволяет избежать сложных, длинных и неэффективных инструкций переменной длины, обычно встречающихся в традиционных CISC-процессорах. Все инструкции стандартизированы до 32 или 64 бит, а некоторые включают функции доступа к памяти для дальнейшего увеличения производительности.
ПЛИС Prodigy от Tachuym оснащена встроенными счетчиками производительности, которые позволяют отслеживать и анализировать события во время выполнения в режиме реального времени. По словам компании, эти инструменты позволяют программистам и инженерам выявлять узкие места и оптимизировать код для повышения эффективности, что делает процессор идеальным для сложных вычислительных задач.
В руководстве приведены конкретные методы оптимизации, в том числе управление ограничениями диспетчеризации, улучшение процедур работы с памятью, выравнивание ветвлений и инструкций, а также смягчение проблем с пересылкой регистров.
Кроме того, в руководстве содержатся рекомендации по работе с кэш-памятью, выравниванию загрузки/сохранения и доступу к специальным регистрам, что позволяет разработчикам точно настроить программное обеспечение для достижения максимальной производительности.
«Программисты, инженеры-испытатели, разработчики компиляторов, систем и решений оценят возможность глубоко погрузиться в изучение того, как Prodigy предлагает неотъемлемые преимущества производительности для эффективной обработки рабочих нагрузок ИИ, облачных и высокопроизводительных вычислений», - говорит д-р Радослав Даниляк, основатель и генеральный директор Tachyum. «Интегрированные функции Prodigy помогут пользователям достичь лучшей в отрасли эффективности вычислений, чтобы быстрее получать знания, быстрее проводить исследования и быстрее генерировать результаты».
Оригинал
Уникальность