NoC Interconnect Fabric IP улучшает мощность, производительность и площадь SoC

Чарли Янак (президент и генеральный директор), Моника Танг (менеджер по разработке приложений)
Arteris

Представьте, что вы определили структуру системы на кристалле, и теперь вам нужно собрать все блоки IP и заставить их взаимодействовать на кристалле. Вы провели месяцы, тщательно выбирая SoC IP, который отражает желаемую функциональность чипа. Однако без встроенной соединительной матрицы это просто набор изолированных блоков. Блоки становятся окончательной архитектурой SoC только путем добавления коммуникационных путей. Именно внутрисхемное межсоединение и качество обслуживания, коммуникационные функции и топология в конечном итоге реализуют архитектуру, структуру и возможности системы на кристалле.

Именно внутрисхемное межсоединение и качество обслуживания, коммуникационные функции и топология в конечном итоге реализуют архитектуру, структуру и возможности системы на кристалле

Практически все производственные мобильные и многопроцессорные системы большого объема сегодня используют технологию «сеть на кристалле» (NoC). Это потому, что это самый эффективный способ обеспечения связи блоков SoC. Возрастающая сложность SoC обусловила принятие межсоединений NoC. Сложность SoC продвинулась в нескольких измерениях:

  • Меньшие критические размеры:
    • Новый дизайн SoC начинается в 40-нм, сужаются, 28-нм и 16/14-нм популярны, а некоторые текущие основные проекты в настоящее время ведутся в 10-нм и 7-нм.
    • Плотность увеличивается в 25 раз между 65 и 10 нм, достигая 16 м ворот / мм2.
    • Размер матрицы, как правило, остается неизменным при уменьшении размера узла, что означает, что с каждым изменением узла процесса в среднем SoC размещается больше IP.
  • Количество IP-блоков увеличивается до нескольких сотен для передовых SoC.
    • Матрица 8 мм х 8 мм имеет теоретическую пропускную способность в миллиард затворов в 10 нм.
  • Небольшие SoCs усложнили управление питанием, поскольку приложения IoT требуют нескольких недель или даже месяцев работы от батареи.
  • Требования к скорости соединения IP в некоторых приложениях увеличились до более 1 ГГц.
    • Множество взаимосвязанных путей NoC необходимы для удовлетворения высоких требований к пропускной способности данных.

Это усложнение привело к расширению общеотраслевого внедрения NoC Interconnect IP из-за присущих ему архитектурных преимуществ в энергопотреблении, производительности и площади по сравнению с традиционными технологиями межблочных и шинных межсоединений. Эти преимущества позволяют архитекторам и дизайнерам SoC справляться с растущей сложностью гетерогенных архитектур, одновременно снижая затраты на исследования и разработки, а также удельные затраты.

В середине 2000-х годов компания Arteris впервые внедрила IP-соединение для NoC-соединений и имеет значительный опыт, помогая пользователям повысить производительность, мощность и профили площади своих SoC. Кроме того, пользователи запросили и получили сотни функций, необходимых для эффективного проектирования различных типов дифференцированных SoC, начиная от самых дешевых и заканчивая самыми сложными.

Кроме того, пользователи запросили и получили сотни функций, необходимых для эффективного проектирования различных типов дифференцированных SoC, начиная от самых дешевых и заканчивая самыми сложными

Рисунок 1. IP-соединение Arteris FlexNoC предоставляет сотни функций для оптимизации пользовательских конструкций SoC.

Целью многих из этих функций является повышение мощности, производительности и площади (PPA) IP-адреса межсоединения для достижения как результатов исследований и разработок, так и экономии затрат на единицу продукции. Они также могут помочь повысить производительность сборки SoC IP. Изучив некоторые характеристики мощности, производительности и площади IP-соединения NoC, вы поймете, как были достигнуты эти улучшения.

Потребляемая мощность

Технология NoC обеспечивает более чем 7-кратное снижение энергопотребления в режиме ожидания по сравнению с гибридной шиной или межблочной связью. Вот почему:

Существует три типа питания, которые определяют срок службы батареи и рассеивание тепла: активная мощность, мощность тактового генератора и мощность утечки.

Существует три типа питания, которые определяют срок службы батареи и рассеивание тепла: активная мощность, мощность тактового генератора и мощность утечки

Рисунок 2: Часы постоянно переключаются, а данные периодически переключаются.

Активное питание используется процессорами, графическими процессорами, мультимедийными подсистемами, подсистемами связи и другими IP-адресами, когда они заняты и генерируют трафик данных. Режимы работы варианта использования и наборы данных определяют, работают ли эти устройства на пиковых уровнях или на пониженных частотах и ​​уровнях напряжения.

Рисунок 3: Активная мощность потребляется логикой тракта данных.

Питание тактового дерева потребляется IP-блоками, когда они включены и синхронизируются, независимо от уровня их активности и от того, заняты ли они обработкой данных.

IP межсоединения существенно влияет на энергопотребление дерева тактовых импульсов, которое имеет тенденцию доминировать над активной мощностью как часть общей мощности, потребляемой системой, усредненной за длительные периоды времени. Питание SoC не просто зависит от того, включены ли IP-адреса. Различные части SoC становятся активными в различных случаях использования, в результате чего комбинации блоков IP потребляют в диапазоне только от полной активной мощности и мощности тактового дерева.

Рисунок 4: Мощность тактового дерева потребляется каждым тактом до каждого триггера.

Мощность утечки потребляется каждым транзистором в микросхеме, когда он включен. Логические ячейки LVT (Low Voltage Threshold) работают быстро, но имеют большую утечку, чем ячейки других типов. Многие конструкции микросхем используют комбинацию ячеек и выбирают ячейки LVT только для тех путей, которые испытывают трудности с соблюдением требований по времени. Один из способов NoC IP помогает минимизировать мощность утечки - это позволяет чипу требовать меньше ячеек LVT. NoC делает это, выбирая оптимальные физические местоположения стадий трубопровода в плане здания матрицы. Оптимальное физическое расположение ступеней трубы позволяет избежать емкости провода и большой задержки распространения, что создает проблемные пути синхронизации.

Оптимальное физическое расположение ступеней трубы позволяет избежать емкости провода и большой задержки распространения, что создает проблемные пути синхронизации

Рисунок 5: Транзисторы постоянно протекают.

Во время высокой пропускной способности обработки данных в процессорах и графических процессорах энергопотребление при утечке сводится к минимуму, если процессор работает как можно быстрее для выполнения своей задачи перед выключением питания. Чтобы достичь этого, ключевым для NoC является обеспечение требуемой высокой пропускной способности. Когда задача обработки завершена, NoC становится механизмом для безопасного отключения секций домена питания SoC, поскольку они не нужны. В сочетании с контроллером питания SoC межсоединение NoC является активным участником снижения активной мощности.

Например, IP-адрес соединения FlexNoC от Arteris сам по себе не находится в своем домене питания. Он находится в областях мощности IP-адресов в SoC и позволяет автоматически создавать и настраивать адаптеры области мощности и асинхронные пересечения тактовой области внутри самой логики межсоединений. Правильная обработка выключения и отключения IP имеет решающее значение с точки зрения межсоединения. Сообщения могут продолжаться между активными блоками, но не должны передаваться в блокированные IP-блоки. Обеспечение безопасного отключения питания помогает программистам добиться максимального снижения мощности, например, в случаях использования сверхнизкого энергопотребления, которые требуются чипам IoT для продления срока службы батареи.

Обеспечение безопасного отключения питания помогает программистам добиться максимального снижения мощности, например, в случаях использования сверхнизкого энергопотребления, которые требуются чипам IoT для продления срока службы батареи

Рисунок 6: NoC охватывает домены питания всех IP-адресов в SoC и автоматизирует отключение.

Благодаря эффективному управлению областью питания питание тактового генератора является основным фактором, определяющим время автономной работы и выработки тепла для SoC мобильных устройств, потребителей, IoT, серверов и массивов хранения. Принимая во внимание, что логические элементы способствуют утечке, регистр триггеров и емкость провода определяют мощность тактового дерева. Важно спроектировать с минимальным избыточным состоянием регистра и минимальной длинной проводной маршрутизацией в плане здания для любых заданных функций SoC. Провода стоят буферных ячеек. Каждый провод требует большой буфер каждые 100 микрон или около того, чтобы справиться с растущими эффектами RC.

Часы Строб

Другим ключевым аспектом, который значительно уменьшает тактовое дерево и мощность регистров, является стробирование тактовых импульсов. Желательно не переключать провода дерева часов дважды за такт, когда методы управления часами могут обнаружить, что регистры не будут переключаться. Усовершенствованный NoC IP поддерживает три уровня стробирования тактовых импульсов, чтобы значительно снизить энергопотребление. На уровне ячеек синтезирующие ворота проваливаются так, что листья часового дерева не переключаются. Эта логика стробирования часов локализована в небольших группах флопов, и ее применение ограничено областью дополнительной логики стробирования тактовых импульсов. NoC контролирует целые ветви дерева часов на уровне единиц. Каждый блок, когда не обрабатывает пакет, полностью синхронизирован. Только части NoC, которые обрабатывают данные, получают фронты тактового сигнала. Эти методы покрывают большую часть дерева часов, но являются автоматическими и не зависят от программного обеспечения. На самом высоком уровне программное обеспечение может использовать устройства, которые поддерживают отключение питания, чтобы обеспечить безопасное соединение всего дерева тактовых импульсов с большими частями NoC. Это не дает преимущества устранения утечки энергии, как это делают методы отключения питания, но позволяет намного быстрее активировать режим с низким энергопотреблением.

Стробирование синхронизации «на лету» включается в пределах тактового цикла, поэтому негативное влияние на пропускную способность и задержку не возникает. В результате, большая часть логики межсоединений отключается, даже когда процессор работает в режиме DRAM. Эти функции значительно сокращают тактовое дерево и регистрируют мощность.

Потребление мощности утечки ухудшается из-за места и места перегрузки проводов, что приводит к более высокой емкости проводов на элемент и, следовательно, требует наличия элементов с высокой скоростью / высокой утечкой. Гибридные шины и перекладины используют большие централизованные маршрутизаторы, которые вызывают перегруженность в макете. Виртуальные канальные сети добавляют бесполезные островки буферов и логику управления потоком. Напротив, логика межсоединений NoC распределена, устраняя точки перегрузки и уменьшая потребление энергии утечки. Кроме того, он позволяет настраивать каждую ссылку отдельно для оптимального качества обслуживания. В целом, функции NoC значительно снижают энергопотребление SoC.

Производительность, пропускная способность и задержка

Технология NoC позволяет разработчикам оптимизировать SoC для трех часто конкурирующих показателей: частоты в несколько гигагерц, управляемая задержка для всех IP-соединений NoC и масштабируемая пропускная способность для отдельной трассировки. Следующие уникальные аспекты технологии NoC позволяют эту оптимизацию:

Пакетные коммуникации . Запросы и ответы на транзакции пакетируются по IP-интерфейсам, что позволяет NoC работать на более высоких частотах, чем гибридная шина или традиционная перекрестная шина, и обеспечивает более высокую пропускную способность для каждого провода. Максимальная частота ограничена только физическими ограничениями потрясающих технологических процессов. Один NoC работал на частоте 1,6 ГГц в популярной микросхеме, изготовленной по технологии 28-нм TSMC HPM.

Масштабируемая пропускная способность . Наличие именно той полосы пропускания, которая требуется для конкретного приложения и режима, является весьма желательной функцией. Это означает проектирование чипа для использования минимальных аппаратных ресурсов проводов, шлюзов и регистров для достижения цели по пропускной способности. Некоторые соединения нуждаются в очень высокой пропускной способности и могут использовать до 1024 битных каналов. Соединения, работающие на частоте 1,6 ГГц по 1024-битным каналам, обеспечивают более 1 терабайта полосы пропускания на соединение. Высокопроизводительные игровые и автоматизированные системы помощи при вождении (ADAS) часто требуют такого уровня высокой пропускной способности. Большинство типов систем предъявляют более типичные требования к полосе пропускания и используют 32-, 64- и 128-битные соединения, в то время как для некоторых требуется только небольшая полоса пропускания, достаточная для 8- и 16-битных соединений.

Контролируемая задержка . Для межсоединения Arteris NoC требуется один цикл или меньше для пакетирования, чтобы получать транзакции в эффективную транспортную сеть. Задержка логики пакетирования практически несущественна и приносит неплохие дивиденды благодаря способности работать на быстрой транспортной сети.

Задержка логики пакетирования практически несущественна и приносит неплохие дивиденды благодаря способности работать на быстрой транспортной сети

Рисунок 7: CPU to DRAM - наиболее чувствительный к задержкам путь в SoC.

Функция NoC с нулевой задержкой размещает заголовок пакета параллельно с полезной нагрузкой, чтобы исключить любые потери задержки заголовка. Эта возможность используется выборочно для отдельных чувствительных к времени ожидания соединений. Напротив, гибридные шины несут управляющую и адресную информацию вместе с данными для каждого соединения. Поскольку гибридные шины имеют несколько уровней, большие перемычки и больше логики, их общая задержка хуже, чем у NoC. Однако существуют соединения, нечувствительные к задержке, такие как ввод-вывод, которые используются только при поднятии SoC. Для этих типов соединений задержка не является критической, и поэтому возможно сохранение проводов. 8-битный тракт, который обрабатывает заголовки пакетов и полезные нагрузки в течение нескольких циклов, торгует задержкой для сохранения проводов. Эффективный межсоединение NoC IP обеспечивает широкий диапазон компромиссов между высокой частотой, пропускной способностью и количеством используемых проводов.

Die Area

Технология NoC предлагает уменьшение размера матрицы от 1 до 4 мм в квадрате по сравнению с гибридными шинами или другими неэффективными реализациями межсоединений.

Поскольку межкомпонентные соединения NoC сериализуют связь в настраиваемую ширину шины, они направляют большую пропускную способность пакета по небольшому количеству проводов. Пропускная способность является гибкой и управляется путем настройки подходящей ширины в битах от 8 бит для IP-адресов ввода-вывода до 1024 бит на верхнем уровне. В Arteris NoC пакетирование происходит на IP-интерфейсах, которые являются краями соединительной сети, так что основная логика является простой и быстрой. Это также сохраняет ворота. По сравнению с гибридными шинами, межсоединения NoC имеют 50% общей длины провода и на 30-50% меньше затворов. IP-соединение обычно составляет 8-12% площади SoC. Однако, если он плохо спроектирован, он может потреблять более 30% энергии SoC.

Экономия 50% IP-площади Interconnect экономит около 3 мм квадрата кремниевой площади в обычных SoC. В технологическом узле 28 нм каждый 1-миллиметровый квадрат кремния стоит около 10 центов. Это экономия на 30 центов за чип. При объеме в двадцать миллионов единиц, 6 миллионов долларов будут сэкономлены в течение срока службы SoC. В семье из 5 таких SoC вы сэкономите 30 миллионов долларов и даже больше, если объемы будут выше. Вот почему NoC Interconnect IP быстро внедряется большинством ведущих групп разработчиков SoC и почти наверняка присутствует в вашем мобильном телефоне или планшете, который вы сейчас носите.

Ультрасовременный уровень в технологии IP-соединений

Осторожно: не все NoC-соединения одинаковы. Это сложная технология, требующая участия партнеров, разработки междисциплинарной продукции, а также большого количества времени и средств для удовлетворения потребностей постоянно развивающихся конструкций SoC. Требуется время, чтобы разработать продукт межсоединения NoC, доказать это на успешных начальных проектах, внедрить те, которые предназначены для систем конечного пользователя, и довести их до крупномасштабных поставок.

Рисунок 8: Цепочка разработки NoC IP для объемной отгрузки.

Между тем, это требует гибкости, широкого понимания и рутинных выпусков, чтобы соответствовать растущим требованиям ведущих групп разработчиков SoC.

Заключение

NoC interconnect IP предлагает ряд преимуществ в отношении мощности, производительности и площади SoC. Там нет мошенничества Матери Природы, но NoC interconnect использует ее снисходительность. Благодаря эффективной конструкции NoC interconnect IP позволяет эффективно оптимизировать энергопотребление, производительность и площадь для всего SoC.

Если вы хотите скачать копию этого документа, нажмите Вот


Новости

Социальные сети в России, зима 2015-2016 Цифры, тренды, прогнозы | Блог Brand Analуtics — все о бренд мониторинге и социальной аналитике
Представляем данные регулярного исследования активной аудитории социальных сетей в России, зима 2015-2016. В исследовании представлены данные по аудитории, возрасту, полу и региональному распределению

SMM маркетинг от А до Я
Развитие социальных сетей породило новую огромную бизнес отрасль — СММ маркетинг. Это когда мы приходим с нашим продуктом в какую-нибудь соцсеть, находим там нашу целевую аудиторию, и предлагаем ей наш

Полезно знать
20.02.2014 Что такое Pinterest. Визуальный PR и маркетинг Pinterest или ПИНТЕРЕСТ – социальная сеть, использующая вместо текстов картинки и изображения, которые можно добавлять в аккаунт,

Фейсбук Моя страница: ВХОД на свою страницу Facebook
Фейсбук (Facebook) Моя страница — это личная страница каждого зарегистрированного пользователя самой большой в мире социальной сети.  Фейсбук даёт возможность людям с разных уголков Земли общаться между

Анализ социальных сетей
АНАЛИЗ СОЦИАЛЬНЫХ СЕТЕЙ (social network analysis) - новое направление структурного подхода, основными целями которого являются исследование взаимодействий между социальными объектами и выявление условий

Социальные сети для продвижения бизнеса: какие выбрать?
  Привет, друзья! Социальные сети занимают львиную часть времени в нашей жизни. Ежедневный просмотр новостей, любимых групп и переписка с друзьями – это любимое дело большинства молодых людей. Вот и

ВРЕДНОЕ ВЛИЯНИЕ СОЦИАЛЬНЫХ СЕТЕЙ НА ЗДОРОВЬЕ ЧЕЛОВЕКА - VI Студенческий научный форум (15 февраля - 31 марта 2014 года)
ВРЕДНОЕ ВЛИЯНИЕ СОЦИАЛЬНЫХ СЕТЕЙ НА ЗДОРОВЬЕ ЧЕЛОВЕКА Гущина Н. В., Люлина Н.В. С распространением всемирной паутины рост социальных сетей по всему миру стал глобальным явлением. С каждым

Влияние социальных сетей на подростков. Пропаганда суицида в сетях
Почему мы любим интернет? Почему молодым людям, подросткам сказать «Привет» стало проще, познакомившись в интернете, чем просто подойти в реальности? Почему все «сидят» в социальных сетях? Социальные сети

Маркетинг в социальных сетях (SMM) для продвижения компании
Деятельность в социальных сетях, на блогах и форумах по повышению лояльности клиентов получила название SMM — от аббревиатуры английского звучания этого термина – Social Media Marketing. Аудитория

Фейсбук (Facebook) - что это за сеть: как пользоваться ФБ
Фейсбук — это самая популярная и большая социальная сеть в мире. Если Вам интересно узнать больше о Facebook, про то как пользоваться сетью и о некоторых «фишках» ФБ — этот материал именно для вас!