Лекція 7-10
2. Базові структури СКС
2.1 Базові структури СНК
2.1.1. Канонічні структури
2.1.2 Архітектура СНК фірми SONICS
2.1.3 Custom Hardware Accelerators
2.1.4 Реконфігуровані (програмовані) СНК
2.2 Базові структури МНК
2.3 Базові структури спеціалізованих обчислювальних систем
2 БАЗОВІ СТРУКТУРИ СКС
Структури СКС відрізняється своєю великою різноманітністю, оскільки вибір структури та її ефективність тісно пов’язана з завданням, яке повинна вирішувати дана система. Проте, на відміну від універсальних систем, спеціалізовані відрізняються:
СКС
Універсальні

Призначені для виконання обмеженого кола задач, перелік яких є чітко визначений при проектуванні.
Призначені для виконання різнотипних задач

Не може бути перепрограмована кінцевим користувачем
Програма може бути змінена користувачем

Виконує задачу за чітко визначений час
Виконання задач за принципом – чим швидше, тим краще


Незважаючи на велику різноманітність СКС, основним визначальним критерієм побудови СКС є виконання однієї чи декількох задач швидко, за чітко визначений час. Тому, СКС можна класифікувати за самим підходом до досягнення продуктивності при рішенні певного кола задач:
Замовні однокристальні СКС – висока ефективність досягається завдяки оптимальному поєднанню та підбору компонентів системи. Проектується під рішення тільки заданої задачі:
СНК
Мережі на кристалі (NoC)
Непрограмовані акселератори
Програмовані однокристальні СКС – продуктивність досягається завдяки ефективному програмуванню зв’язків між компонентами готової системи, та конфігурування складових компонентів системи у відповідності до поставленої задачі:
Програмовані СНК
Спеціалізовані багатопроцесорні однокристальні системи
Реконфігуровані однокристальні системи
Спеціалізовані обчислювальні системи
Спеціалізовані системи керування
Кожна з архітектур визначається типом складових компонентів, а саме:
набором інструкцій
за типом функціонування(напр. векторні)
за потенціальним паралелізмом (напр. паралельне обчислення в DSP)
потенційні можливості (Напр. можл зменшення коду)
набором спеціалізованих блоків та інформаційного тракту
спеціалізовані пристрої (Напр. DES)
розрядність та можливість перетворення форматів
потенційні можливості (Напр. вартість)
структура пам’яті
кількість блоків пам’яті та їх розмір
розрядність шини даних блоків пам’яті
тип доступу (Напр. FIFO)
потенційні можливості (Напр. споживана потужність)
типом з’єднання
тип шин та їх характеристики
програмно доступні регісти
потенційні можливості (Напр. пропускна здатність шини)
2.1 Базові структури СНК
2.1.1. Канонічні структури
Структура СНК наводилися в лекції 1.3.1. Основними визначальними елементами архітектури є МП та шини. Найбільш вживаними мікропроцесорам СНК є:
1. ARM, використано в наступних СНК (скорочений перелік)
Altera Excaliber - The Excaliber family of embedded processor programmable logic devices (PLDs) include ARM922T processor cores, programmable logic, on-chip memory, and key peripherals.
Cirrus CS89712 - An Internet communications device with a 74MHz ARM720TDMI core, 10Mbps Ethernet connectivity (MAC and PHY), built-in LCD controller, plus a wide array of internal peripherals. details
Samsung S3C2440 -- A 533MHz ARM920T 16/32-bit RISC microprocessor core targeting PDAs, smartphones, and mobile handheld devices. On-chip interface functions include a camera interface, a display controller for TFT and STN LCD displays, an SD/MMC/SDIO card controller, USB host and device controllers, a touch-screen interface, and a NAND Flash interface and boot loader. details
2. MIPS, використано в наступних СНК (скорочений перелік)
ATI Xilleon -- Oct. 17, 2001 -- The ATI XILLEON 220 includes a 300MHz MIPS core with MMU, along with MPEG decoder, audio decoder, display engine, 2D/3D graphics engine, conditional access, transport demultiplexers, PCI bus, USB, and hard disk interfaces
Infineon Technologies EasyPort -- -- A family of communications processors claimed to be the first network terminal controllers based on the MIPS64 5Kc architecture. details
3. PowerPC, використано в наступних СНК (скорочений перелік)
Freescale MPC885 -- Feb. 9, 2004 -- The most powerful PowerQUICC I devices available, the MPC885 family feature an embedded 8xx core and separate RISC processor CPM to handle communications. Available in CPU frequencies of 66, 80, and 133 MHz, with on-chip security, dual Fast Ethernet (MII and RMII) ports, USB, and bus speeds scaling to 80 MHz. The MPC885 family includes the MPC870, MPC875, MPC880 and MPC885 processors. It targets controller applications, particularly in communications and networking products such as low-end routers, VPN routers with integrated security features, home networking equipment, cost-effective WLAN access points, and xDSL gateway boxes. details
IBM PowerPC 750GX -- Feb. 23, 2004 -- An embedded version of the "G3" processor, targeting telecommunications, networking, storage, medical imaging, and industrial control applications. details
Xilinx Virtex-II Pro, Virtex-II Pro X, and Spartan-3 -- Mar. 30, 2004 -- These PLDs (programmable logic devices) support one or more PowerPC soft cores, and are supported by development tools that can automatically generate Linux BSPs. details
4. x86, використано в наступних СНК (скорочений перелік)
Intel Celeron ULV -- Jun. 2, 2004 -- Offering the lowest power requirement of Intel's Celeron M processors, the ULV ("ultra-low voltage") can operate fanless at 600 MHz. details
VIA Eden -- Feb. 12, 2004 -- An embedded version of VIA's C3 consumer x86 chip, the Eden family comprises passively cooled x86 processors using 7W (worst case) at clock speeds up to 1GHz. The VIA ESP10000 and ESP8000 are pin-compatible with earlier VIA processors and with Intel X86 CPUs. They feature hardware-based AES encryption and dual Random Number Generators (RNGs), and are available in a nano-BGA package about the size of a penny. Details here and here
5. Analog Devices Blackfin, Altera Nios II, Infineon Technologies TriCore,
Найбільш популярними шинами є:
AMBA
WISHBONE
Compact PCI
PCI Express
2.1.2 Архітектура СНК фірми SONICS
Особливий інтерес представляє концепція побудови СНК, запропонована фірмою Sonics. Фірмою розроблено як архітектуру СНК так і повний комплект програмних та апаратних засобів, що її підтримують та дозволяють інтегрувати компоненти.

Архітектура СНК групується навколо ідеї використання спеціалізованої мережі (Sillicon Backplane), що забезпечує безконфліктну передачу інформації між компонентами системи. Архітектура включає як апаратні складові СНК так і пропоколи передачі інформації. Переваги:
Висока продуктивність, яка досягається обміном інформацією між компонентами системи одночасно
Малий час проектування, який досягається легкістю чнтегрування компонентів системи
Низькі затрати обладнання, завдяки використанню принципу комутації пакетів
2.1.3 Custom Hardware Accelerators
PICO
The PICO-N system automatically synthesizes embedded nonprogrammable accelerators to be used as co-processors for functions expressed as loop nests in C. The output is synthesizable VHDL that defines the accelerator at the register transfer level (RTL). The system generates a synchronous array of customized VLIW (very-long instruction word) processors, their controller, local memory, and interfaces. The system also modifies the user's application software to make use of the generated accelerator. The user indicates the throughput to be achieved by specifying the number of processors and their initiation interval. In experimental comparisons, PICO-N designs are slightly more costly than hand-designed accelerators with the same performance.

BOPS
ManArray-based DSP Cores deliver extreme performance, from the smallest available core, the BOPS 2010, with 4 billion 8-bit operations per second, to the largest array currently in development, the BOPS 2160, with over 60 billion 8-bit operations per second.
The ManArray architecture achieves these performance levels through several levels of hardware parallelism and
through independently selectable parallel programming techniques.
???Data Parallelism
???Dual, quad, and octal packed data types are supported in all execution units
???Instruction Parallelism
???iVLIWs can use all 5 execution units per PE in parallel
???Array Parallelism
???1 - 16 PEs on the array work in parallel

2.1.4 Реконфігуровані (програмовані) СНК
Детально дані структури розглядаються в курсі реконфігуровані комп’ютери.

При побудові СКС доцільним є використання реконфігурованих архітектур перших трьох рівнів. Причому реконфігурована логіка є найбільш вживана. Прикладом є використання поєднання FPGA та МП в марсоходах.
2.2 Базові структури МНК
Можливості сучасних технологій НВІС, при яких досягнення степені інтеграції мільярда вентилів на кристалі є реальністю дало поштовх розвитку мереж на кристалі (МНК, Network on a chip (NOC)).
МНК – це НВІС обчислювальної системи (в більшості спеціалізованої), яка складається з мережі обчислювальних елементів, запам’ятовуючи