Файл: Классификация, структура и основные характеристики современных микропроцессоров ПК (История создания микропроцессоров).pdf
Добавлен: 29.02.2024
Просмотров: 11
Скачиваний: 0
Часть кристалла освобождается для включения дополнительных компонентов. Степень интеграции ниже, чем в предыдущем архитектурном варианте, поэтому при высоком быстродействии допускается более низкая тактовая частота. Команда меньше загромождает ОЗУ, CPU дешевле. Программной совместимостью указанные архитектуры не обладают. Отладка программ на RISC более сложна. Данная технология может быть реализована программно-совместимым с технологией CISC (например, суперскалярная технология).
Поскольку RISC-инструкции просты, для их выполнения нужно меньше логических элементов, что в конечном итоге снижает стоимость процессора. Но большая часть программного обеспечения сегодня написана и откомпилирована специально для CISC-процессоров фирмы Intel. Для использования архитектуры RISC нынешние программы должны быть перекомпилированы, а иногда и переписаны заново.
Самым распространенным примером данной архитектуры служат ARM процессоры. Подробнее о них мы поговорим в отдельной главе.
MISC (англ. minimal instruction set computer — «компьютер с минимальным набором команд») — вид процессорной архитектуры.
Увеличение разрядности процессоров привело к идее укладки нескольких команд в одно большое слово (связку, bound). Это позволило использовать возросшую производительность компьютера и его возможность обрабатывать одновременно несколько потоков данных. Кроме этого, MISC использует стековую модель вычислительного устройства и основные команды работы со стеком языка Forth.
Процессоры с MISC, как и процессоры RISC, характеризуются небольшим числом чаще всего встречающихся команд. Вместе с этим принцип «очень длинных командных слов» (VLIW) обеспечивает выполнение группы непротиворечивых команд за один цикл работы процессора. Порядок выполнения команд распределяется таким образом, чтобы в максимальной степени загрузить маршруты, по которым проходят потоки данных. Таким образом архитектура MISC объединила вместе суперскалярную и VLIW-концепции. Компоненты процессора просты и работают на высоких частотах.
В настоящий момент архитектура на стадии развития и редко где используются.
Специализированный процессор – процессор, у которого особенности архитектуры, набора структурных блоков, системы команд или конструктивно-технологического исполнения, позволяют значительно повысить эффективность решения достаточно узкого круга специальных задач по сравнению с иными применениями.
Заменять универсальные процессоры специализированными экономически выгодно, т. к. они дешевле и имеют более высокие технические показатели, такие как быстродействие, потребление электроэнергии, габариты и т. д.
К недостаткам специализированных процессоров можно отнести большие затраты на разработку программного обеспечения и его отладку. Эта проблема решается с помощью кросс – платформенного программирования, когда программа для специализированного процессора создается на универсальной ЭВМ, а затем производиться перекодирование в систему команд специализированного процессора. Также применяется метод эмуляции специализированного процессора на универсальной ЭВМ, который позволяет моделировать процесс отладки программ для устройств, содержащих специализированные процессоры.
ЦПУ (CPU)
Память (RAM)
ГПУ (GPU)
Рис. 5. Пример специализированного графического процессора (GPU) для обработки кадров в цифровой фотокамере
Область применения специализированных процессоров широка. Обычно специализированные процессоры используются для управления сложными техническими устройствами. Каждая специализированная ЭВМ рассчитана на решение ограниченного круга задач и, как правило, не может использоваться вне того устройства, в которое встроена. Специализированные процессоры встраиваются в системы автоматического управления сложными устройствами или технологическими процессами на производстве, транспорте, связи, военном деле, медицине и т. д. Часто они используются в бытовой технике, например, в стиральных машинах, теле- видеоаппаратуре (рис.5), сотовых телефонах, микроволновых печах и т. д.
Глава 3. Пути развития современных микропроцессоров
Раньше, выбирая новый компьютер, мы сравнивали характеристики процессоров в нем по тактовой частоте: чем она выше, тем производительнее был компьютер. Так было с поколением Pentium от Intel и Athlon от AMD. О количестве ядер не думали – тогда оно было одно. Но все начало менять когда сменились эти поколения, начиная с Core от Intel и A серии от AMD. Компании стали наращивать ядра, менять технический процесс, все больше сокращая его, при этом частота не сильно менялась, а где-то даже уменьшалась для более энергоэффективности и выделяемому теплу. К тому же это способствовало к уменьшению размера и самого чипа.
Рис. 6. Процессор Intel Core i7 под микроскопом
Не мало важную часть имел и размер кэш-памяти (кэш первого, второго, третьего уровней, или L1, L2, L3 cache). Она была необходима для быстрой выгрузке и доступа процессору к данным выполняемых задач, которые в свою очерез выгружаются и оперативной памяти (доступ к этим данным у кэш-памяти быстрее, чем в ОЗУ). Но и на каждом уровне размер этой памяти и скорость работы разные: у L1 скорость самая высокая, но размер меньше, и чем ниже класс, тем ниже скорость и больше размер. И вроде должно быть логично, что больше размер памяти на всех уровнях должен влиять на производительность. Но были процессоры, которые показывали высокие результаты в сравнении с другими при равном или меньшем объеме кэш-памяти. Тут нужно смотреть необходимый объем под конкретные задачи и программы, которые будет обрабатывать процессор, так как все зависит от программного кода и алгоритмов обработки.
Не последнее место занимает такой параметр как частота системной шины (Front Side Bus или FSB) – это скорость работы с которой ядро процессора обменивается данными с ОЗУ, дискретной видеокартой, и периферийными контролерами материнской платы компьютера. Но тут все намного проще – чем выше число частоты, чем выше производительность (при прочих параметрах).
В настоящее время близится закат эпохи архитектуры X86, так как с наращиванием частоты, количестве ядер и уменьшением технического процесса эти процессоры стали парой употреблять слишком много энергии и все тяжелее удается их при этом остужать, прибегая к разным ухищрениям – от экспериментов с нанесением жидкого металла вместо термопасты до сложной схемы жидкостного охлаждения. Ниже мы поговорим что же придет на смену, и какое ближайшее будущее в мире современных компьютеров и гаджетов нас ждет.
Стоит напомнить, что ARM одновременно означает и название архитектуры (Advanced RISC Machine), и организации (ARM Limited), являющейся лицензиаром 32- 64-битной архитектуры RISC процессоров.
До момента пока Apple не использовала в своих iPhone и iPad, ни кому особо не была понятна значимость данного типа процессоров. Низкая энергопотребление и компактный размер позволили их внедрить практически в любое портативное устройство. Как бы не старалась Intel с ее архитектурой х86, таких результатов ей достичь не получилось.
С появлением мобильной ОС Android от компании Google, использующая ядро Linux, появился бурный спрос на процессоры ARM. Этому и способствовало то, что сама операционная система была бесплатна для производителей мобильных телефонов и прочих гаджетов, появилось огромное разнообразие смартфонов, планшетов, плееров и тому подобное. Все это спровоцировало гонку производительности, у ARM появились новые лицензиаты – производители новых процессоров на одноименной архитектуре. Основными стали Qualcomm, Samsung, NVidia, MediaTec, Huawei. Каждый из них славился своим типом процессора, со своими «фишками» и особенностями. Но каждый из них привносил вклад в общую копилку инновационных достижений, которые только продвигали прогресс.
В одном из материалов был проведен крупный тест процессоров на архитектуре E2K (отечественные Эльбрусы), ARM (v6-v8) и x86 (i386) х86-64 (amd64). Использовались насколько тестов, в том числе LINPACK, который применяется для оценки производительности суперкомпьютеров.
Процессоры ARM были представлены следующими моделями: Amlogic S922X, Samsung Exynos 4412, Allwinner H5, Allwinner A64 и Broadcom BCM2837B0 (последний используется в миникомпьютере Raspberry PI 3).
Рис. 7. Микрокомпьютер Raspberry Pi 3 model B
Ниже приведен график (рис. 8) результатов тестов LINPACK, из которого видно, что некоторые процессоры ARM дотягивают до уровня Intel Atom (мобильный процессор для «нетбуков»). Аналогичную ситуацию можно видеть и на примере мобильного процессора Snapdragon 835. Исходя из тестов, он более чем в два раза проигрывает мобильным версиям Intel Core i5, не говоря уже про десктопные решения.
Рис. 8. Результат теста LINPACK
С другой стороны такие тесты нельзя назвать максимально объективными. Во-первых, большинство подборных программ ориентированы под x86/x64, поэтому для ARM часто приходится использовать эмуляторы, которые сказываются на результатах. Во-вторых, все рассматриваемые решения изначально ориентированы на мобильную электронику с минимальным тепловыделением и «жором» аккумулятора.
Рис. 9. Результат тестов Futuremark
Однако можно ли использовать ARM для десктопных решений? Вполне вероятно, и первые звоночки уже есть. Каждые 6 месяцев выходит рейтинг ТОП-500 — список самых мощных суперкомпьютеров в мире. Ранее первые места занимали решения c Intel Xeon или Nvidia Volta, однако в рейтинге от сентября 2020 года самым мощным компьютером стал японский Fugaku (рис. 10). Беспрецедентный случай, ведь построен он именно на процессорах ARM (A64FX 48C). Замеры производительности показали 513,8 петафлопс. Много это или мало? Бывший лидер IBM Power Systems AC922 имеет всего 200,7 петафлопс — более чем в два раза меньше!
Рис. 10. Компьютер Fugaku с ARM процессором Fujitsu
Развитие вычислительных технологий схожа с эволюцией в живой природе – некоторые развиваются, некоторые остаются на месте в связи с их актуальностью в том виде, в котором изначально были созданы, а некоторые прекратили свое существование из-за неактуальности свой архитектуры. И вот новый этап «эволюции» микропроцессоров – нейропроцессоры.
Нейропроцессор представляет из себя равномерные вычислительные блоки со встроенной памятью – нейронов, которые выполняют разные функции. Архитектура является по своей сути многоядерной, так как каждый нейрон представляет из себя самостоятельное вычислительное ядро. В среднем количество таких ядер может насчитываться больше тысячи.
Рис. 11. Слева обычный ЦПУ, справа Нейропроцессор
Центральный процессор не способен работать как нейросеть, так как для таких задач он не заточен. Но почему?
Операции нейросети представляют из себя простые задачи, в которых происходят обычные вычисления со сложением и произведением. К примеру, для распознания нейросети изображения, необходимо загрузить самое изображение и некие коэффициенты распознавания, которые называют весами, указывающие на искомые признаки. В начале участвует то количество ядер, сколько пикселей в изображении, и с каждым вычислением это количество сокращается в конечном итоге до 10 – количество ответов. А если процесс запустить в обратном порядке, то произойдет процесс генерации. Так вот, для таких вычислений необходимо большое количество ядер, например для картинки в 28х28 пикселей для каждого из 10 нейронов используется 784 коэффициента, то есть веса, в итоге 7840 значений.
Так как в современных процессорах недостаточно ядер (4-8 в обычных ПК и около 64 в серверных), то они не способны на операции с перемножением и складыванием данных коэффициентов, которые проще делать параллельно.
Другое дело графический процессор, встроенный в видеокарту в самом обычном домашнем ПК. Так как в их задачу входит отображения изображений разрешением до 8К, то есть они должны обработать до 500 млн пикселей в секунду для картинки разрешением 3840х2160 пикселей в мониторах с частотой кадров 60 fps (а возможно и 120 в зависимости от возможностей).
По своей структуре GPU отличается от CPU, у первых количество ядер более 1000 и являются вычислительными блоками.