Раздел 3 Вычислительные систем

Тема 3.1Организация вычислений в вычислительных системах

Предназначение и свойства ВС. Организация вычислений в вычислительных системах. ЭВМ параллельного деяния, понятия потока команд и потока данных. Ассоциативные системы. Матричные системы. Конвейеризация вычислений. Сборочный поток команд, сборочный поток данных. Суперскаляризация.

Студент должен

знать:

- понятие потока команд;

- понятие потока данных;

- типы вычислительных систем;

- архитектурные изыски вычислительных Раздел 3 Вычислительные систем систем

Вычислительные системы

Вычислительная система (ВС) – совокупа взаимосвязанных и взаимодействующих микропроцессоров либо ЭВМ, периферийного оборудования и программного обеспечения, созданная для сбора, хранения, обработки и рассредотачивания инфы.

Создание ВС преследует последующие главные цели:

· увеличение производительности системы за счёт ускорения процессов обработки данных;

· увеличение надёжности и достоверности вычислений;

· предоставление юзеру дополнительных сервисных услуг т Раздел 3 Вычислительные систем.д.

Тема 3.2Систематизация вычислительных систем

Систематизация ВС зависимо от числа потоков команд и данных: ОКОД (SISD), ОКМД (SIMD), МКОД (MISD), МКМД (MIMD).

Систематизация многопроцессорных ВС с различными методами реализации памяти совместного использования: UMA, NUMA, СОМА. Сравнительные свойства, аппаратные и программные особенности.

Систематизация многомашинных ВС: МРР, NDW и COW. Предназначение Раздел 3 Вычислительные систем, свойства, особенности.

Примеры ВС разных типов. Достоинства и недочеты разных типов вычислительных систем.

Систематизация вычислительных систем

Отличительной особенностью ВС по отношению к традиционным ЭВМ является наличие в ней нескольких вычислителей, реализующих параллельную обработку.

Параллелизм выполнения операций значительно увеличивает быстродействие системы; он может значительно повысить и надёжность (при отказе 1-го компонента системы его Раздел 3 Вычислительные систем функцию может взять на себя другой), также достоверность функционирования системы, если операции будут дублироваться, а результаты сравниваться.

Вычислительные системы можно поделить на две группы:

· многомашинные;

· многопроцессорные.

Многомашинная вычислительная система состоит из нескольких отдельных компов. Каждый компьютер в многомашинной системе имеет традиционную архитектуру, и такая система применяется довольно обширно. Но эффект от Раздел 3 Вычислительные систем внедрения таковой вычислительной системы может быть получен только при решении задачки, имеющей специальную структуру: она должна разбиваться на столько почти не связанных подзадач, сколько компов в системе.

Многопроцессорная архитектура подразумевает наличие в компьютере нескольких микропроцессоров, потому параллельно может быть скооперировано много потоков данных и много потоков команд. Таким макаром, сразу может производиться Раздел 3 Вычислительные систем несколько фрагментов одной задачки. Преимущество в быстродействии многопроцессорных вычислительных систем перед однопроцессорными разумеется.

Недочетом является возможность появления конфликтных ситуаций при воззвании нескольких микропроцессоров к одной области памяти.

Особенностью многопроцессорных вычислительных систем является наличие общей оперативки в качестве общего ресурса (набросок 11).

Набросок 11 - Архитектура многопроцессорной вычислительной системы

Систематизация Флинна

Посреди всех рассматриваемых систем систематизации Раздел 3 Вычислительные систем ВС наибольшее распространение получила систематизация, предложенная в 1966г М. Флинном. В её базу положено понятие потока, под которым понимается последовательность частей команд либо данных, обрабатываемая микропроцессором. Зависимо от количества потоков команд и потоков данных Флинн выделяет 4 класса архитектур:

· ОКОД – одиночный поток команд - одиночный поток данных. К ним относятся Раздел 3 Вычислительные систем традиционные фон – неймановские ВМ. Конвейерная обработка не имеет значения, потому в класс ОКОД попадают как ВМ 6600 со скалярными многофункциональными устройствами, так и 7600 с конвейерными.

· МКОД – множественный поток команд - одиночный поток данных. В этой архитектуре огромное количество микропроцессоров обрабатывают один и тот же поток данных. Примером могла бы служить ВС, на микропроцессоры которой Раздел 3 Вычислительные систем подаётся искажённый сигнал, а любой из микропроцессоров обрабатывает этот сигнал при помощи собственного метода фильтрации. Все же ни Флинн, ни другие спецы в области архитектуры компов до сего времени не смогли представить реально имеющейся ВС, построенной на данном принципе. Ряд исследователей относят к этому классу конвейерные Раздел 3 Вычислительные систем системы, но это не отыскало окончательного признания. Наличие пустого класса не следует считать недочетом систематизации Флинна. Такие классы могут стать полезными при разработке новых концепций в теории и практике построения ВС.

· ОКМД – один поток команд – много потоков данных – команды выдаются одним управляющим микропроцессором, а производятся сразу на всех обрабатывающих микропроцессорах над Раздел 3 Вычислительные систем локальными данными этих микропроцессоров. SIMD (single instruction – multiple data)

· МКМД – много потоков команд - много потоков данных- совокупа компов, работающих по своим программкам со своими начальными данными. MIMD (multiple instruction – multiple data)

Схема систематизации Флинна является более распространённой при начальной оценке ВС, так как сходу позволяет оценить базисный механизм работы системы. Но у Раздел 3 Вычислительные систем систематизации Флинна имеются и тривиальные недочеты: к примеру, неспособность совершенно точно отнести некие архитектуры к тому либо иному классу. 2-ой недочет - чрезмерная насыщенность класса MIMD.

Имеющиеся вычислительные системы класса MIMD образуют три подкласса: симметричные мультипроцессоры (SMP) , кластеры и массово параллельные системы (MPP). В базе этой систематизации лежит структурно – многофункциональный Раздел 3 Вычислительные систем подход.

Симметричные мультипроцессоры состоят из совокупы микропроцессоров, владеющих схожими способностями доступа к памяти и наружным устройствам и функционирующих под управлением одной операционной системы (ОС). Личный случай SMP – однопроцессорные компы. Все микропроцессоры SMP имеют разделяемую общую память с единым адресным местом.

Внедрение SMP обеспечивает последующие способности:

· масштабирование приложений при низких исходных издержек, оковём внедрения Раздел 3 Вычислительные систем без преобразования приложений на новых более производительных аппаратных средствах;

· создание приложений в обычных программных средах;

· однообразное время доступа ко всей памяти;

· возможность пересылки сообщений с большой пропускной способностью;

· поддержку когерентности совокупы кэшей и блоков основной памяти, неразделимые операции синхронизации и блокировки.

Кластерная система появляется из модулей, объединённых системой Раздел 3 Вычислительные систем связи либо разделяемыми устройствами наружной памяти, к примеру, дисковыми массивами.

Размер кластера варьируется от нескольких модулей до нескольких 10-ов модулей.

В рамках как вместе применяемой, так и распределенной памяти реализуется несколько моделей архитектур системы памяти. На рисунке 12 приведена систематизация таких моделей, используемых в вычислительных системах класса MIMD (верна Раздел 3 Вычислительные систем и для класса SIMD).

Набросок 12 – Систематизация моделей архитектур памяти вычислительных систем

В системах с общей памятью все микропроцессоры имеют равные способности по доступу к одному адресному месту. Единая память может быть построена как одноблочная либо по модульному принципу, но обычно практикуется 2-ой вариант.

Вычислительные системы с общей памятью, где доступ хоть какого микропроцессора Раздел 3 Вычислительные систем к памяти делается единообразно и занимает однообразное время, именуют системами с однородным доступом к памятии обозначают аббревиатурой UMA (Uniform Memory Access). Это более всераспространенная архитектура памяти параллельных ВС с общей памятью

На техническом уровне UMА-системы подразумевают наличие узла, соединяющего любой из п микропроцессоров с каждым из т модулей памяти. Простой Раздел 3 Вычислительные систем путь построения таких ВС - объединение нескольких микропроцессоров (Рi.) с единой памятью (МP) средством общей шины - показан на рисунке 12а. В данном случае, но, в каждый момент времени обмен по шине может вести только один из микропроцессоров, другими словами микропроцессоры должны конкурировать за доступ к шине. Когда микропроцессор Раздел 3 Вычислительные систем Рi, выбирает из памяти команду, другие микропроцессоры Рj (i ≠ j)должны ждать, пока шина освободится. Если в систему входят только два микропроцессора, они в состоянии работать с производительностью, близкой к наибольшей, так как их доступ к шине можно чередовать: пока один микропроцессор декодирует и делает команду, другой вправе использовать Раздел 3 Вычислительные систем шину для подборки из памяти последующей команды. Но когда добавляется 3-ий микропроцессор, производительность начинает падать. При наличии на шине 10 микропроцессоров кривая быстродействия шины (набросок 12б)становится горизонтальной, так что добавление 11-го микропроцессора уже не дает увеличения производительности. Нижняя кривая на этом рисунке иллюстрирует тот факт, что память и шина владеют фиксированной Раздел 3 Вычислительные систем пропускной способностью, определяемой композицией продолжительности цикла памяти и протоколом шины, и в многопроцессорной системе с общей шиной эта пропускная способность распределена меж несколькими микропроцессорами. Если продолжительность цикла микропроцессора больше по сопоставлению с циклом памяти, к шине можно подключать много микропроцессоров. Но практически микропроцессор обычно намного резвее памяти Раздел 3 Вычислительные систем, потому данная схема широкого внедрения не находит.

Другой метод построения многопроцессорной ВС с общей памятью на базе UMA показан на рисунке 13в. Тут шина заменена коммутатором, маршрутизирующим запросы микропроцессора к одному из нескольких модулей памяти. Невзирая на то, что есть некоторое количество модулей памяти, они все входят в единое виртуальное адресное Раздел 3 Вычислительные систем место. Преимущество такового подхода в том, что коммутатор в состоянии параллельно обслуживать несколько запросов. Каждый микропроцессор может быть соединен со своим модулем памяти и иметь доступ к нему на очень допустимой скорости. Соперничество меж микропроцессорами может появиться при попытке одновременного доступа к одному и тому же модулю Раздел 3 Вычислительные систем памяти. В данном случае доступ получает только один микропроцессор, а остальные - блокируются.

К огорчению, архитектура UMA не прекрасно масштабируется. Более всераспространенные системы содержат 4-8 микропроцессоров, существенно пореже 32-64 микропроцессора. Не считая того, подобные системы нельзя отнести к отказоустойчивым, потому что отказ 1-го микропроцессора либо модуля памяти тянет отказ всей ВС.

Набросок 13 - Общая Раздел 3 Вычислительные систем память:

а)объединение микропроцессоров при помощи шины и система с локальными кэшами;

б) производительность системы как функция от числа микропроцессоров на шине;

в) многопроцессорная ВС с общей памятью, состоящей из отдельных модулей

Другим подходом к построению ВС с общей памятью является неоднородный доступ к памяти, обозначаемый как NUMA (Non Раздел 3 Вычислительные систем-Uniform Memory Access). Тут, как и раньше, бытует единое адресное место, но каждый микропроцессор имеет локальную память. Доступ микропроцессора к своей локальной памяти делается впрямую, что намного резвее, чем доступ к удаленной памяти через коммутатор либо сеть. Такая система может быть дополнена глобальной памятью, тогда локальные запоминающие устройства играют Раздел 3 Вычислительные систем роль резвой кэш-памяти для глобальной памяти. Схожая схема может сделать лучше производительность ВС, но не в состоянии неограниченно отсрочить выравнивание прямой производительности. При наличии у каждого микропроцессора локальной кэш-памяти (набросок 13а) существует высочайшая возможность (р> 0,9) того, что нужные команда либо данные уже находятся в локальной памяти. Разумная возможность попадания Раздел 3 Вычислительные систем в локальную память значительно уменьшает число воззваний микропроцессора к глобальной памяти и, таким макаром, ведет к увеличению эффективности. Место излома кривой производительности (верхняя кривая на рисунке 13б), соответственное точке, в какой добавление микропроцессоров еще остается действенным, сейчас перемещается в область 20 микропроцессоров, а точка, где кривая становится горизонтальной, - в Раздел 3 Вычислительные систем область 30 микропроцессоров.

В рамках концепции NUMA реализуется несколько разных подходов, обозначаемых аббревиатурами СОМА, CC-NUMA и NCC-NUMA.

В архитектуре только с кэш-памятью(СОМА, Cache Only Memory Architecture) локальная память каждого микропроцессора построена как большая кэш-память для резвого доступа со стороны «своего» микропроцессора. Кэши всех микропроцессоров в Раздел 3 Вычислительные систем совокупы рассматриваются как глобальная память системы. Фактически глобальная память отсутствует. Принципная особенность концепции СОМА выражается в динамике. Тут данные не привязаны статически к определенному модулю памяти и не имеют уникального адреса, остающегося постоянным в течение всего времени существования переменной. В архитектуре СОМА данные переносятся в кэш-память того микропроцессора, который последним Раздел 3 Вычислительные систем их запросил, при всем этом переменная не фиксирована уникальным адресом и в каждый момент времени может располагаться в хоть какой физической ячейке. Перенос данных из 1-го локального кэша в другой не просит роли в этом процессе операционной системы, но предполагает сложную и дорогостоящую аппаратуру управления памятью. Для организации такового режима Раздел 3 Вычислительные систем употребляют так именуемые сборники кэшей. Отметим также, что последняя копия элемента данных никогда из кэш-памяти не удаляется.

Так как в архитектуре СОМА данные передвигаются в локальную кэш-память процессора-владельца, такие ВС в плане производительности владеют значимым преимуществом над другими архитектурами NUMA. С другой стороны, если единственная переменная Раздел 3 Вычислительные систем либо две разные переменные, хранящиеся в одной строке 1-го и такого же кэша, требуются двум микропроцессорам, эта строчка кэша должна передвигаться меж микропроцессорами туда и назад при каждом доступе к данным. Такие эффекты могут зависеть от деталей рассредотачивания памяти и приводить к непредсказуемым ситуациям.

Модель кэш-когерентного доступа Раздел 3 Вычислительные систем к неоднородной памяти(CC-NUMA, Cache Coherent Non-Uniform Memory Architecture) принципно отличается от модели СОМА. В системе CC-NUMA употребляется не кэш-память, а рядовая на физическом уровне распределенная память. Не происходит никакого копирования страничек либо данных меж ячейками памяти. Нет никакой программно реализованной передачи сообщений. Существует просто одна карта памяти Раздел 3 Вычислительные систем, с частями, на физическом уровне связанными медным кабелем, и «умные» аппаратные средства. Аппаратно реализованная кэш-когерентность значит, что не требуется какого-нибудь программного обеспечения для сохранения огромного количества копий освеженных данных либо их передачи. Со всем этим совладевает аппаратный уровень. Доступ к локальным модулям памяти в различных узлах Раздел 3 Вычислительные систем системы может выполняться сразу и происходит резвее, чем к удаленным модулям памяти.

Отличие модели с кэш-некогерентным доступом к неоднородной памяти(NCC-NUMA, Non-Cache Coherent Non-Uniform Memory Architecture) от CC-NUMA разумеется из наименования. Архитектура памяти подразумевает единое адресное место, но не обеспечивает согласованности глобальных данных на Раздел 3 Вычислительные систем аппаратном уровне. Управление внедрением таких данных стопроцентно возлагается на программное обеспечение (приложения либо компиляторы). Невзирая на это событие, представляющееся недочетом архитектуры, она оказывается очень полезной при повышении производительности вычислительных систем с архитектурой памяти типа DSM, рассматриваемой в разделе «Модели архитектур распределенной памяти».

В целом, ВС с общей памятью Раздел 3 Вычислительные систем, построенные по схеме NUMA, именуют архитектурами с виртуальной общей памятью(virtual shared memory architectures). Данный вид архитектуры, а именно CC-NUMA, в ближайшее время рассматривается как самостоятельный и достаточно многообещающий вид вычислительных систем класса M1MD.

Модели архитектур распределенной памяти.В системе с распределенной памятью каждый микропроцессор обладает своей памятью и способен Раздел 3 Вычислительные систем адресоваться только к ней. Некие создатели именуют этот тип систем многомашинными ВС либо мультикомпьютерами, подчеркивая тот факт, 'что блоки, из которых строится система, сами по для себя являются маленькими вычислительными системами с микропроцессором и памятью. Модели архитектур с распределенной памятью принято обозначать как архитектуры без прямого доступа к удаленной Раздел 3 Вычислительные систем памяти (NORMA, No Remote Memory Access). Такое заглавие следует из того факта, что каждый микропроцессор имеет доступ только к собственной локальной памяти. Доступ к удаленной памяти (локальной памяти другого микропроцессора) вероятен только методом обмена сообщениями с микропроцессором, которому принадлежит адресуемая память.

Схожая организация характеризуется рядом плюсов. Во-1-х, при доступе к Раздел 3 Вычислительные систем данным не появляется конкуренции за шину либо коммутаторы: каждый микропроцессор может вполне использовать полосу пропускания тракта связи с своей локальной памятью. Во-2-х, отсутствие общей шины значит, что нет и связанных с этим ограничений на число микропроцессоров: размер системы ограничивает только сеть, объединяющая микропроцессоры. В-3-х, снимается неувязка когерентности Раздел 3 Вычислительные систем кэш-памяти. Каждый микропроцессор вправе без помощи других поменять свои данные, не заботясь о согласовании копий данных в своей локальной кэш-памяти с кэшами других микропроцессоров.

Студент должен

знать:

- систематизацию ВС;

- примеры ВС разных типов.

уметь:

- выбирать тип вычислительной системы в согласовании с решаемой задачей.


razdel-4-finansovoe-obespechenie-inklyuzivnogo-obrazovaniya-detskij-fond-oon-yunisef-inklyuzivnoe-obrazovanie-v.html
razdel-4-gastroenterit-gastroenterokolit-rotavirusnaya-infekciya.html
razdel-4-glava-11-grazhdanskogo-processualnogo-kodeksa-kodeksa-ukraini-predostavlen-portalom-nedvizhimosti-ukraini.html