Оптимізований доступ до пам'яті (Unaligned Memory Access)

В архітектурі Core доступ до пам'яті приводив до ряду обмежень по продуктивності. Процесор був оптимізований для доступу до адрес пам'яті, вирівняним по 64-байтним кордонів, тобто за розміром однієї строчки кеша. Для невирівняні даних доступ був не тільки повільний, але і виконання невирівняні інструкцій зчитування або запису було більш накладними, ніж у випадку вирівняних інструкцій, незалежно від реального вирівнювання даних пам'яті. Причина полягала в тому, що ці інструкції приводили до генерації декількох мікрооперацій на декодерах, що знижувало пропускну спроможність з даними типами інструкцій. У підсумку компілятори уникали генерувати інструкції подібного типу, підставляючи замість них послідовність інструкцій, які менш накладні.

Так, читання з пам'яті, при якому відбувався перехлест двох рядків кеша, сповільнювався приблизно на 12 тактів, в порівнянні з 10 тактами для запису. Інженери Intel оптимізували подібний тип звернень, щоб він виконувався швидше. Почнемо з того, що тепер немає падіння продуктивності при використанні невирівняні інструкцій читання / запису у випадках, коли дані вирівняні в пам'яті. В інших випадках Intel теж оптимізувала доступ, знизивши падіння продуктивності в порівнянні з архітектурою Core.

Більше блоків попередньої вибірки з більш ефективною роботою

В архітектурі Conroe Intel особливо пишалася апаратними блоками передбачення. Як ви знаєте, блок пророкування - це механізм, який стежить за характером доступу до пам'яті і намагається передбачити, які дані будуть потрібні через кілька тактів. Мета полягає в тому, щоб випереджувальним чином завантажити дані в кеш, де вони будуть розташовуватися ближче до процесора, і разом з тим максимально використовувати доступну пропускну спроможність тоді, коли процесору вона не потрібна.

Дана технологія дає чудові результати з більшістю настільних додатків, але в серверній середовищі вона часто приводила до втрати продуктивності. Є кілька причин подібної неефективності. По-перше, доступи до пам'яті часто складніше передбачити в серверних застосуваннях. Доступ до бази даних, наприклад, аж ніяк не лінійний - якщо в пам'яті запитується небудь елемент даних, то це не означає, що наступним буде сусідній елемент. Це обмежує ефективність блоку попередньої вибірки. Але основною проблемою була пропускна здатність пам'яті в многосокетних конфігураціях. Як ми вже говорили раніше, вона вже була "вузьким місцем" для декількох процесорів, але, крім цього, блоки попередньої вибірки приводили до додаткового навантаження на цьому рівні. Якщо мікропроцесор не виконує доступ до пам'яті, то включалися блоки попередньої вибірки, намагаючись використовувати пропускну здатність, по їх припущенню, вільну. Однак блоки не могли знати, чи потрібна ця пропускна спроможність другому процесора. Це означало, що блоки попередньої вибірки могли "відбирати" у процесора пропускну здатність, яка і так була "вузьким місцем" в таких конфігураціях. Щоб вирішити цю проблему, Intel не знайшла нічого кращого, як відключити блоки попередньої вибірки в таких ситуаціях - навряд чи найоптимальніше рішення.

Як стверджує Intel, ця проблема вже вирішена, проте компанія не дає ніяких деталей з приводу роботи нових механізмів попередньої вибірки. Все, що компанія говорить: тепер не потрібно відключати блоки для серверних конфігурацій. Втім, навіть Intel нічого не змінила, переваги від нової організації пам'яті і, внаслідок цього, більша пропускна здатність повинні нівелювати негативний вплив блоків попередньої вибірки.

Conroe став серйозним фундаментом для нових процесорів, і Nehalem побудований якраз на ньому. Тут використовується така ж ефективна архітектура, але тепер вона набагато більш модульна і масштабована, що повинно гарантувати успіх в різних ринкових сегментах. Ми не говоримо про те, що Nehalem революціонізував архітектуру Core, але новий процесор революціонізував платформу Intel.

З усіма поліпшенням, зробленими на даному етапі (інтегрований контролер пам'яті, QPI), не дивно бачити, що зміни виконавчого ядра не такі значні. Але повернення Hyper-Threading можна вважати серйозною новиною, та й ряд невеликих оптимізацій теж повинні забезпечити помітний приріст продуктивності.

<<< < Предыдущая 1 23 / 73 4 5 6 7 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.05.2019378.37 Кб6Вплив нацрухів на держуправління.doc
#
01.05.202516.33 Mб0Впровадженяя інтерактивних проектних технологій...docx
#
18.11.2019238.08 Кб15Времена в английском языке.doc
#
01.04.2025202.02 Кб0все (без Юли и 46).docx
#
01.05.2025321.54 Кб0все 50 билетов география туризма.doc
#
01.03.2025960 Кб0Всё в куче.doc
#
11.09.2019342.02 Кб15все ответы по госу кит.doc
#
01.04.202580.68 Кб0все ответы.docx
#
20.07.2019450.45 Кб15Все регионы.rtf
#
12.11.201996.26 Кб17Все семинары на семестр (на укр.яз).doc
#
01.05.2025302.59 Кб3все шпоры.doc