Кеш пам'ять та її призначення у процесорі. Кеш-пам'ять процесора. На що впливає кеш 3 рівня

Головна / Google Play

Виявився у мене на руках процесор i5 2400. І тому що у мене є 2600k, у якого L3 кеш 8mb проти 6mb у i5 - захотів порівняти їх в іграх та додатках. Час був обмежений, тому тестів буде не так багато. Але щоб додати ще більше інформації, я грався з пам'яттю та змоделював три ситуації з i5 2400.

1. Конфіг із найдешевшою материнською платоюна чіпсеті з індексом H, де відсутня можливість розгону і частота всіх ядер буде 3200MHz. Оперативна пам'ять працюватиме на частоті 1333MHz при таймінгах 9:9:9:27

2. Конфіг з материнською платою на чіпсеті з індексами "P" і "Z" у яких є можливість підняти множник процесорів з підтримкою турбобусту на чотири пункти. У моєму випадку з процесором i5 2400 множник з 32 можна підняти до 36, тим самим отримавши частоту 3600MHz. Розігнавши ще й шину, я отримав 3800MHz, що на 600MHz більше, ніж у першій конфізі. Оперативна пам'ять у даному випадкупрацюватиме на частоті 2252MHz при таймінгах 9:9:9:27

3. Конфіг такий самий як і другий, але з частотою оперативної пам'ятіу 1689MHz на таймінгах 9:9:9:27

4. Конфіг із процесором 2600k на частоті 3,80GHz, відключеним HT та оперативною пам'яттю 2252MHz з таймінгами 9:9:9:27.

Тестові комплектуючі:
Intel Core i7 2600K
Intel Core i5 2400
Материнська плата: ASUS P8Z77-V Deluxe
Оперативна пам'ять: 16GB DDR3 CRUCIAL Ballistix Elite
Відеокарта: GTX 780 Ti 1279 | 7800 Драйвера: 381.89
Блок живлення: APS-850C 850W
Операційна система: Windows 8.1 x64 чиста (35 процесів після запуску системи)

i5 2400 3200MHz DDR3 1333MHz

i5 2400 3800MHz DDR3 1689MHz

i5 2400 3800MHz DDR3 2252MHz

i7 2600k 3800MHz 2252MHz

NVIDIA GTX 780 Ti 1279 | 7800

Результати тестування:

3DMark 2013 CPU Score




Приріст як від кешу, так і від оперативної пам'яті мінімальний.

_________________________________________________________________________________________________

Cinebench R15




У Cinebench R15 спостерігаємо аналогічну картину.

_________________________________________________________________________________________________

LinX 0.6.5 Об'єм задачі: 25000




У LinX також приріст дає лише розгін процесора

_________________________________________________________________________________________________

x264 FHD Benchmark




І знову приріст лише на рівні похибки.

_________________________________________________________________________________________________

Winrar v4.20



І ось нарешті отримуємо приріст від кешу близько 6% та від пам'яті близько 15%

_________________________________________________________________________________________________

Battlefield 1 SinglePlayer


Розширення: 1280x720
Шкала дозволу: 100%
Якість текстур:низ. / Середовищ. / Вис. / ультра
Фільтрування текстур:низ. / Середовищ. / Вис. / ультра
Якість освітлення:низ. / Середовищ. / Вис. / ультра
Якість ефектів:низ. / Середовищ. / Вис. / ультра
Якість постобробки:низ. / Середовищ. / Вис. / ультра
Якість сітки:низ. / Середовищ. / Вис. / ультра
Якість ландшафту:низ. / Середовищ. / Вис. / ультра
Якість трави:низ. / Середовищ. / Вис. / ультра
Якість згладжування: ні/ FXAA (середнє) / FXAA (високе) / TAA
Об'ємне світло:ні / SSAO / HBAO


Невеликий приріст від кешу L3 є.

_________________________________________________________________________________________________

Crysis 3 Ласкаво просимо до джунглів


Розширення: 1280x720
Згладжування: вимкнути.
Роздільна здатність текстур:низький. / Середн. / Високий. / макс.
Ефекти:низький. / Середн. / Високий. / макс.
Об'єкт:низький. / Середн. / Високий. / макс.
Частинки:низький. / Середн. / Високий. / макс.
Постобробка:низький. / Середн. / Високий. / макс.
Затінення:низький. / Середн. / Високий. / макс.
Тіні:низький. / Середн. / Високий. / макс.
Вода:низький. / Середн. / Високий. / макс.
Анізотропний фільтр: 1x / 2x / 4x / 8x / 16x
Ступінь розмитості: вимкнути
Блики: так/ ні


Одна з найвибагливіших до процесора сцен у грі. Приріст лише від частоти процесора. Завантаження 780Ti у цій сцені навіть на i7 не перевищило 50%

_________________________________________________________________________________________________

Grand Theft Auto V Вбудований бенчмарк (Остання сцена)


Розширення: 1280x720
Версія DirectX: 11
Згладжування FXAA: викл/ вкл
Згладжування MSAA: викл/x2/x4/x8
Населеність міста: max
Різновид населення: max
Фокусувальна шкала: max
Якість текстур:стандарт / висока / оч.високе
Якість шейдерів:стандарт / висока / оч.високе
Якість тіней:стандарт / висока / оч.високе
Якість відображень: найвищий ступінь
MSAA для відображення: викл/x2/x4/x8
Якість води:стандарт / висока / оч.високе
Якість частинок:стандарт / висока / оч.високе
Якість трави:стандарт / висока / оч. висока / найвищий ступінь
М'які тіні:різко / м'яко / м'якше / макс.м'яко / AMD CHS / NVIDIA PCSS
Налаштування спецефектів:стандарт / висока / оч. висока / найвищий ступінь
Ступінь розмиття під час руху: min
Ефект глибини різкості: викл/ вкл
Анізотропна фільтрація: x16
Затінення AO:вимк / стандарт / висока
Теселяція:вимк / стандарт / висока / оч.висока

Додаткові налаштування:
Довгі тіні:вимк / вкл
Тіні високого дозволу: вимк / вкл
Підвантаження більш детальних текстур під час польоту:вимк / вкл
Збільшення відстані підвантаження більш деталізованих об'єктів: max
Довжина тіней: max


У цій грі безумовно є приріст і від пам'яті, і від кешу. Дуже добрий приріст i5 2400 3,80GHz щодо стоку 3,20GHz.

_________________________________________________________________________________________________

Mass Effect Andromeda


Розширення: 1280x720
Згладжування: вимкнути.
Зернистість:вимк / вкл
Хроматичні аберації:вимк / вкл
Якість текстур: ультра
Розсіяне затінення:вимк / SSAO / HBAO / повне HBAO
Якість постобробки:низька / середня / висока / ультра
Якість текстур:низька / середня / висока / ультра
Якість освітлення:низька / середня / висока / ультра
Якість тіней:низька / середня / висока / ультра
Якість ефектів:низька / середня / висока / ультра
Якість моделей:низька / середня / висока / ультра
Якість шейдерів:низька / висока
Якість ландшафту:низька / середня / висока / ультра
Якість рослин:низька / середня / висока / ультра


У цій сцені ніхто не розкрив повністю 780Ti.
_________________________________________________________________________________________________

World Of Tanks 0.9.18
Карта: Перевал

Згладжування: відк/ вкл
Графіка:стандартна / покращена
Якість текстур:низько / середньо / високо / максимум
Якість освітлення: максимум
Якість тіней:вимкнено / середньо / високо / максимум
Трава у снайперському режимі:вимк / вкл
Якість дод. ефектів:вимкнено / низько / середньо / високо / максимум
Додаткові ефекти в снайперському режимі: високо
Кількість рослинності:вимкнено / низько / середньо / високо / максимум
Постобробка:вимкнено / низько / середньо / високо / максимум
Ефекти з-під гусениць:вимк / вкл
Якість ландшафту:мінімум / низько / середньо / високо / максимум
Якість води:низько / середньо / високо / максимум
Якість декалей:вимкнено / низько / середньо / високо / максимум
Деталізація об'єктів:низько / середньо / високо / максимум
Деталізація дерев:низько / середньо / високо / максимум
Дальність промальовування:низько / середньо / високо / максимум
Якість розмиття в русі:вимкнено / низько / середньо / високо
Д інамічну зміну якості ефектів:вимк / вкл
Сліди гусениць:вимк / вкл

Висновок: Деякі оглядачі з Youtube просто відключають HT, роблячи з I7 «штучний» i5, але з великим кешем... і кажуть, що різниці немає. Але все ж таки в деяких іграх додатковий кешдає приріст.

І в цілому розгін i5 2400 дає дуже сильний приріст, але тоді доведеться витратитися на материнську плату.

Вітаємо Вас на сайті GECID.com! Добре відомо, що тактова частотата кількість ядер процесора безпосередньо впливають на рівень продуктивності, особливо в оптимізованих під багатопоточність проектах. Ми вирішили перевірити, яку роль цьому грає кеш-пам'ять рівня L3?

Для дослідження цього питання нам був люб'язно наданий інтернет-магазином pcshop.ua 2-ядерний процесор з номінальною робочою частотою 3,7 ГГц та 3 МБ кеш-пам'яті L3 з 12 каналами асоціативності. У ролі опонента виступив 4-ядерний, у якого було відключено два ядра і знижено тактову частоту до 3,7 ГГц. Об'єм кешу L3 у нього становить 8 МБ, і він має 16 каналів асоціативності. Тобто, ключова різниця між ними полягає саме в кеш-пам'яті останнього рівня: у Core i7 її на 5 МБ більше.

Якщо це відчутно вплине на продуктивність, можна буде провести ще один тест з представником серії Core i5, у яких на борту 6 МБ кеша L3.

Але поки що повернемося до поточного тесту. Допомагатиме учасникам відеокарта та 16 ГБ оперативної пам'яті DDR4-2400 МГц. Порівнювати ці системи будемо з роздільною здатністю Full HD.

Для початку почнемо з розсинхронізованих живих геймплеїв, у яких неможливо однозначно визначити переможця. У Dying Lightна максимальних налаштуванняхякості обидві системи показують комфортний рівень FPS, хоча завантаження процесора і відеокарти в середньому було вищим саме у випадку Intel Core i7.

Arma 3має добре виражену процессорозависимость, отже більший обсяг кеш-пам'яті має зіграти свою позитивну роль навіть за ультрависоких налаштуваннях графіки. Тим більше, що навантаження на відеокарту в обох випадках досягало максимум 60%.

Гра DOOMна ультрависоких налаштуваннях графіки дозволила синхронізувати лише перші кілька кадрів, де перевага Core i7 складає близько 10 FPS. Розсинхронізація подальшого геймплей не дозволяє визначити ступінь впливу кеша на швидкість відеоряду. У будь-якому випадку частота трималася вище за 120 кадрів/с, тому особливого впливу навіть 10 FPS на комфортність проходження не мають.

Завершує міні-серію живих геймплей Evolve Stage 2. Тут ми, напевно, побачили б різницю між системами, оскільки в обох випадках відеокарта завантажена орієнтовно на половину. Тому суб'єктивно здається, що рівень FPS у випадку Core i7 вищий, але однозначно не можна сказати, оскільки сцени не ідентичні.

Інформативнішу картину дають бенчмарки. Наприклад, в GTA Vможна побачити, що за містом перевага 8 МБ кешу досягає 5-6 кадрів/с, а в місті – до 10 FPS завдяки вищому завантаженню відеокарти. При цьому сам відеоприскорювач в обох випадках завантажений далеко не максимум, і все залежить саме від CPU.

Третій відьмакми запустили з позамежними налаштуваннями графіки та високим профілем постобробки. В одній із заскриптованих сцен перевага Core i7 місцями досягає 6-8 FPS при різкій зміні ракурсу та необхідності підвантаження нових даних. Коли навантаження на процесор і відеокарту знову досягають 100%, то різниця зменшується до 2-3 кадрів.

Максимальний пресет графічних налаштувань у XCOM 2не став серйозним випробуванням для обох систем і частота кадрів знаходилася в районі 100 FPS. Але і тут більший обсяг кеш-пам'яті трансформувався на додаток до швидкості від 2 до 12 кадрів/с. І хоча обом процесорам не вдалося максимально завантажити відеокарту, варіант на 8 МБ і в цьому питанні місцями процвітав краще.

Найбільше здивувала гра Dirt RallyМи запустили з пресетом дуже високо. У певні моменти різниця сягала 25 кадрів/с виключно через більший обсяг кеш-пам'яті L3. Це дозволяло на 10-15% краще завантажувати відеокарту. Однак середні показники бенчмарку показали скромнішу перемогу Core i7 - всього 11 FPS.

Цікава ситуація вийшла і з Rainbow Six Siege: на вулиці, у перших кадрах бенчмарку, перевага Core i7 складала 10-15 FPS. Усередині приміщення завантаження процесорів та відеокарти в обох випадках досягло 100%, тому різниця зменшилася до 3-6 FPS. Але наприкінці, коли камера вийшла за межі будинку, відставання Core i3 знову перевищувало 10 кадрів/с. Середній показник опинився на рівні 7 FPS на користь 8 МБ кешу.

The Divisionпри максимальній якості графіки також добре реагує збільшення обсягу кеш пам'яті. Вже перші кадри бенчмарку на повну завантажили всі потоки Core i3, а ось загальне навантаження на Core i7 становило 70-80%. Однак різниця у швидкості в ці моменти становила лише 2-3 FPS. Трохи пізніше навантаження на обидва процесори досягло 100%, а різниця у певні моменти вже була за Core i3, але лише на 1-2 кадри/с. У середньому вона склала близько 1 FPS на користь Core i7.

У свою чергу бенчмаркRise of Tomb Riderпри високих налаштуваннях графіки у всіх трьох тестових сценах наочно показав перевагу процесора із значно більшим обсягом кеш пам'яті. Середні показники у нього на 5-6 FPS краще, але якщо уважно подивитися на кожну сцену, то місцями відставання Core i3 перевищує 10 кадрів/с.

А ось при виборі пресета з дуже високими налаштуваннями зростає навантаження на відеокарту та процесори, тому здебільшого різниця між системами зменшується до декількох кадрів. І лише короткочасно Core i7 може показувати значніші результати. Середні показники його переваг за підсумками бенчмарку знизилися до 3-4 FPS.

Hitmanтакож менше схильний до впливу кеш-пам'яті L3. Хоча і тут за ультрависокого профілю деталізації додаткові 5 МБ забезпечили найкраще завантаженнявідеокарти, перетворивши це на додаткові 3-4 кадри/с. Особливо критичного впливу на продуктивність вони не надають, але із суто спортивного інтересу приємно, що є переможець.

Високі налаштування графіки Deus ex: Mankind dividedвідразу ж зажадали максимальної обчислювальної потужностівід обох систем, тому різниця у кращому разі становила 1-2 кадри на користь Core i7, на що вказує і середній показник.

Повторний запуск при ультрависокому пресеті ще більше завантажив відеокарту, тому вплив процесора на загальну швидкість став ще меншим. Відповідно, різниця в кеш-пам'яті L3 практично не впливала на ситуацію і середній FPS відрізнявся менш ніж на півкадра.

За підсумками тестування можна відзначити, що вплив кеш-пам'яті L3 на продуктивність в іграх дійсно має місце, але воно проявляється лише тоді, коли відеокарта не завантажена на повну потужність. У таких випадках можна було б отримати приріст у 5-10 FPS, якби кеш збільшився у 2,5 рази. Тобто орієнтовно виходить, що за інших рівних кожен додатковий МБ кеш-пам'яті L3 додає лише 1-2 FPS до швидкості відображення відеоряду.

Так що, якщо порівнювати сусідні лінійки, наприклад, Celeron і Pentium, або моделі з різним об'ємом кеш-пам'яті L3 всередині серії Core i3, то основний приріст продуктивності досягається завдяки більш високим частотам, а потім і наявності додаткових процесорних потоків та ядер. Тому, вибираючи процесор, у першу чергу, все ж таки, потрібно орієнтуватися на основні характеристики, а тільки потім звертати увагу на обсяг кеш-пам'яті.

На цьому все. Спасибі за увагу. Сподіваємося, цей матеріал був корисним та цікавим.

Стаття прочитана 27046 раз(и)

Підписатися на наші канали

Наскільки важливим є кеш L3 для процесорів AMD?

Справді, є сенс оснащувати багатоядерні процесори виділеної пам'яттю, яка використовуватиметься разом усіма доступними ядрами. У цьому ролі швидкий кеш третього рівня (L3) може значно прискорити доступом до даних, які запитуються найчастіше. Тоді ядрам, якщо є така можливість, не доведеться звертатися до повільної основної пам'яті (ОЗУ, RAM).

Принаймні теоретично. Нещодавно AMD анонсувала процесор Athlon II X4, що є модель Phenom II X4 без кеша L3, натякаючи на те, що він не такий і необхідний. Ми вирішили прямо порівняти два процесори (з кешем L3 і без), щоб перевірити, як кеш впливає на продуктивність.

Натисніть на зображення для збільшення.

Як працює кеш?

Перед тим, як ми заглибимось у тести, важливо зрозуміти деякі основи. Принцип роботи кешу досить простий. Кеш буферизує дані якомога ближче до обчислювальних ядра процесора, щоб знизити запити CPU в більш віддалену і повільну пам'ять. У сучасних настільних платформ ієрархія кешу включає цілих три рівні, які передують доступу до оперативної пам'яті. Причому кеші другого і, зокрема, третього рівнів служать як для буферизації даних. Їхня мета полягає у запобіганні перевантаженню шини процесора, коли ядрам необхідно обмінятися інформацією.

Попадання та промахи

Ефективність архітектури кешів вимірюється відсотком влучень. Запити даних, які можуть бути задоволені кешем, вважаються влученнями. Якщо даний кешне містить потрібні дані, то запит передається далі конвеєром пам'яті, і зараховується промах. Звичайно, промахи призводять до більшого часу, який потрібний для отримання інформації. В результаті в обчислювальному конвеєрі з'являються "бульбашки" (простої) та затримки. Влучення, навпаки, дозволяють підтримати максимальну продуктивність.

Запис у кеш, ексклюзивність, когерентність

Політики заміщення диктують, як у кеші звільняється місце під нові записи. Оскільки дані, що записуються в кеш, рано чи пізно повинні з'явитися в основній пам'яті, системи можуть робити це одночасно із записом в кеш (write-through) або можуть маркувати дані області як "брудні" (write-back), а виконувати запис у пам'ять тоді, коли вона витіснятиметься з кешу.

Дані в кількох рівнях кешу можуть зберігатися ексклюзивно, тобто без надмірності. Тоді ви не знайдете однакових рядків даних у двох різних ієрархіях кешу. Або кеші можуть працювати інклюзивно, тобто нижні рівні кешу гарантовано містять дані, присутні у верхніх рівнях кешу (ближче до процесорного ядра). У AMD Phenom використовуються ексклюзивний кеш L3, а Intel слідує за стратегією інклюзивного кеша. Протоколи когерентності стежать за цілісністю та актуальністю даних між різними ядрами, рівнями кешів та навіть процесорами.

Об'єм кешу

Найбільший за обсягом кеш може містити більше даних, але спостерігається тенденція збільшення затримок. Крім того, великий за обсягом кеш споживає чимало транзисторів процесора, тому важливо знаходити баланс між "бюджетом" транзисторів, розміром кристала, енергоспоживанням і продуктивністю/затримками.

Асоціативність

Записи в оперативній пам'яті можуть прив'язуватися до кешу безпосередньо (direct-mapped), тобто для копії даних з оперативної пам'яті існує лише одна позиція в кеші, або вони можуть бути асоціативними в n-ступені (n-way associative), тобто існує n можливих розташування в кеші, де можуть зберігатися ці дані. Вищий ступінь асоціативності (до повністю асоціативних кешів) забезпечує найкращу гнучкість кешування, оскільки існуючі дані в кеші не потрібно переписувати. Іншими словами, висока n-ступінь асоціативності гарантує вищий відсоток влучень, але при цьому збільшується затримка, оскільки потрібно більше часу на перевірку всіх цих асоціацій для влучення. Як правило, найбільша міра асоціації розумна для останнього рівня кешування, оскільки там доступна максимальна ємність, а пошук даних за межами цього кешу призведе до звернення процесора до повільної оперативної пам'яті.

Наведемо кілька прикладів: у Core i5 та i7 використовується 32 кбайт кешу L1 з 8-way асоціативністю для даних та 32 кбайт кешу L1 з 4-way для інструкцій. Зрозуміло бажання Intel, щоб інструкції були доступні швидше, а кеш L1 для даних мав максимальний відсоток влучень. Кеш L2 у процесорів Intelмає 8-way асоціативність, а кеш L3 у Intel ще "розумніший", оскільки в ньому реалізована 16-way асоціативність для максимізації влучень.

Однак AMD слідує інший стратегії з процесорами Phenom II X4, де використовується кеш L1 з 2-way асоціативністю для зниження затримок. Щоб компенсувати можливі промахи, ємність кеша була збільшена вдвічі: 64 кбайт для даних і 64 кбайт для інструкцій. Кеш L2 має 8-way асоціативність, як і у дизайну Intel, але кеш L3 у AMD працює з 48-way асоціативністю. Але рішення вибору тієї чи іншої архітектури кешу не можна оцінювати без розгляду всієї архітектури CPU. Цілком природно, що практичне значення мають результати тестів, і нашою метою була практична перевірка всієї цієї складної багаторівневої структури кешування.

Кожен сучасний процесор має виділений кеш, яких зберігає інструкції та дані процесора, які готові до використання практично миттєво. Цей рівень зазвичай називають першим рівнем кешування або L1, вперше такий кеш з'явився у процесорів 486DX. Нещодавно процесори AMDстали стандартно використовувати по 64 кбайт кешу L1 на ядро ​​(для даних та інструкцій), а процесори Intel використовують по 32 кбайт кешу L1 на ядро ​​(теж для даних та інструкцій)

Кеш першого рівня вперше з'явився на процесорах 486DX, після чого він став складовою функцією всіх сучасних CPU.

Кеш другого рівня (L2) з'явився на всіх процесорах після виходу Pentium III, хоча перші його реалізації на упаковці були в процесорі Pentium Pro (але не на кристалі). Сучасні процесори оснащуються до 6 Мб кеш-пам'яті L2 на кристалі. Як правило, такий обсяг поділяється між двома ядрами на процесорі Intel Core 2 Duo, наприклад. Звичайні конфігурації L2 передбачають 512 кбайт або 1 Мбайт кешу на ядро. Процесори з меншим обсягом кешу L2, як правило, відносяться до нижнього цінового рівня. Нижче представлено схему ранніх реалізацій кешу L2.

У Pentium Pro кеш L2 знаходився в упаковці процесора. У поколінь Pentium III і Athlon кеш L2 був реалізований через окремі чіпи SRAM, що було в той час дуже поширене (1998, 1999).

Послідовне оголошення техпроцесу до 180 нм дозволило виробникам інтегрувати кеш L2 на кристал процесора.


Перші двоядерні процесори просто використовували існуючі дизайни, коли в упаковку встановлювалися два кристали. AMD представила двоядерний процесор на монолітному кристалі, додала контролер пам'яті та комутатор, а Intel для свого першого двоядерного процесора просто зібрала два одноядерні кристали в одній упаковці.


Вперше кеш L2 став використовуватись спільно двома обчислювальними ядрами на процесорах Core 2 Duo. AMD пішла далі і створила свій перший чотириядерний Phenom "з нуля", а Intel для свого першого чотириядерного процесора знову використала пару кристалів, цього разу вже два двоядерні кристали Core 2, щоб знизити витрати.

Кеш третього рівня існував ще з перших днів процесора Alpha 21165 (96 кбайт, процесори представлені в 1995) або IBM Power 4 (256 кбайт, 2001). Однак в архітектурах на основі x86 кеш L3 вперше з'явився разом із моделями Intel Itanium 2, Pentium 4 Extreme (Gallatin, обидва процесори в 2003 році) та Xeon MP (2006).

Перші реалізації давали ще один рівень в ієрархії кешу, хоча сучасні архітектури використовують кеш L3 як великий і загальний буфер для обміну даними між ядрами в багатоядерних процесорах. Це підкреслює і високий n-ступінь асоціативності. Краще пошукати дані трохи довше у кеші, ніж отримати ситуацію, коли кілька ядер використовують дуже повільний доступ до основної оперативної пам'яті. AMD вперше представила кеш L3 на процесорі для настільних ПК разом з лінійкою Phenom, що вже згадувалася. 65-нм Phenom X4 містив 2 Мбайт загального кешу L3, а сучасні 45-нм Phenom II X4 мають 6 Мбайт загального кешу L3. У процесорів Intel Core i7 та i5 використовується 8 Мбайт кешу L3.

Сучасні чотириядерні процесори мають виділені кеші L1 та L2 для кожного ядра, а також великий кеш L3, що є загальним для всіх ядер. Загальні кеш L3 дозволяє обмінюватися даними, над якими ядра можуть працювати паралельно.


При виконанні різних завдань процесор вашого комп'ютера надходять необхідні блоки інформації з оперативної пам'яті. Обробивши їх ЦП записує отримані результати обчислень на згадку і отримує обробку наступні блоки даних. Так триває доти, доки поставлене завдання не буде виконано.

Вищезгадані процеси виробляються на дуже великої швидкості. Однак швидкість навіть найшвидшої оперативної пам'яті значно менша за швидкість будь-якого слабкого процесора. Кожна дія, чи це запис на неї інформації або зчитування з неї займають багато часу. Швидкість роботи оперативної пам'яті в десятки разів нижча за швидкість процесора.

Незважаючи на таку різницю у швидкості обробки інформації, процесор ПК не простоює без діла і не чекає, коли ОЗУ видасть та прийме дані. Процесор завжди працює і завдяки присутності в ньому кеш пам'яті.

Кеш – особливий вид оперативної пам'яті. Процесор використовує пам'ять кешу для зберігання тих копій інформації з основної оперативної пам'яті комп'ютера, ймовірність звернення яких найближчим часом дуже велика.

По суті кеш-пам'ять виконує роль швидкодіючого буфера пам'яті, що зберігає інформацію, яка може знадобитися процесору. Таким чином, процесор отримує необхідні дані в десятки разів швидше, ніж при зчитуванні їх з оперативної пам'яті.

Основною відмінністю кеш пам'яті від звичайного буфера є вбудовані логічні функції. У буфері зберігаються випадкові дані, які зазвичай обробляються за схемою «отримано першим, видано першим» чи «отримано першим, видано останнім». У кеш пам'яті містяться дані, ймовірність звернення яких найближчим часом дуже велика. Тому завдяки «розумному кешу» процесор може працювати з повною швидкістю і не чекати на дані, що витягуються з повільнішої оперативної пам'яті.

Основні типи та рівні кеш-пам'яті L1 L2 L3

Кеш пам'ять виконано як мікросхем статичної оперативної пам'яті (SRAM), які встановлюються на системної платі чи вбудовані в процесор. У порівнянні з іншими видами пам'яті, статична пам'ять здатна працювати на дуже високих швидкостях.

Швидкість кешу залежить від обсягу конкретної мікросхеми, Чим більший обсяг мікросхеми, тим важче досягти високої швидкостідля її роботи. Враховуючи цю особливістьПри виготовленні кеш пам'ять процесора виконують у вигляді декількох невеликих блоків, що називаються рівнями. Найпоширенішою на сьогоднішній день вважається трирівнева система кеша L1, L2, L3:

Кеш пам'ять першого рівня L1 — найменша за обсягом (загалом кілька десятків кілобайт), але найшвидша за швидкістю і найважливіша. Вона містить дані, що найчастіше використовуються процесором і працює без затримок. Зазвичай кількість мікросхем пам'яті рівня L1 дорівнює кількості ядер процесора, причому кожне ядро ​​отримує доступ тільки до своєї мікросхеми L1.

Кеш пам'ять рівня L2 за швидкістю поступається пам'яті L1, але виграє в об'ємі, який вимірюється вже в кількох сотнях кілобайт. Вона призначена для тимчасового зберігання важливої ​​інформації, Імовірність звернення до якої нижче, ніж у інформації що зберігається в кеші L1.

Третій рівень кеш пам'яті L3 — має найбільший обсяг із трьох рівнів (може досягати десятків мегабайт), але й має найповільнішу швидкість, яка все ж таки значно вища за швидкість оперативної пам'яті. Кеш пам'ять L3 служить загальною всім ядер процесора. Рівень пам'яті L3 призначений для тимчасового зберігання тих важливих даних, ймовірність звернення до яких трохи нижче, ніж у інформації, що зберігається в перших двох рівнях L1, L2. Вона також забезпечує взаємодію ядер процесора між собою.

Деякі моделі процесорів виконані з двома рівнями кеш пам'яті, де L2 поєднує всі функції L2 і L3.

Коли корисний великий обсяг кешу.

Значний ефект від великого обсягу кешу ви відчуєте під час використання програм архіваторів, у 3D іграх, під час обробки та кодування відео. У відносно «легких» програмах та додатках різниця практично не помітна (офісні програми, плеєри тощо).

Всім доброго доби. Сьогодні ми намагатимемося розтлумачити вам таке поняття як кеш. Кеш пам'ять процесора – це надшвидкий масив обробки даних, швидкість якого перевищує показники стандартної ОЗУ в 16–17 разів, якщо йдеться про DDR4.

З цієї статті ви дізнаєтесь:

Саме обсяг кеш-пам'яті дозволяє ЦП працювати на граничних швидкостях, не чекаючи, поки оперативна пам'ять обробить будь-які дані і не надішле результати готових обчислень чіпа для подальшої обробки. Аналогічний принцип простежується у HDD, лише там використовується буфер на 8-128 МБ. Інша річ, що швидкості набагато нижчі, але процес роботи аналогічний.

Що таке кеш-процесора?

Як взагалі відбувається процес обчислень? Всі дані зберігаються в оперативній пам'яті, яка призначена для тимчасового зберігання важливої ​​користувальницької та системної інформації. Процесор вибирає собі певну кількість завдань, які заганяються в надшвидкий блок, іменований кеш-пам'яттю, і починає займатися своїми прямими обов'язками.

Результати обчислень знову відправляються в ОЗУ, але вже в набагато меншій кількості (замість тисячі значень на виході отримуємо набагато менше), а на обробку береться новий масив. І так доти, доки роботу не буде зроблено.

Швидкість роботи визначається ефективністю оперативної пам'яті. Але жоден сучасний модуль DDR4, включаючи оверклокерські рішення із частотами під 4000 МГц, і поряд не стояв із можливостями самого чахлого процесора з його «повільним» КЕШом.

Все тому, що швидкість роботи ЦП перевищує показники роботи ОЗУ в середньому разів у 15, а то й вище. І не дивіться лише на параметри частоти, крім них відмінностей вистачає.
Теоретично виходить, що навіть надпотужні Intel Xeon і AMD Epyc змушені простоювати, але за фактом обидва серверні чіпи працюють на межі можливостей. А все тому, що вони набирають необхідну кількість даних за величиною кешу (до 60 і більше МБ) і миттєво обробляють дані. ОЗУ служить як склад, звідки черпаються масиви для обчислень. Ефективність обчислень комп'ютера зростає і задоволені.

Короткий екскурс в історію

Перші згадки про кеш-пам'ять датовані кінцем 80-х років. До цього часу швидкість роботи процесора та пам'яті були приблизно однаковою. Стрімкий розвиток чіпів вимагав придумати якийсь «милицею», щоб підвищити рівень швидкодії ОЗУ, проте використовувати надшвидкі чіпи було дуже затратно, а тому вирішили обійтися більш економічним варіантом – впровадженням швидкісного масиву пам'яті в ЦП.

Вперше модуль кеш-пам'яті з'явився в Intel 80386. У той час затримки при роботі DRAM коливалися в межах 120 наносекунд, тоді як сучасніший модуль SRAM скорочував час затримок до значних на ті часи 10 наносекунд. Орієнтовна картина більш наочно продемонстрована в протистоянні HDD проти SSD.

Спочатку кеш-пам'ять розпаювалася прямо на материнських платах, зважаючи на рівень техпроцесу того часу. Починаючи з Intel 80486, 8 кб пам'яті було впроваджено безпосередньо в кристал процесора, що додатково збільшувало продуктивність і знижувало площу кристала.

Ця технологія розташування залишалася актуальною лише до виходу Pentium MMX, після чого SRAM-пам'ять замінили більш прогресивною SDRAM.
Та й процесори стали набагато меншими, а тому потреба у зовнішніх схемах відпала.

Рівні кеш-пам'яті

На маркуванні сучасних ЦП, крім , можна зустріти таке поняття як розмір кеша 1,2 і 3 рівнів. Як він визначається та на що впливає? Давайте розбиратися простою мовою.

  • Кеш першого рівня (L1) – найважливіша та швидка мікросхема в архітектурі ЦП. Один процесор може вмістити кількість модулів, рівних кількості ядер. Примітно, що мікросхема може зберігати в пам'яті найбільш потрібні та важливі дані лише зі свого ядра. Обсяг масиву часто обмежений показником 32–64 КБ.
  • Кеш другого рівня (L2) – падіння швидкості компенсується збільшенням обсягу буфера, що сягає 256, або навіть 512 КБ. Принцип дії такий самий, як і у L1, а ось частота запиту до пам'яті нижче, зважаючи на зберігання в ній менш пріоритетних даних.
  • Кеш третього рівня (L3) – найповільніший та найоб'ємніший розділ серед усіх перерахованих. І все одно цей масив набагато швидше за оперативну пам'ять. Розмір може досягати 20 і навіть 60 МБ, якщо мова стосується серверних чіпів. Користь від масиву величезна: він є ключовою ланкою обміну даними між усіма ядрами системи. Без L3 всі елементи чіпа були б розрізнені.

У продажу можна зустріти як двох-і трирівневу структуру пам'яті. Яка з них краща? Якщо ви використовуєте процесор лише для офісних програмі казуальних ігор, то жодної різниці не відчуєте. Якщо ж система збирається з прицілом під складні 3D-ігри, архівацію, рендеринг та роботу з графікою, то приріст у деяких випадках коливатиметься від 5 до 10%.
Кеш третього рівня виправданий лише в тому випадку, якщо ви маєте намір регулярно працювати з багатопотоковими програмами, що вимагають регулярні складні розрахунки. Тому в серверних моделях часто використовують кеш L3 великих обсягів. Хоча трапляються випадки, що цього не вистачає, а тому доводиться додатково ставити так звані модулі L4, які виглядають як окрема мікросхема, що підключається до материнської плати.

Як дізнатися кількість рівнів та розмір кешу на своєму процесорі?

Почнемо з того, що зробити це можна 3 способами:

  • через командний рядок(тільки кеш L2 та L3);
  • шляхом пошуку специфікацій в Інтернеті;
  • за допомогою сторонніх утиліт.

Якщо взяти за основу той факт, що більшість процесорів L1 становить 32 КБ, а L2 і L3 можуть коливатися в широких межах, останні 2 значення нам і потрібні. Для їхнього пошуку відкриваємо командний рядок через «Пуск» (вводимо значення «cmd» через рядок пошуку).

Система покаже підозріло велике значення для L2. Необхідно поділити його на кількість ядер процесора та дізнатися підсумковий результат.

Якщо ви збираєтеся шукати дані в мережі, то для початку дізнайтеся точне ім'я ЦП. Натисніть правою кнопкою по іконці «Мій комп'ютер» та виберіть «Властивості». У графі «Система» буде пункт «Процесор», який нам, власне, потрібний. Переписуєте його назву в той же Google або Yandex і дивіться на сайтах. Для достовірної інформації краще обирати офіційні портали виробника (Intel чи AMD).
Третій спосіб також не викликає проблем, але вимагає встановлення додаткового софту на кшталт GPU-Z, AIDA64 та інших утиліт для вивчення специфікацій каменю. Варіант для любителів розгону та копошення в деталях.

Підсумки

Тепер ви розумієте, що таке кеш-пам'ять, від чого залежить її обсяг і для яких цілей використовується надшвидкий масив даних. На даний момент найбільш цікавими рішеннями на ринку в плані великого обсягу кеш-пам'яті, можна назвати пристрої AMD Ryzen 5 і 7 з 16 МБ L3.

У наступних статтях висвітлимо такі теми як процесорів, користь від чіпів і не лише. і залишайтеся з нами. До нових зустрічей поки що.

© 2022 androidas.ru - Все про Android