- Кэширование: определение, проверка, настройка и как оно вообще работает
- Кэширование — что это?
- Что такое кэшированные данные и их актуальность
- Кэширование и его преимущества
- Стратегии кэширования
- Заключение
- Основы кэширования. Как? Когда? Зачем?
- Нужно ли нам использовать кэширование?
- С чего начать?
- Приступаем к теории
- Кэширование и производительность веб-приложений
- Процессорный кэш
- Кэш жёсткого диска
- О быстродействии жёстких дисков и оперативной памяти
- Простой веб-сервер
- Кэширование баз данных
- Кэширование ответов веб-сервера
- Мемоизация функций
- Кэширование в браузере
- Кэширование и прокси-серверы
- ▍Шлюзы
- ▍Прямые прокси-серверы
- ▍Веб-ускорители
- ▍Обратные прокси-серверы
- ▍Пограничное кэширование
- Итоги
Кэширование: определение, проверка, настройка и как оно вообще работает
Кэширование — это способ временно сохранить информацию из прошлых запросов пользователя, чтобы в будущем быстрее ее предоставить. Кэширование является стратегически м процессом, обеспечивающим высокую производительность программ. Однако кэширование должно быть разумным, так как оно обладает побочными эффектами.
Кэшированные данные — информация, сохраненная локально в памяти устройства, которую пользователь чаще всего использует. Обычно это информация о разных приложениях, если мы говорим об устройстве. Но в каждом браузере организовано веб-кэширование. Это процесс сохранения информации внутри браузера о посещенных веб-сайтах. Благодаря этому процесс у б раузеру не нужно постоянно обращаться к серверу о часто посещаемом веб-ресурсе, что экономит время пользователя.
Однако размер кэша не безграничен. Кэшированные данные занимают память, а это значит, что если не ставить ограничения на объем кэша и не проводить периодическую «чистку», тогда есть риск, что память переполнится. Переполнение памяти грозит аварийным завершением работы устройства или программы.
Кэширование — что это?
Кэширование — это технология сохранения копии информации в локальной памяти. Этот процесс часто связан с информацией, которую создавать повторно дорого или долго. Извлечение такой информации непосредственно из памяти устройства дешевле и быстрее.
Кэширование — это многоуровневый процесс. Рядовой пользователь знаком с кэшированием на уровне браузера, когда проводится чистка кэша и его истории , или на уровне устройства, когда чистится кэш и «мусорные файлы» телефона или компьютера. Однако это не все уровни кэширования. Между пользователем и сервером-источником информации различают следующие уровни кэширования:
общие кэшированные данные веб-сервера — обычно это информация сразу для нескольких пользователей;
кэшированные данные сети доставки информации — это также информация сразу о нескольких пользователях;
кэширование интернет-провайдера — это также кэш сразу о нескольких пользователях;
кэшированные данные устройства — это информация о запускаемых программах;
кэширование веб-браузера — информация о посещенных веб-страницах.
Каждый отдельный пользователь имеет влияние только на последние два уровня кэширования: кэш устройства и веб-браузера.
Что такое кэшированные данные и их актуальность
Кэшированные данные — это некая сохраненная информация. Однако не сложно догадаться, что такая информация устаревает, потому что кэшированный ресурс постоянно изменяется. Но для пользователя важно получать «свежую» информацию. Чтобы поддерживать актуальность к э ша, важно постоянно его обновлять.
Кэшированные данные не сравниваются с данными сервера при каждом обращении к ним. Если бы это делалось, тогда смысла в кэшировании не было бы , потому что тратилось бы много времени на проверку актуальности информации, плю с д ополнительно нагружалась бы сеть. Поэтому принято считать кэшированные данны е актуальными и отправлять их пользователю в течение определенного времени. Время актуальности информации определяется параметрами кэша. То ест ь п ри определении кэша для ресурса ему задается период времени, во время которого кэш считается актуальным. Таким образом, браузер, запуская веб-ресурс из кэша , не проверят его актуальность с серверной версией, а лишь следит , чтобы кэш соответствовал определенному периоду. Если кэш «устарел», тогда браузер скачивает с сервера его свежую копию и отправляет ее пользователю. Если кэш актуальный, тогда информация сразу доставляется пользователю.
Чуть выше мы описали работу кэширования в браузере. Однако на уровне сервера оно происходит по похожему алгоритму, только сервер кэширует данные для нескольких пользователей. Плю с к эширует в б о льших масштабах, чем браузер. Например , в кэше сохраняются часто используемые веб-сайты и хранимый на них контент: аудио, видео, изображения, статьи и др. Такой подход позволяет серверам быстрее показывать веб-сайты пользователям.
Кэширование и его преимущества
Для разных уровней кэшировани я э то т процесс несет свои преимущества. Например:
Снижает стоимость запросов. Потому что есть возможность кэшировать контент ближе к потребителю, а значит , для предоставления контента не нужно проходить весь путь по сети.
Повышает отзывчивость. Потому что пользователь быстрее получает кэшированный контент, например , из браузера — практически мгновенный процесс. А это значит, что пользователь может быстрее взаимодействовать с контентом.
Повышает производительность. Так как кэширование происходит на разных уровнях, это означает, что нагрузка на обслуживани е пользователя плавно распределяется. В конечном счет е р аспределение нагрузки улучшает общую производительность.
Оставляет контент доступным. В случае коротких сбоев в сет и к эшированные данные остаются доступными для пользователя.
Кэшировать можно не весь контент. Например , контент, который очень быстро меняется, нужно кэшировать осторожно, потому что есть риск, что пользователю будет показана не свежая информация. Категорически не рекомендуется к э ширование конфиденциальной информации, например , личные данные или банковские реквизиты.
Стратегии кэширования
Идеальный интернет — это если можно было бы закэшировать все веб-ресурсы максимально близко к пользователям. Однак о с технической сторон ы э то не представляется возможным, поэтому стратегию кэширования приходится балансировать между меняющимся контентом и временем кэша.
Есть такие ситуации, когда реализовать кэширование невозможно. Например, когда на сайте присутствует динамический контент, который очень часто меняется , или контент, который генерируется для каждого отдельного пользователя. Если закэшировать такой ресурс, тогда пользователю будет предоставляться неточный контент.
Нет единой стратегии кэширования. Для каждого отдельного ресурса этот процесс будет иметь собственное значение. Важно помнить, что при создании кэша нужно соблюдать баланс. Поэтому нужно брать во внимание, что на каждом веб-ресурсе будут:
компоненты, которые можно надолго кэшировать;
компоненты, у которых срок кэширования будет коротким;
компоненты, которые нельзя кэшировать.
Заключение
Кэширование — это способ быстрее показать нужный контент для пользователя, увеличить производительность, сократить расходы на обслуживание компонентов сайта и др. При этом не нужно думать, что кэшированные данные — это волшебная палочка для веб-ресурса. Кэширование — это еще один инструмент, чтобы сделать контент и пользователя «ближе».
Мы будем очень благодарны
если под понравившемся материалом Вы нажмёте одну из кнопок социальных сетей и поделитесь с друзьями.
Источник
Основы кэширования. Как? Когда? Зачем?
Речь пойдет о кэшировании в web, а точнее как и с чего начать. Часто вижу как web-разработчики, не имеющие опыта работы с кэшированием, приступая к работе делают все не правильно, а потом думают почему получают не свежие данные (иногда считают, что по другому и не может быть) или почему нагрузка на сервер не снизилась.
Конечно все зависит от поставленной задачи, то-есть подход везде будет разный. Я расскажу на примере новостного сайта в каких случаях нужно кэширование и в каких не нужно, ну и конечно, с примерами.
Нужно ли нам использовать кэширование?
Перед тем как приняться кэшировать все подряд, определимся нужно ли оно нам? Оно может понадобится в двух случаях:
— Снижение нагрузки на сервер. Тут все понятно, сервер захлебывается не справляется с поставленной задачей.
— Уменьшение времени генерации страницы. Бывают случаи, когда обработка данных перед выводом занимает много времени. Вместо того, что бы каждый раз их обрабатывать можно один раз обработать и положить в кэш. В результате данные из кэша будут отдаваться моментально.
С чего начать?
И так, мы поняли, что кэширование вам необходимо как воздух. Но как определить места которые в нем нуждаются, и которым он точно не нужен? Давайте рассмотрим, как пример, обычный новостной сайт. В большинстве случаев узким местом становится база данных, значит нам нужно кэшировать выборки. Какие у нас самые посещаемые страницы?
— Главная, её составными являются много блоков (последние новости, популярные за последнюю неделю, самые комментируемые новости, последние комментарии к новостям и тд.).
— Просмотр самой новости, а там и комментариями к ней.
— Для авторизированого пользователя доступна система личных сообщений, в этом случае на каждой странице мы вынуждены делать запрос в базу данных проверяя появились ли новые сообщения, если да — сообщить пользователю.
Что надо кэшировать мы поняли, а что не надо? Хотя тут скорее стоит вопрос надо ли кэшировать? Например, список личных сообщений. В нашем случае кэшировать его не нужно, так как специализация сайта — новости, то пользователи просматривают их только когда получают новые сообщения, что является редкостью.
Приступаем к теории
Есть несколько тактик кэширования:
— Устаревание (на определенное время).
— Инвалидация (навсегда и при надобности сами его убиваем).
— Комбинирование (на определенное время, но так же при надобности сами его убиваем).
При использовании устаревания время на которые данные будут закэшированы подбирается в зависимости от частоты обновления этих данных и уровня важности получения актуальных данных. Мы определили места с которыми будем работать, так что приступим.
Главная страница
В связи с тем, что на этой странице у нас много блоков, получаем много запросов к базе данных. Можно было бы кэшировать контент главной страницы целиком, и обновлять её раз в 10 минут, но так как у нас блоки имеют разную частоту обновления придется кэшировать по отдельности. Рассмотрим каждый блок.
— Последние новости. Кэшируем его навсегда, убиваем при добавлении новости на сайт.
— Популярные новости за последнюю неделю. Кэшируем на сутки.
— Самые комментируемые новости. Кэшируем на час.
— Последние комментарии к новостям. Кэшируем навсегда, убиваем при добавлении нового комментария. Если новые комментарии появляются очень быстро, кэшируем блок на одну минуту.
Просмотр новости
Здесь этап кэширования делится на две части — самой новости и комментариев к ней.
а) Новость. Представим, что новость оформляется bb-кодами, а процесс преобразования в html трудоемок и иногда даже длителен (регулярные выражения ещё как едят процессорное время), значит мы должны один раз преобразовать и закэшировать готовый html. Новость мы кэшируем навсегда, а кэш убиваем при изменении / удалении новости. Но как же быть если у нас есть счетчик просмотров вы спросите? Все очень просто, можно было бы обновлять постоянно кеш самой новости, но этот трюк рискован так как есть вероятность нарушения целостности данных. Для этого мы создадим кеш количества просмотров. При просмотре новости у нас будет ити запрос в базу обновляя количество просмотров, а так же инкремент кэша просмотров. Здесь мы так же кэшируем навсегда, удаляем при удалении новости.
б) Комментарии. В комментариях у нас также используются bb-коды, тут мы также храним готовый html комментария, но в кэшируем сериализированный массив комментариев, для чего скажу чуть дальше. Кэшируем навсегда, удаляем кэш при добавлении нового комментария / редактировании или удалении любого комментария к этой новсти / удалении самой новости. А как быть если у нас несколько страниц комментариев? Все комментарии держим в одном кэше, а перед непосредственным выводом бьем их на страницы.
Проверка наличия новых сообщений
Тут надо хорошо подумать перед тем как выбрать тактику кэширования, так как выбирается под тип нагрузки. Рассмотрим несколько вариантов:
а) Мало пользователей, постоянные. Кэшируем навсегда.
б) Много пользователей, постоянные. Тут зависит от того, что нам дороже, память (для кеша) или уменьшение нагрузки от базы данных. Если памяти много и нам её не жалко кэшируем навсегда, иначе на время сессии.
в) Любое количество пользователей, уникальные. Кэшируем на время сессии.
Кэш проверки новых сообщений всегда удаляется при получении нового сообщения и при удалении пользователя.
На этом теория заканчивается, а практика за вами.
PS. Надеюсь тем, кто хочет познакомится с кэшированием, но не знает с чего начать, статься окажется полезной. Спасибо за внимание.
Источник
Кэширование и производительность веб-приложений
Кэширование позволяет увеличивать производительность веб-приложений за счёт использования сохранённых ранее данных, вроде ответов на сетевые запросы или результатов вычислений. Благодаря кэшу, при очередном обращении клиента за одними и теми же данными, сервер может обслуживать запросы быстрее. Кэширование — эффективный архитектурный паттерн, так как большинство программ часто обращаются к одним и тем же данным и инструкциям. Эта технология присутствует на всех уровнях вычислительных систем. Кэши есть у процессоров, жёстких дисков, серверов, браузеров.
Ник Карник, автор материала, перевод которого мы сегодня публикуем, предлагает поговорить о роли кэширования в производительности веб-приложений, рассмотрев средства кэширования разных уровней, начиная с самого низкого. Он обращает особое внимание на то, где именно могут быть кэшированы данные, а не на то, как это происходит.
Мы полагаем, что понимание особенностей систем кэширования, каждая из которых вносит определённый вклад в скорость реакции приложений на внешние воздействия, расширит кругозор веб-разработчика и поможет ему в деле создания быстрых и надёжных систем.
Процессорный кэш
Начнём наш разговор о кэшах с самого низкого уровня — с процессора. Кэш-память процессора — это очень быстрая память, которая играет роль буфера между процессором (CPU) и оперативной памятью (RAM). Кэш-память хранит данные и инструкции, к которым обращаются чаще всего, благодаря чему процессор может получать ко всему этому доступ практически мгновенно.
В процессорах имеется особая память, представленная регистрами процессора, которая обычно представляет собой небольшое хранилище информации, обеспечивающее крайне высокую скорость обмена данными. Регистры — это самая быстрая память, с которой может работать процессор, которая расположена максимально близко к остальным его механизмам и имеет небольшой объём. Иногда регистры называют кэшем нулевого уровня (L0 Cache, L — это сокращение от Layer).
У процессоров, кроме того, имеется доступ к ещё нескольким уровням кэш-памяти. Это — до четырёх уровней кэша, которые, соответственно, называются кэшами первого, второго, третьего, и четвёртого уровня (L0 — L4 Cache). То, к какому именно уровню относятся регистры процессора, в частности, будет ли это кэш нулевого или первого уровня, определяется архитектурой процессора и материнской платы. Кроме того, от архитектуры системы зависит то, где именно — на процессоре, или на материнской плате, физически расположена кэш-память разных уровней.
Структура памяти в некоторых новейших CPU
Кэш жёсткого диска
Жёсткие диски (HDD, Hard Disk Drive), применяемые для постоянного хранения данных — это, в сравнении с оперативной памятью, предназначенной для кратковременного хранения информации, устройства довольно медленные. Однако надо отметить, что скорость постоянных хранилищ информации увеличивается благодаря распространению твердотельных накопителей (SSD, Solid State Drive).
В системах долговременного хранения информации кэш диска (его ещё называют буфером диска или кэширующим буфером) — это встроенная в жёсткий диск память, которая играет роль буфера между процессором и физическим жёстким диском.
Кэш жёсткого диска
Дисковые кэши работают, исходя из предположения, что когда на диск что-то пишут, или с него что-то читают, есть вероятность того, что в ближайшем будущем к этим данным будут обращаться снова.
О быстродействии жёстких дисков и оперативной памяти
Разница между временным хранением данных в оперативной памяти и постоянным хранением на жёстком диске проявляется в скорости работы с информацией, в стоимости носителей и в близости их к процессору.
Время отклика оперативной памяти составляет десятки наносекунд, в то время как жёсткому диску нужны десятки миллисекунд. Разница в быстродействии дисков и памяти составляет шесть порядков!
Одна миллисекунда равна миллиону наносекунд
Простой веб-сервер
Теперь, когда мы обсудили роль кэширования в базовых механизмах компьютерных систем, рассмотрим пример, иллюстрирующий применение концепций кэширования при взаимодействии клиента, представленного веб-браузером, и сервера, который, реагируя на запросы клиента, отправляет ему некие данные. В самом начале у нас имеется простой веб-сервер, который, отвечая на запрос клиента, считывает данные с жёсткого диска. При этом представим, что между клиентом и сервером нет никаких особых систем кэширования. Вот как это выглядит.
При работе вышеописанной системы, когда клиент обращается напрямую к серверу, а тот, самостоятельно обрабатывая запрос, читает данные с жёсткого диска и отправляет клиенту, без кэша всё-таки не обходится, так как при работе с диском будет задействован его буфер.
При первом запросе жёсткий диск проверит кэш, в котором, в данном случае, ничего не будет, что приведёт к так называемому «промаху кэша». Затем данные считаются с самого диска и попадут в его кэш, что соответствует предположению, касающемуся того, что эти данные могут понадобиться снова.
При последующих запросах, направленных на получение тех же данных, поиск в кэше окажется успешным, это — так называемое «попадание кэша». Данные в ответ на запрос будут поступать из дискового буфера до тех пор, пока они не будут перезаписаны, что, при повторном обращении к тем же данным, приведёт к промаху кэша.
Кэширование баз данных
Усложним наш пример, добавим сюда базу данных. Запросы к базам данных могут быть медленными и требовать серьёзных системных ресурсов, так как серверу баз данных, для формирования ответа, нужно выполнять некие вычисления. Если запросы повторяются, кэширование их средствами базы данных поможет уменьшить время её отклика. Кроме того, кэширование полезно в ситуациях, когда несколько компьютеров работают с базой данных, выполняя одинаковые запросы.
Простой веб-сервер с базой данных
Большинство серверов баз данных по умолчанию настроены с учётом оптимальных параметров кэширования. Однако, существует множество настроек, которые могут быть модифицированы для того, чтобы подсистема баз данных лучше соответствовала особенностям конкретного приложения.
Кэширование ответов веб-сервера
Продолжим развивать наш пример. Теперь веб-сервер, раньше рассматриваемый как единая сущность, разбит на две части. Одна из них, собственно веб-сервер, теперь занимается взаимодействием с клиентами и с серверным приложением, которое уже работает с системами хранения данных. Веб-сервер можно настроить так, чтобы он кэшировал ответы, в результате ему не придётся постоянно отправлять серверному приложению похожие запросы. Похожим образом, основное приложение может кэшировать некоторые части собственных ответов на ресурсоёмкие запросы к базе данных или на часто встречающиеся запросы файлов.
Кэш ответов и кэш приложения
Ответы веб-сервера кэшируются в оперативной памяти. Кэш приложения может храниться либо локально, в памяти, либо на специальном кэширующем сервере, который использует базу данных, вроде Redis, которая хранит данные в оперативной памяти.
Мемоизация функций
Сейчас поговорим об оптимизации производительности серверного приложения за счёт мемоизации. Это — разновидность кэширования, применяемая для оптимизации работы с ресурсоёмкими функциями. Данная техника позволяет выполнять полный цикл вычислений для определённого набора входных данных лишь один раз, а при следующих обращениях к функции с теми же входными данными сразу выдавать найденный ранее результат. Мемоизация реализуется посредством так называемых «таблиц поиска» (lookup table), хранящих ключи и значения. Ключи соответствуют входным данным функции, значения — результатам, которые возвращает функция при передаче ей этих входных данных.
Мемоизация функции с помощью таблицы поиска
Мемоизация — это обычный приём, используемый для повышения производительности программ. Однако он может быть не особенно полезным при работе с ресурсоёмкими функциями, которые вызываются редко, или с функциями, которые, и без мемоизации, работают достаточно быстро.
Кэширование в браузере
Теперь перейдём на сторону клиента и поговорим о кэшировании в браузерах. В каждом браузере имеется реализация HTTP-кэша (его ещё называют веб-кэшем), который предназначен для временного хранения материалов, полученных из интернета, таких, как HTML-страницы, JavaScript-файлы и изображения.
Этот кэш используется, когда в ответе сервера содержатся правильно настроенные HTTP-заголовки, указывающие браузеру на то, когда и на какое время он может кэшировать ответ сервера.
Перед нами весьма полезная технология, которая даёт следующие преимущества всем участникам обмена данными:
- Улучшаются впечатления пользователя от работы с сайтом, так как ресурсы из локального кэша загружаются очень быстро. Во время получения ответа не входит время прохождения сигнала от клиента к серверу и обратно (RTT, Round Trip Time), так как запрос не уходит в сеть.
- Уменьшается нагрузка на серверное приложение и на другие серверные компоненты, ответственные за обработку запросов.
- Высвобождается некоторая часть сетевых ресурсов, которыми теперь могут воспользоваться другие пользователи интернета, экономятся средства на оплату трафика.
Кэширование в браузере
Кэширование и прокси-серверы
В компьютерных сетях прокси-серверы могут быть представлены специальным аппаратным обеспечением или соответствующими приложениями. Они играют роль посредников между клиентами и серверами, хранящими данные, которые этим клиентам требуются. Кэширование — это одна из задач, которую они решают. Рассмотрим различные виды прокси-серверов.
▍Шлюзы
Шлюз (gateway) — это прокси-сервер, который перенаправляет входящие запросы или исходящие ответы, не модифицируя их. Такие прокси-серверы ещё называют туннелирующими прокси (tunneling proxy), веб-прокси (web proxy), прокси (proxy), или прокси уровня приложения (application level proxy). Эти прокси-серверы обычно совместно используются, например, всеми клиентами, находящимися за одним и тем же файрволом, что делает их хорошо подходящими для кэширования запросов.
▍Прямые прокси-серверы
Прямой прокси-сервер (forward proxy, часто такие серверы называют просто proxy server) обычно устанавливается на стороне клиента. Веб-браузер, который настроен на использование прямого прокси-сервера, будет отправлять исходящие запросы этому серверу. Затем эти запросы будут перенаправлены на целевой сервер, расположенный в интернете. Одно из преимуществ прямых прокси заключаются в том, что они защищают данные клиента (однако, если говорить об обеспечении анонимности в интернете, безопаснее будет пользоваться VPN).
▍Веб-ускорители
Веб-ускоритель (web accelerator) — это прокси-сервер, который уменьшает время доступа к сайту. Он делает это, заранее запрашивая у сервера документы, которые, вероятнее всего, понадобятся клиентам в ближайшем будущем. Подобные серверы, кроме того, могут сжимать документы, ускорять выполнение операций шифрования, уменьшать качество и размер изображений, и так далее.
▍Обратные прокси-серверы
Обратный прокси-сервер (reverse proxy) — это обычно сервер, расположенный там же, где и веб-сервер, с которым он взаимодействует. Обратные прокси-серверы предназначены для предотвращения прямого доступа к серверам, расположенным в частных сетях. Обратные прокси используются для балансировки нагрузки между несколькими внутренними серверами, предоставляют возможности SSL-аутентификации или кэширования запросов. Такие прокси выполняют кэширование на стороне сервера, они помогают основным серверам в обработке большого количества запросов.
▍Пограничное кэширование
Обратные прокси-серверы расположены близко к серверам. Существует и технология, при использовании которой кэширующие серверы располагаются как можно ближе к потребителям данных. Это — так называемое пограничное кэширование (edge caching), представленное сетями доставки контента (CDN, Content Delivery Network). Например, если вы посещаете популярный веб-сайт и загружаете какие-нибудь статические данные, они попадают в кэш. Каждый следующий пользователь, запросивший те же данные, получит их, до истечения срока их кэширования, с кэширующего сервера. Эти серверы, определяя актуальность информации, ориентируются на серверы, хранящие исходные данные.
Прокси-серверы в инфраструктуре обмена данными между клиентом и сервером
Итоги
В этом материале мы рассмотрели различные уровни кэширования данных, применяющиеся в процессе обмена информацией между клиентом и сервером. Веб-приложения не могут мгновенно реагировать на воздействия пользователя, что, в частности, связано, для действий, требующих обмена данными с серверами этих приложений, с необходимостью выполнения неких вычислений перед отправкой ответа. Во время, необходимое для передачи данных от сервера клиенту, входит и время, необходимое для поиска необходимых данных на диске, и сетевые задержки, и обработка очередей запросов, и механизмы регулирования полосы пропускания сетей, и многое другое. Если учесть, что всё это может происходить на множестве компьютеров, находящихся между клиентом и сервером, то можно говорить о том, что все эти задержки способны серьёзно увеличить время, необходимое для прихода запроса на сервер и получения клиентом ответа.
Правильно настроенная система кэширования способна значительно улучшить общую производительность сервера. Кэши сокращают задержки, неизбежно возникающие при передаче данных по сети, помогают экономить сетевой трафик, и, в результате, уменьшают время, необходимое для того, чтобы браузер вывел запрошенную у сервера веб-страницу.
Уважаемые читатели! Какие технологии кэширования вы используете в своих проектах?
Источник