Контентный спам-фильтр производит анализ сообщений на основе наиболее популярных алгоритмов статистического анализа, которые опираются на теорему Байеса (Thomas Bayes). Формула Байеса позволяет рассчитать вероятность наступления некоторого события в зависимости от того, какова была вероятность данного события в прошлом. При этом учитываются не только содержимое письма, но и его служебные заголовки. Таким образом, данный классификатор позволяет вычислять коэффициент «спамности» входящего сообщения анализируя отдельные слова из тела письма.
Контентный спам-фильтр в рамках услуг виртуального хостинга компании «Караван» работает по улучшенному алгоритму Бартона (Brian Burton). Данный алгоритм также функционирует по теореме Байеса, но использует для анализа не 15, а 27 наиболее ярких слов, а также допускает «удвоенное» использование слова, если оно встречается в сообщении несколько раз. Это повышает эффективность при ограниченных данных.
По итогам анализа сообщение признается спамом (Spam) или не спамом (Innocent). В случае если сообщение признаётся спамом, в служебный заголовок письма добавляется следующее поле: X-DSPAM-Result: Spam. Если не спам: X-DSPAM-Result: Innocent.
Пользователи получают возможность настроить фильтры в своем почтовом клиенте по служебным заголовкам для сохранения помеченной как спам почты в отдельную папку или для удаления таких сообщений.
Дополнительно присутствующие заголовки X-DSPAM содержат по большей части служебную информацию - время обработки и статистические данные по конкретному сообщению.
Контентный спам-фильтр доступен во всех тарифных планах услуги виртуальный хостинг. Включение/отключение опции осуществляется через Персональный кабинет биллинговой системы «Караван» в разделе "Хостинг" -> "Доп. Сервисы". В рамках тарифного плана «Эконом» проверка включается по умолчанию и её нельзя отключить. Для остальных тарифных планов контентный спам-фильтр по умолчанию отключён.

