Smm Earn
Статья на тему SMM

Повышаем пробиваемость «Анти-спама»

Категории: XRumer

Cтатья написана в рамках 5-го Конкурса статей
Система Анти-спама - крайне мощная вещь. Однако она имеет очень низкий показатель пробивания. Связано это со сложностью подбора ответа для публикации, наличия помех в исходных данных и самое важное – качество и количество этих исходных данных.

Подготовка к работе

Что это за зверь?

Проведем небольшой анализ. Для того что бы понять, как улучшить работу данной системы, нужно понимать как она работает, что из себя представляет база для подбора ответа.

Система основана на сборе текстовой информации, которая обрабатывается и классифицируется. Программа начинает "понимать" как можно использовать последовательности слов, некоторые фразы. Так же она начинает определять о чем идет речь в тексте. Для ответа она использует уже когда-то составленные фразы.
Иногда получаются очень забавные посты, например один раз анти-спам система составила пост примерно такого содержания: "автор данной темы умен в отличии от автора данного поста". Такое произошло из-за того, что на том ресурсе уже были подобные посты от анти-спам системы. Поэтому так же важно учитывать эту особенность. Если система начнет спорить сама с собой, то ничего хорошего из этого не выйдет. Очень забавно наблюдать как на каком-нибудь форуме сразу около 5-8 постов идут от нашей анти-спам системы. Причем если такие посты единичны, то их трудно распознать как спам, а вот если их сразу несколько, то становится очевидно, что что-то не так.

Для прогонов следует использовать качественные базы, где минимум постов от анти-спам системы. Благо ей пользуются не так часто и пробивает она не большое кол-во ресурсов.

Этап 1. Теория и где взять качественную базу?

Где же вы, СДЛ ресурсы?

Из предидущего описания (оно сильно упрощено в отличии от реального алгоритма) можно понять, что ключевой момент - исходные тексты. Именно на основе данных текстов будет составлена база для дальнейшего подбора ответа и анализа текста на предмет темы. Некачественные источники или вообще ошибочные, сильно запутают систему и она будет либо давать осечки, либо просто не сможет подобрать тематичный ответ.

Теперь вспомним как мы собирали эти тексты. Чаще всего это прогон по уже существующей базе (очень часто по той, по которой мы будем делать прогон непосредственно с постингом). А теперь представьте те 100 000 форумов. Какие там темы? Что там пишут. Там кучи тематик, кучи текстов. А главное куча флуда, спама (логично предположить, что другие обладатели XRumer приложили руку к этому пункту ;)).

Самое страшное, то что спам и флуд только засоряют базу и путают систему. Ко всему прочему на низкосортных форумах множество орфографических ошибок, что так же путает и сбивает с толку систему. Иногда люди пишут такой бред, с большим количеством ошибок. Из такого текста анти-спам система получит лишь одно - кучу мусора. А этот мусор, в свою очередь, будет мешать подобрать тематичный ответ, а еще хуже - сам выдаст полный бред.

Вообще XRumer собирает базу не из всех текстов, а лишь из заголовков к темам. Это связано с ограниченностью производительности и мощности наших компьютеров. Только из заголовков собирается база объемом до 500-1000мб. Такая база, которая будет загружена в ОЗУ займет еще больше места (уже вплоть до нескольких гб).

Этап 2. Типичные результаты прогонов без подготовки

Анти-спам, да это просто!

Теперь перейдем к выбору базы для прогона с анти-спам системой. Для данной цели подходят форумы (наиболее пригодные для данной цели форумы на движках IPB, VBulletin, phpBB и им подобные). Сейчас можно найти в открытом доступе подобные базы, а можно купить. Лучше всего иметь собственную базу, так надежнее и эффективнее.

Для прогона я использую собранную базу из 32 000 форумов. Как собрать подобную базу можно почитать в еще одной моей статье (там же можно и скачать эту самую базу). база сырая и имеет низкое качество, но для демонстрации мощности анти-спам системы подойдет. даже на такой базе мы получим ощутимые результаты.

Собрал базу для анти-спам системы я по этим же форумам + по базе, которую нашел в интернете (в ней содержаться крупные форумы, то что нужно).
После прогона я получил следующий результат:

Изображение к статье

Довольно неплохой результат. Вот некоторые из ссылок, которые опубликовал XRumer.

Изображение к статье Изображение к статье Так же обращу внимание, что некоторые успешных результаты - это профили, а не наши тематичные посты.

Этап 3. Ключевые моменты успешного анти-спам постинга

Как это сделать?

Главные пункты, которые помогут повысить пробиваемость и добиться хороших результатов.

  • Необходимо серьезно подойти к качеству собираемой базы под анти-спам систему. В идеале исключить все ненужно что бы дать возможность анти-спам системе собрать больше топиков, которые смогут нам помочь. Это довольно критично т.к. XRumer может сжирать приличные объемы ОЗУ при больших базах.
  • Перед каждым прогоном необходимо обновлять анти-спам базу. Появление новых топиков на разных форумах - это будет отличным шансом для подбора релевантного ответа.
  • Производить прогон многократно, но с промежутками времени. Этот пункт основан на обновлении форумов. При создании новых топиков у нас появляется шанс подобрать новый ответ и разместить его, что раньше не получалось.

Предельная эффективность

Пробиваем непробиваемое!

Предыдущий метод хорош, но он работает только на слабо модерируемых форумах. Сообщения с ссылками часто удаляют при модерации и мы не получаем выгоды.

В этом случае приходит на помощь следующий метод. Его суть заключается в регистрации на трастовых форумах в полу-автоматическом или автоматическом режиме (для особо усердных - ручной режим). При этом в профиле мы не оставляем подписи с ссылкой, не указываем сайт и прочее. Мы полностью исключаем всю рекламную начинку для профиля.

Мы делаем прогон с целью создания профилей. Ничего больше, никакого постинга. Мы просто регистрируем «нормальные» профили на трастовых ресурсах. Это можно даже сделать вручную.

Спустя несколько дней (на многих форумах нужна проверка модератором для возможности постинга или подтверждения регистрации) мы начинаем прогонять по уже зарегистрированным профилям анти-спам систему. Однако мы не будем постить рекламу и ссылки. Мы просто начинаем набивать посты на формуе, многократно делая прогоны.

Сообщения будут подобного вида, без рекламы.

Изображение к статье

P.S. Сообщение от анти-спам системы последнее

Спустя некоторое время (лучше выждать побольше) мы можем отредактировать профили и внести наши ссылки в подпись и другие подходящие поля профиля. Т.к. пользователь уже был одобрен и постил нормальные сообщения, то проблем с баном не должно быть. Теперь мы имеем живой профиль с обратными ссылками.

Ключевой момент здесь сделала именно анти-спам система. Обычно прогон по профилям не дает ощутимых результатов из-за того, что поисковые системы никогда не найдут наш профиль и не проиндексируют его. В нашем же случае пользователь делал посты, а в этих постах есть ссылка на профиль. Следовательно поисковая система может спокойно найти наш профиль и проиндексировать его.

4698 4 21.07.2015
Оцени статью:

Комментарии

Войдите или зарегистрируйтесь что бы комментировать статью

  • Аватар пользователя bpunk
    bpunk30 июля 2015 г.
    Молоток, не поленился и запилил блог.
    Можно ли использовать технологии антиспам, собрав базу форумов по своему ядру и неустанно размещая новые сообщения со ссылками для перелинковки с сайтом (магазином) на своем форуме? Вроде бы как да. Был ли опыт?
    • Аватар пользователя SirOhlamon
      SirOhlamon31 июля 2015 г.
      В теории такое возможно.
      На практике думаю это будет сложно реализовать. Связано это с тем что анти-спам система сама выбирает топик для публикации ответа. Из-за этого ей нельзя строго сказать: "подбери ответ к этому топику".
  • Аватар пользователя westcollection
    westcollection18 августа 2015 г.
    Привет очень интересные статьи у тебя. Не планируешь написать что нибудь о прогоне дорвеев
    • Аватар пользователя SirOhlamon
      SirOhlamon20 августа 2015 г.
      Привет.
      Я не очень люблю дорвеи, из-за этого мало владею данной сферой и не смогу написать что-либо дельное. Могу лишь посоветовать прочитать статью о прогоне "в лоб". Для дорвеев подойдет такой подход.