Запилил бредогенератор (много бредобукв)

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
Сертяка
24.04.2017 - 10:48
Статус: Offline


Приколист

Регистрация: 10.09.16
Сообщений: 390
0
Всем привет!

Пару месяцев назад у меня появилась идея запилить штук 200 сайтов с уникальным текстом, на них разместить ссылки на свой сайт, проиндексировать и получить ссылочную массу)) Ну так лет 15 назад делали, а так как история циклична, то почему б не вернуться? Такой вот эксперимент.

Писать уникальные тексты для 200 сайтов сложно, долго и дорого, и цель уж точно не оправдает затрат, так что самое очевидное решение - нагенерить всякого шизофренического автоматически, и выложить для индексации. Прокатит, так прокатит, нет так нет ©
Спойлер:
Скрытый текст
Прокатило


Полазил, поискал готовые решения для генерации текстов - меня мало что устроило. Треть сводится к тому, что нажми на кнопку получи результат заранее подготовленный автором текст, треть к тому что вот есть шаблон давайте подставлять в него синонимы либо заменять прилагательные, треть к цепям Маркова, которые а) сложны б) дают бредовый результат в) уже лет 10 как успешно палятся поисковыми системами.

Для себя задачу я ставил так: я должен иметь возможность скормить генератору подобранный мною текст на заданную тематику (например, сборник статей и политических анализов о Трампе из разных источников). Генератор должен сформировать текст, в котором есть заголовки разных уровней, параграфы, предложения разной длины.
Должен соблюдаться некий ритм текста - чередование длинных и коротких предложений, и каждое предложение в целом должно соответствовать правилам русского языка.

Решение состоит в том, что бы обучить генератор на примере входящего текста, и по этим знаниям сформировать новый. При поступлении текста генератор разбирает его на токены, и запоминает, какие слова обычно идут в начале предложения, какие в конце, какое слово чаще идет после данного, какое реже. В общем, строит этакое дерево последовательностей. После этого берет случайные первые слова, дополняет одним из слов, которые обычно за ним идут, то же самое делает со вторым словом, потом с третьим и так далее, пока не встретится последнее слово.

Соответственно, чем больше текста будет скормлено, и чем лучше соблюдена тематика, тем лучше будет результат.
Короче - зацените результат, может пригодится кому?
https://bablofil.ru/text_generator

Ну и напоследок о том, чем закончилась история про 200 сайтов: я изначально колебался, что лучше сделать - просто выкладывать сгенеренный HTML либо использовать какой-то готовый движок. В итоге подумал о том, что поисковые системы любят движки (хз почему так подумал upset.gif ), развернул скриптом 200 сайтов на Worpdress, внес нужные изменения в Nginx, и настроил генератор на постинг одной-двух статей в день на каждый из сайтов. disco.gif

Через месяц обратил внимание, что сайты проиндексировались как гуглом, так и яндексом, а в панели вебмастера засветились входящие ссылки с этих ресурсов. rulez.gif

Так же некисло выросла нагрузка на сервер - чо за фигня думаю? Полез - и нашел неучтенный момент. Wordpress это же цель номер 1 для скрипт-кидди, хрумеров и прочего. Я сейчас уже хз во сколько там потоков подбирали потоки и сканили уязвимости, но тогда я офигел ) Запретил всё нафиг в Nginx, нагрузка упала, а потом я домены на кое-что другое приспособил, а сайты снес ;)
Дорвеи - это не моё. Но раз уж код написан, должен же им кто-то пользоваться?

Беззащитная, убитая пчела собирает пыль дороги... ©


Запилил бредогенератор (много бредобукв)
 
[^]
Yap
[x]



Продам слона

Регистрация: 10.12.04
Сообщений: 1488
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 1436
0 Пользователей:
[ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 

Активные темы