Как очеловечить сгенерированный текст?

Перед вами сгенерированный текст, а вы не знаете, как привести его в человеческий вид? Ломаете голову, с чего начать? Предлагаю вашему вниманию рецепт, с помощью которого можно исправить самые распространенные ошибки, допускаемые генераторами.

Прежде чем написать эту статью, мною были проанализированы около 30 текстов, сгенерированных разными программами. Тексты были взяты с разных сайтов, предлагающих услуги по размножению статей, выложенные для наглядных примеров.

Какие-то тексты были сгенерированы весьма неплохо, некоторые – вообще безобразно. Но у всех без исключения автоматических статей (насколько бы хорошо они ни были сгенерированы) мною были замечены одни и те же типичные ошибки, требующие обязательного исправления. Разберем их подробнее, а главное, научимся их исправлять в данной статье.

Сразу оговорюсь, что если ваш текст сгенерирован достаточно дорогой программой, где синонимы или даже целые конструкции синонимичных фраз заботливо подбирались вручную, считайте, что вам крупно повезло. Такой текст вполне читаем, и править придется лишь отдельные предложения. Чем хуже сгенерирован текст, тем более объемные куски вам придется редактировать.

Итак, начнем с простых ошибок, допускаемых генераторами:

Ошибка №1: Неправильная пунктуация. Заменяя слова синонимами, робот не учитывает правила пунктуации во вновь образуемых конструкциях.

Пример: В ходе собственного развития, почти любой сколько-нибудь значимый интернет-проект сталкивается с проблемой недостатка посетителей или говоря иначе трафика.

Ошибка №2: Несогласованность в словах (преимущественно, в склонении). Многие синонимизаторы не склоняют свои синонимы.

Пример: Так как же быть хозяину сайта, не обладающему литературные или рекламные способности?

Ошибка №3: Опечатки. Помните, что скрипты, в основном, пишутся людьми, а значит, вполне возможны и опечатки.

Пример: По мере медленного, но верного приближения к автосервису многие многиемысли посещают такого осторожного водителя.

Как исправить все вышеперечисленные ошибки:

• Можете все исправить вручную или прогоните текст через сервис «Правописание» ( есть в любом Word’e: Сервис → Правописание). Такой поверхностной правки для начала будет достаточно, поскольку главная правка у нас еще впереди.

Итак, первым делом, приводим в порядок внешний вид текста – исправляем опечатки, грамматические и пунктуационные ошибки. Это нужно затем, чтобы провести, так сказать, подготовительную работу и облегчить себе понимание текста. Потому что самое сложное впереди!

А теперь о самом главном биче всех сгенерированных текстов. Именно он делает автоматические тексты трудно восприимчивыми и нечитаемыми. И именно эту ошибку стоит исправить, чтобы ваш текст приобрел человеческий облик и  стал привлекательным для посетителей.

Ошибка №4: Некорректное употребление синонимов или синонимичных конструкций.

Другими словами, то слово или часть фразы, которое робот вам заменил, не вписывается по смыслу в данный контекст, т.е. новые слова не сочетаются по смыслу с исходными словами. В итоге – корявые предложения, сложное понимания, в худшем случае вообще набор слов. Мягко говоря, получается как-то не по-русски. Ну не говорим мы: «располагать набором признаков» или «процесс развертывается на глазах».

Как исправить:

• В  более удачных  случаях генерации, достаточно просто подобрать корректный синоним.

Например!

Исходник: Даже обычные стекла становятся намного прочнее и упорнее сопротивляются грабителю (ошибка здесь  в том, что “упорно сопротивляться грабителю” можно, но не в случае со стеклами)

Результат: Даже обычные стекла становятся намного прочнее и служат хорошей  преградой для грабителей

• Если не можете подобрать синоним, значит, перед вами более сложный случай. Поэтому переходим к другому алгоритму действий:

  1. Остановитесь на корявом предложении.
  2. Прочтите его внимательно. А теперь своими словами, желательно вслух, произнесите то, что вы из всего этого поняли (так, как если бы вы пересказывали это коллеге, который сидит за соседним столом, и не видит, что у вас написано на мониторе компьютера). При этом вовсе необязательно запихивать мысль в одно предложение. Можете разбить ее на два или даже три предложения.
  3. Запишите то, что у вас получилось.

Пример весьма запутанного предложения!

Исходник: Сегодня совершенно очевидно, что из забавы единиц домашняя дискотека вырастает в нечто самостоятельное и процесс развертывается на наших глазах.

Результат: Домашняя дискотека – уже не роскошь. Сегодня подобные мероприятия устраиваются все чаще.

!!! Главное правило здесь – не мудрить и не выжимать из себя красивые и умные фразы. Как сами поняли, так и пишите. И не бойтесь переврать смысл – общий контекст текста подскажет вам правильное понимание.

После того, как будут внесены все изменения, и ваш текст чудесным образом превратится в человеческий и легкочитаемый, сделайте последний штрих:

Прогоните его еще раз через сервис «Правописание» (возможно, пока вы были заняты бурной мыслительной деятельностью, наделали кучу опечаток и орфографических ошибок). Не помешает и дополнительная ручная проверка (Word далеко не идеально знает русский язык, особенно у него хромает пунктуация).

А вот теперь ваш текст готов! Выкладывайте его на сайт смело, не боясь, что он отпугнет ваших посетителей.

P.S. За тексты, сгенерированные дешевыми синонимизаторами, советую вообще не браться – сломаете мозг! Проще и быстрее написать самому, даже если вы никогда ничего не писали, кроме SMS-ок.

Успехов!

Вы можете отслеживать комментарии к этой записи с помощью RSS 2.0. Вы можете оставить комментарий, или использовать trackback с вашего сайта.

1 комментарий »

 
  • Игорь:

    спасибо за статью, полезно ;)
    А можно у вас спросить, какими программами вы пользовались (ссылки)?
    И есть ли сайт в интернете, который отвечает за правописание, пунктуацию и несогласованности в словах

 

Ответить

Вы должны авторизоваться для отправки комментария.