Приветствую, дорогие читатели блога. Давайте поговорим на тему защиты контента на наших сайтах и покажу какие есть способы обхода установленной защиты в виде плагинов и компонентов.
- Как копировать текст если он не копируется (способы);
- Блокировка элемента контента;
- Распознавание объекта;
- Инструменты разработчика.
Современный интернет переполнен различными блогами, форумами, портала и т.п. На каждом из этих ресурсов содержится множество различной текстовой информации. Со временем первых html страниц читатели довольно часто нагло копировали чужой материал и присваивали его создание себе.
Из-за этого истинному писателю было весьма неприятно осознавать, что его личный труд и затраченное время не только не окупились, так еще и были присвоены совершенно незнакомым человеком. Наглый «копипаст» (copy – копировать, paste – вставлять) без добавления собственных идей ничем не лучше воровства в реальном мире.
Эти сведения позволяют осознать, почему не копируется текст с сайта. Администрация специально закрывает доступ читателю к изменению материала. Неприятно осознавать, что кто-то ворует твои труды и никак за это не отвечает. Чтобы обезопасить себя от подобных инцидентов нарушения авторского права современные порталы создают ограничивающие правила для браузера.
Получается, что когда пользователь наводит мышкой на текст, он словно водит по фотографии. Все буквы видны, их можно обводить, но нельзя напрямую забрать со страницы. Такой защитный метод можно сравнить с защитным стеклом на смартфоне. Оно предохраняет технику от повреждений и в случае необходимости позволяет сохранить целостность корпуса и прочих деталей. Но при желании защиту можно снять, важно лишь знать, какими методами это осуществить.
Современный интернет в плане авторского плана развит куда лучше, чем в прошлом. При попытке нагло скопипастить чужую статью человек не только не заработает на этом контенте, так еще при публикации его сайт будет внесен в список нежелательных к просмотру. В свою очередь это сильно ухудшит его оптимизацию и приведет к понижению выдачи в топах запроса.
Поисковые системы типа Google и Yandex запоминают оригинальную статью, частоту слов в ней и т.п. При публикации нового контента на другом сетевом ресурсе весь текст сначала проверяется на схожесть с другими материалами и при отсутствии наглого копипаста пропускается в индексацию. Поэтому за сохранность напечатанных статей можно не беспокоиться, современные поисковики защищают авторские права.
Исходя из этого метод защиты от копирования при помощи javascript, css и прочих программных хитростей является бесполезным. Его легко обойти и заполучить желаемый текст спустя 5 минут работы. Но вот поисковую систему обмануть значительно сложнее.
Как копировать текст с сайта если он не копируется
Существуют разные ситуации, при которых материал с сайта нужно получить в срочном порядке. Например, для доработки идеи для собственного проекта или для цитирования. В этом случае, конечно, лучше спросить разрешение у администрации интернет-ресурса, однако подобные методы довольно длительные и зачастую остаются без ответа.
В прошлом наиболее распространенным методом защиты от копипаста является прописание вспомогательного JavaScript кода на странице с контентом, как правило, эти инструкции умещаются в 4 строчки. Его суть заключается в передаче на клиентский браузер правил о запрете выделения, перетаскивания или отображения меню правой кнопки мыши.
Теперь можно перейти к рассмотрению вопросов, почему не копируется текст с сайта и что делать. Защиту на основе использования скриптов можно довольно просто обойти, все JavaScript коды выполняются на стороне клиентского приложения. В каждом современном браузере можно запретить выполнение скриптов.
Всего существует 3 основных браузерных движка:
- Trident (Internet Explorer, Microsoft Edge);
- Gecko (Mozilla);
- Blink (Yandex browser, Opera, Google Chrome) продолжение WebKit;
Пример приведет с использованием Google Chrome и Яндекс Браузера, они построены на одном движке. Для Firefox и Microsoft Edge инструкция может отличаться.
Для Яндекса и Opera:
- Откройте настройки. Для этого перейдите в дополнительное меню, найдите нужный пункт и нажмите по нему.
- После открытия меню параметров в правом верхнем углу будет располагаться строка поиска. Для Opera она будет располагаться по центру.
- Введите «javascript» и нажмите ENTER, через несколько секунд отобразятся пункты меню, в которых находится настройки отображения скриптов.
- Для Яндекс.Браузер придется перейти сначала в настройку личных данных и пролистать параметры примерно до середины страницы.
- Перемещаем значение из «Разрешить» на «Запретить».
Для Google Chrome инструкция точно такая же:
- Открывайте настройки. В Хроме для этого надо нажать на иконку пользователя. В правом верхнем углу программы радом с кнопками «свернуть», «развернуть», «закрыть».
- Вводите в поиск «javascript».
- Запрещаете использование.
После этого действия на некоторых порталах блокировка окажется недействительной. Но современные блоги используют более продвинутую защиту, в том числе поверхностный DIV элемент и защита через CSS стили.
Обязательно потом не забудьте вернуть настройки в прошлое положение, иначе большинство современных сайтов перестанет нормально функционировать.
Блокировка защитного элемента
В некоторых ситуациях на страницах используются поверхностные прозрачные блоки или же просмотр блокируется различными объявлениями и всплывающими окнами. Они довольно часто мешают и только раздражают читателя.
Чтобы обойти подобную защиту потребуется скачать утилиту для блокировки рекламы. Наиболее популярными являются Adguard и Adblock дополнения для браузера. Для начала установите расширение с официального магазина.
После окончания установки дополнение должно отобразиться в правом верхнем углу рядом с поисковой строкой. На некоторых браузерах расположение может отличаться.
- Перейдите на страницу, с которой необходимо скопировать материал. Через Adguard выберите пункт «заблокировать рекламу».
- Наведите на защитный элемент или всплывающее окно и по границам определите область удаления.
- Сначала воспользуйтесь предпросмотром, чтобы определиться тот ли элемент будет удален.
- Если все устроило, то нажимает «заблокировать».
Подобный метод защиты работает довольно редко, так как защита при помощи прозрачных блоков уже давно не используется. Но как вариант иногда встречается на старых сайтах. Например, с публикациями исследовательской работы, на проектах или на игровых сервисах со множеством рекламы и баннеров.
Чтобы отменить выполненное действие можете приостановить защиту на сайте.
Распознавание через сторонние программы
Наиболее распространенным вариантом ответа на вопрос, «как копировать текст с сайта, если он не копируется», является создание скриншота страницы и далее поиск в нем текста при помощи сторонних приложений. Про распознавание текста с фото онлайн более подробно описывалось ранее. Здесь рассмотрим несколько простых вариантов.
- Переходим на желаемый ресурс. Нажимаем клавиши CTRL+P или делаем скриншот через стороннее приложение. В Яндекс.Браузере можно нажать CTRL+S и при сохранении указать формат PDF. Для примера использовалась статья о дропшиппинге.
- Сохраняем скриншот или PDF файл на компьютер и запоминаем расположение документа. Переходим на один из сайтов для распознавания текстов, например, newocr. Выбираем нужный файл.
- Начинаем распознавание.
После окончания работы копируем полученный текст и распоряжаемся им по своему усмотрению. Рекомендуется сохранять страницу в PDF формате, так как в этом случае можно получить полную версию материала и не придется делать множество повторных проверок для объединения обрезков в единый текст.
Инструменты разработчика html
Последним и наиболее эффективным методом получения закрытого контента является просмотр HTML кода страницы и выбор необходимых блоков текста через инструменты разработчика.
Этот способ наиболее длительный и скучный. Его суть заключается в просматривании HTML кода страницы копирование отдельных блоков с контентом. Здесь есть два варианта решения, первый из них заключается в использовании инструментов разработчика, а второй в просмотре сразу полной версии страницы.
- Чтобы пользоваться инструментами разработчика в большинстве браузеров достаточно нажать сочетаний CTRL+I . Спустя несколько секунд появится дополнительное окно, в котором можно увидеть множество тэгов.
- При наведении на какой-либо тэг в браузере автоматически подсвечивается этот блок.
- Можно работать от обратного. В инструментах в верхнем левом углу найдите иконку мышки с окном. Нажмите на нее и после этого тэги будут подсвечиваться при наведении на элемент со страницы.
- По абзацам выбираем текст и копируем содержимое. Как правило, для разметки используют тэги <p>,<li>, <span>, <i> иногда встречаются <div>, но там чаще хранят фотографии и кнопки.
Не всегда удобно копировать текст по маленьким кусочкам. Чтобы ускорить весь процесс текст легче копировать с полного кода страницы.
- Нажмите CTRL+U. Или же кликните правой кнопкой мыши и из выпадающего меню выберите пункт «просмотреть код страницы».
- В дополнительной вкладке отобразится весь HTML код. Для упрощения поиска нажмите CTRL+F и в строку вводите первые словосочетания абзацев.
На этом инструкция заканчивается. Весь текст также можно отдельно отфильтровать через Excel или другие программы, чтобы убрать лишние символы и тэги.
Не забываем «залайкать» статью и и сделать репост. До скорых встреч.