В пoслeднee врeмя ширoкo oбсуждaются случaи пoявлeния кoнфидeнциaльнoй инфoрмaции в рeзультaтax пoискa, пoэтoму да мы с тобой рeшили нaпoмнить вeб-мaстeрaм o тoм, кaк индeксируeтся кoнтeнт и кaк oбeспeчить индeксaцию тoлькo прeднaзнaчeнныx интересах этoгo стрaниц. Oднoврeмeннo мы xoтeли бы eщe рaз рaсскaзaть пoльзoвaтeлям o мeрax, кoтoрыe слeдуeт принимaть при обнаружении своих конфиденциальных данных в Интернете.
Прежде общем нужно понять, что если ваши документы содержат конфиденциальную информацию, следует хорошо подумать, прежде чем помещать их получи и распишись веб-сервер.
Если конфиденциальные документация всё же должны быть размещены держи сайте, их следует защитить, поместив в раздел, требующий регистрации и ввода пароля. Так что поисковые системы не располагают паролями и маловыгодный имеют функциональной возможности для их ввода, подход к данным остаётся возможным только с целью тех, у кого есть соответствующие права.
Если бы владелец сайта разместит информацию в Интернете и далеко не ограничит доступ роботам поисковых систем чтобы сканирования и индексирования, скорее всего, эта репортаж будет найдена, проиндексирована и появится в результатах поиска. В этом и заключается суть работы поисковых систем: открывать, структурировать информацию и делать её доступной для того пользователей. Поэтому, если у вас кушать веб-сайт, где размещены сведения, отображение которых в результатах поиска не дай господи, на вас лежит ответственность — установить соответствующие ограничения. Подальше более подробно описывается, как это сделать.
Предотвращение сканирования и индексирования конфиденциальных данных поисковыми системами
Существует ряд способов, позволяющих веб-мастерам расстроить сканированию и индексированию личных и конфиденциальных данных поисковыми системами.
Файл robots.txt — первый, сверху который обращает внимание поисковый робот при заходе сверху сайт, ещё до того, (то) есть он обратит внимание на какие-либо страницы. В этом файле есть указать, сканирование каких частей сайта ваша милость хотели бы запретить при помощи команды Disallow.
Хоть (бы), если вы не хотите, чтобы сканировалась папка получи и распишись сайте, содержащая изображения, то в файле robots.txt разрешается указать следующее:
User-agent: *
Disallow: /images/
Файл robots.txt дозволяется легко создать в соответствующем разделе наших Инструментов исполнение) веб-мастеров или написать самостоятельно, проверив правильность составления особым инструментом, также доступным в Инструментах ради веб-мастеров.
Важно помнить, что указание определённой страницы в файле robots.txt предотвратит её сканирование нашей системой, же при наличии на неё ссылок с других страниц (бери вашем или других сайтах) автор всё равно можем проиндексировать её. В результате код страницы (URL), а также, возможно, и другая общедоступная материал, как например, анкорный текст ссылок ведущих сверху неё, могут появится в результатах поиска Google.
Дополнительные сведения об использовании файла robots.txt чтобы блокирования содержимого сайтов можно улучить в нашем справочном центре.
Этот тег впору разместить в исходном коде вашей страницы (в разделе ), тем самым запретив поисковым системам индексировать страницу, даже если при обнаружении ссылок на неё с других страниц. Тег выглядит следующим образом:
<meta name=»robots» content=»noindex»>
Обратите уважение, что тег следует разместить получи каждой странице, индексирование которой должен запретить.
Дополнительные сведения об использовании тега noindex разрешается найти в нашем справочном центре.
Эффект тот а самый, как и при использовании зарубка-тега noindex, но этот приём особенно полезен с целью нетекстового содержимого, когда нет внутренние резервы разместить мета-тег в исходном коде. Вверху приведён пример применения тега X-Robots-tag в заголовке HTTP-ответа, позволяющего выдать волчий билет индексацию страницы.
HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)
Дополнительные сведения об использовании тега X-Robots-tag не возбраняется найти на сайте code.google.com (бери английском).
Меры, которые следует предпринять при непреднамеренной индексации конфиденциальных данных
Для того веб-мастеров:
- Чтобы полностью удалить содержимое следует:
- удалить цифры с сайта и установить автоматические ответы с кодом 404 либо 410 по соответствующим адресам;
- запросить удаление содержимого (при помощи Инструментов в целях веб-мастеров).
- При желании сохранить содержимое, хотя запретить его индексацию следует:
- разместить заметина-тег noindex или HTTP-название X-Robots-tag в соответствующих файлах;
- запросить удаление содержимого (при помощи Инструментов в (видах веб-мастеров).
Для пользователей, обративших атас на наличие их личных сведений для каком-либо сайте:
- Следует попытаться напрямую связаться с веб-мастером и призвать удаление данных.
- Если соответствующая страница была удалена с сайта, следует убедиться в том, что по её адресу сервер выдаёт отчёт с кодом 404 (страница не найдена), а с течением времени запросить удаление URL из результатов поиска Google при помощи инструмента на удаления URL.
- Если соответствующая страница по сей день ещё существует, но была обновлена (хоть (бы), с неё были удалены ваше отчество или телефонный номер), следует попросить удаление сохранённой копии этой страницы.
- Коли с веб-мастером связаться не удаётся, о содержимом позволено сообщить напрямую в Google в следующих случаях:
- указан стриптиз вашего паспорта или иного удостоверения сплетня;
- указан номер вашего банковского счёта неужели кредитной карты;
- приводится изображение вашей подписи;
- ваше ФИО сиречь название вашего предприятия упоминается возьми сайте «для взрослых», появление которого в результатах поиска Google обусловлено использованием запрещённых методов оптимизации.
Дополнительные сведения об оформлении запросов бери удаление данных можно найти в нашем справочном центре.
