Личные данные в результатах поиска

Posted on Август 2 2011 by admin
Мaрия Мoeвa и Aндрeй Липaтцeв, кoмaндa кaчeствa пoискa Google

В пoслeднee врeмя ширoкo oбсуждaются случaи пoявлeния кoнфидeнциaльнoй инфoрмaции в рeзультaтax пoискa, пoэтoму да мы с тобой рeшили нaпoмнить вeб-мaстeрaм o тoм, кaк индeксируeтся кoнтeнт и кaк oбeспeчить индeксaцию тoлькo прeднaзнaчeнныx интересах этoгo стрaниц. Oднoврeмeннo мы xoтeли бы eщe рaз рaсскaзaть пoльзoвaтeлям o мeрax, кoтoрыe слeдуeт принимaть при обнаружении своих конфиденциальных данных в Интернете.

Прежде общем нужно понять, что если ваши документы содержат конфиденциальную информацию, следует хорошо подумать, прежде чем помещать их получи и распишись веб-сервер.

Если конфиденциальные документация всё же должны быть размещены держи сайте, их следует защитить, поместив в раздел, требующий регистрации и ввода пароля. Так что поисковые системы не располагают паролями и маловыгодный имеют функциональной возможности для их ввода, подход к данным остаётся возможным только с целью тех, у кого есть соответствующие права.

Если бы владелец сайта разместит информацию в Интернете и далеко не ограничит доступ роботам поисковых систем чтобы сканирования и индексирования, скорее всего, эта репортаж будет найдена, проиндексирована и появится в результатах поиска. В этом и заключается суть работы поисковых систем: открывать, структурировать информацию и делать её доступной для того пользователей. Поэтому, если у вас кушать веб-сайт, где размещены сведения, отображение которых в результатах поиска не дай господи, на вас лежит ответственность — установить соответствующие ограничения. Подальше более подробно описывается, как это сделать.


Предотвращение сканирования и индексирования конфиденциальных данных поисковыми системами


Существует ряд способов, позволяющих веб-мастерам расстроить сканированию и индексированию личных и конфиденциальных данных поисковыми системами.

  • дозволение на сканирование в файле robots.txt

Файл robots.txt — первый, сверху который обращает внимание поисковый робот при заходе сверху сайт, ещё до того, (то) есть он обратит внимание на какие-либо страницы. В этом файле есть указать, сканирование каких частей сайта ваша милость хотели бы запретить при помощи команды Disallow.

Хоть (бы), если вы не хотите, чтобы сканировалась папка получи и распишись сайте, содержащая изображения, то в файле robots.txt разрешается указать следующее:

User-agent: *

Disallow: /images/

Файл robots.txt дозволяется легко создать в соответствующем разделе наших Инструментов исполнение) веб-мастеров или написать самостоятельно, проверив правильность составления особым инструментом, также доступным в Инструментах ради веб-мастеров.

Важно помнить, что указание определённой страницы в файле robots.txt предотвратит её сканирование нашей системой, же при наличии на неё ссылок с других страниц (бери вашем или других сайтах) автор всё равно можем проиндексировать её. В результате код страницы (URL), а также, возможно, и другая общедоступная материал, как например, анкорный текст ссылок ведущих сверху неё, могут появится в результатах поиска Google.

Дополнительные сведения об использовании файла robots.txt чтобы блокирования содержимого сайтов можно улучить в нашем справочном центре.

  • предотвращение индексирования при помощи отметина-тега noindex

Этот тег впору разместить в исходном коде вашей страницы (в разделе ), тем самым запретив поисковым системам индексировать страницу, даже если при обнаружении ссылок на неё с других страниц. Тег выглядит следующим образом:

<meta name=»robots» content=»noindex»>

Обратите уважение, что тег следует разместить получи каждой странице, индексирование которой должен запретить.

Дополнительные сведения об использовании тега noindex разрешается найти в нашем справочном центре.

  • предотвращение индексирования при помощи заголовка HTTP X-Robots-tag

Эффект тот а самый, как и при использовании зарубка-тега noindex, но этот приём особенно полезен с целью нетекстового содержимого, когда нет внутренние резервы разместить мета-тег в исходном коде. Вверху приведён пример применения тега X-Robots-tag в заголовке HTTP-ответа, позволяющего выдать волчий билет индексацию страницы.

HTTP/1.1 200 OK

Date: Tue, 25 May 2010 21:42:43 GMT

(…)

X-Robots-Tag: noindex

(…)

Дополнительные сведения об использовании тега X-Robots-tag не возбраняется найти на сайте code.google.com (бери английском).


Меры, которые следует предпринять при непреднамеренной индексации конфиденциальных данных


Для того веб-мастеров:

  • Чтобы полностью удалить содержимое следует:

  • При желании сохранить содержимое, хотя запретить его индексацию следует:
    • разместить заметина-тег noindex или HTTP-название X-Robots-tag в соответствующих файлах;
    • запросить удаление содержимого (при помощи Инструментов в (видах веб-мастеров).

Для пользователей, обративших атас на наличие их личных сведений для каком-либо сайте:

Дополнительные сведения об оформлении запросов бери удаление данных можно найти в нашем справочном центре.

Comments are closed.