robots.txt - информация для новичков

savit

Любитель
Регистрация
10.07.2007
Сообщения
200
Реакции
2
Поинты
0.000
Если вы внимательно посмотрите на логи своего сервера, то вероятнее всего увидите что когда к вам на сайт приходят боты поисковых систем, то первое что они запрашивают это /robots.txt .

robots.txt должен находиться в корне вашего сайта, обязательно (!) должен быть написан маленькими буквами (не заглавными) и задавать исключения для ботов!

Для чего это все нужно? Для того чтобы поисковые сситемы не индексировали то, что не нужно ... например файлы с профилями пользователей на форумах т.к это отвлекает бота от индексации того что нам нужно + в профилях пользователей содержатся ссылки на их сайты (а как вы знаете чем меньше исходящих ссылок с вашего сайта, тем лучше! )

Из чего состоит robots.txt :

User-Agent: имя бота (можете посмотреть в логах своего сервера)

Disallow: путь к файлу(ам) или папкам к которым бот не должен иметь доступа, и соответственно не индексировать

# - полсе данного знака можно указаывать комментарии

Примеры:

User-agent: Yandex
Disallow: /mysecretfolder/
Disallow: /showprofile.html

# Запрещает ботам Яндекса посещать папку http://site.ru/mysecretfolder/
# и файл http://site.ru/showprofile.html


User-agent: Aport
User-agent: Googlebot
Disallow: /myfolder/img/

# Запрещает ботами Google и Апорт посещение http://site.ru/myfolder/img/


User-agent: StackRambler
Disallow:

# Для бота поисковой системы Рамблер разрешено посещение всех
# страниц и папок сайта


User-Agent: *
Disallow: /profile.php?act=show

# Запрещает посещение всеми ботами, для которых не сделана
#отдельная запись,
# динамических страниц, начинающихся с http://site.ru/profile.php?act=show
# например: http://site.ru/profile.php?act=show&id=77
# чувствительно к порядку переменных в ссылке
 
Последнее редактирование:

savit

Любитель
Регистрация
10.07.2007
Сообщения
200
Реакции
2
Поинты
0.000
1) название файла именно robots.txt, а не robot.txt
2) пустой файл никакую роль не играет
 

Demark

Интересующийся
Регистрация
02.08.2007
Сообщения
165
Реакции
5
Поинты
0.000
Оптимизация оптимизацией, а файла такого быть не ДОЛЖНО. Это мой совет. Сам раньше занимался сетевой безопасностью с плохой стороны, так вот хакер при заходе на сайт первым делом проверяет этот файл, если он есть, то там прописаны все директории и папки и файлы куда заходить поисковику не нужно, значит там в открытом виде не публичные данные. Иногда доходило до абсурда, типа файлов с паролями или wmsigner. Вобщем, если файлы уж очень важные лучше с настройками апача поработать получше. А с файликом поосторожней этим.
 

kirilll007

Новичок
Регистрация
09.06.2007
Сообщения
379
Реакции
5
Поинты
0.000
А потом всё идём в баню от Яндекса, Гугла...
 

Slava Ivanov 1851950809

Любитель
Регистрация
03.10.2014
Сообщения
306
Реакции
16
Поинты
0.562
Перед тем, как приступить к настройке robots.txt для сайтов, советую новичкам ознакомиться с официальными рекомендациями Яндекса и Google по этому вопросу. Однако, как обычно и бывает, инфа там не очень легка для восприятия, поэтому вот тут https://netrocket.com.ua/blog/chto-takoe-fajl-robots-txt/ разложил все по полочкам и с картинками :)
 

Varkan

МАСТЕР
Регистрация
23.04.2015
Сообщения
2,354
Реакции
679
Поинты
0.000

incolor

Любитель
Регистрация
26.11.2016
Сообщения
578
Реакции
51
Поинты
0.000
Сейчас в каждом втором (если не в каждом первом) сео-блоге разжевана вдоль и поперек настройка роботс.тхт, но для начала лучше заглянуть на гугл и яндекс и прочитать информацию именно там
 

Novagorod

Любитель
Регистрация
31.10.2016
Сообщения
335
Реакции
32
Поинты
0.000
В последнее время не использую этот файл, так же насторожил комментарий Demark
 
Сверху Снизу