Первая версия robots.txt , для более полной индексации.

Автор Yworld_garry, 04 октября 2008, 23:59:13

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Yworld_garry

Цитата: Life-BEK от 15 августа 2012, 23:38:44Disallow: /forum/admin/
Этого не надо, ни гостям ни ботам такую ссылку не видно, если я правильно понял вашу мысль.

Life-BEK

Друг-друга поняли. Спасибо.
Проверил роботс на вебмастере гугл, гугл все правильно понимает.

plintus

Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

Фисташка


plintus

Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10


plintus

Фисташка посмотрел у себя в яндекс вэбмастере вот эти и многие другие яндекс как раз и исключил из индекса. Вот навязывается вопрос! Я соврал у меня роботс не совсем пустой:

User-agent: *
Sitemap: http://сайт.ru/index.php?action=sitemap;xml
Disallow: /go.php
Host: сайт.ru

Как бы его тогда привести к такому виду чтобы не было подобных исключений?
Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

Yworld_garry

Цитата: plintus от 21 августа 2012, 18:00:34Как бы его тогда привести к такому виду чтобы не было подобных исключений?

Вот этот и по аналогии с ним, добавить что нужно открыть или закрыть. http://www.simplemachines.ru/index.php?topic=5089.msg116600#msg116600 , проверить в вебмастере.

PS
Если форум в профиле, почему нельзя писать прямые ссылки, а надо корявить урл написанием всяких сайт.ru и тд.

plintus

А это что такое объясните пожалуйста: User-agent: Slurp # дабы не нагибал форум
Crawl-delay: 100 ?

Это что мне все 7000 исключений добавить в роботс?

PS
не  знаю но я скрыл так как Фисташка тоже скрыла! И вы не правы в профиле указан урл. Но при переходе по нему попадаешь на редирект!
Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

Yworld_garry

Цитата: plintus от 21 августа 2012, 18:12:54не  знаю но я скрыл так как Фисташка тоже скрыла! И вы не правы в профиле указан урл. Но при переходе по нему попадаешь на редирект!

И что, со страницы редиректа не попасть на форум ваш?

Цитата: plintus от 21 августа 2012, 18:12:54А это что такое объясните пожалуйста: User-agent: Slurp # дабы не нагибал форум
Crawl-delay: 100 ?

User-agent: Slurp — поисковый робот Yahoo! Может сканить хоть в 800 потоков, этим правилом мы даем ему ограничение. Дабы ваш хостер не плакал и не гнал на более дорогие тарифы, снижаем нагрузку.


Цитата: plintus от 21 августа 2012, 18:12:54Это что мне все 7000 исключений добавить в роботс?

Не надо там все уже добавлено, просто проверьте в вебмастере, все ли закрыто и все ли открыто из нужного вам.

plintus

Ну со страницы редиректа попасть можно, а вот (вы же сам оптимизатор) если страница редиректа запрещена к индексации как уменя, то и вес не утекает!
Вот как у меня сделано в роботс: Disallow: /go.php
Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

Yworld_garry

Цитата: plintus от 21 августа 2012, 18:22:27Ну со страницы редиректа попасть можно, а вот (вы же сам оптимизатор) если страница редиректа запрещена к индексации как уменя, то и вес не утекает!
Вот как у меня сделано в роботс: Disallow: /go.php

Я имел ввиду тут на форуме, причем тут оптимизация и тд. Имелось ввиду удобство перехода на ваш сайт по ссылкам из поста, дабы не тыкать в профиле...
Disallow: /go.php, так у всех прописано, кто использует редирект))) Хотя я и не понял к чему в данном контексте вы привели строчку из файла.

plintus

Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

kak2z

Сегодня решил посмотреть через Гугл.Вебмастер на страницу  своего форума с перечнем разделов- вот что получил

ЦитироватьПросмотреть как Googlebot
Вот как поисковый робот Googlebot просканировал вашу страницу.
URL: http://kak2z.ru/index.php?action=forum
Дата: воскресенье, 26 августа 2012 г., 20:58:13 GMT-07:00
Тип робота Googlebot: Веб
Время загрузки (в миллисекундах):
Страницу не удалось просканировать, так как она заблокирована с помощью robots.txt. Подробную информацию см. в статье Справочного центра о robots.txt.

где что надо убрать в моем роботсе что бы открыть ее к индексированию?
http://kak2z.ru/robots.txt

и надо ли ее открывать?
Если нужно что то исправить, обновить, переставить, настроить, сделать форум заново - пишите в ЛС)

maestrosite.ru

срабатывает правило:
Disallow: /*action

это правило не действует, так как строка (маска короче)
Allow: /*forum

если хотите разрешить, то:
Allow: /*action=forum

разрешать/не разрешать - разницы не много, так как у вас есть карта сайта.
Если задаются вопросы по вашей проблеме, значит это нужно вам!
---
Обновления форума, разрешение конфликтов, адаптация модов, исправление ошибок - ваши предложения о сотрудничестве направляйте по адресу smf@maestrosite.ru

kak2z

А Disallow: /*action надо убрать?
Потому что я добавил Allow: /*action=forum - а к индексации страница все равно запрещена..

Спасибо.
Если нужно что то исправить, обновить, переставить, настроить, сделать форум заново - пишите в ЛС)

maestrosite.ru

Что-то где-то не приписали:

ЦитироватьРезультаты проверки
URL    Робот Google    Googlebot-Mobile
http://smf2.maestrosite.ru/index.php?action=forum    
Разрешено в строке 2: Allow: /*action=forum
   
Разрешено в строке 2: Allow: /*action=forum
Если задаются вопросы по вашей проблеме, значит это нужно вам!
---
Обновления форума, разрешение конфликтов, адаптация модов, исправление ошибок - ваши предложения о сотрудничестве направляйте по адресу smf@maestrosite.ru

tridan

Как прописывать папку в роботс если форум на субдомене?

maestrosite.ru

robots действует для хоста на котором он сам находится. То есть на оформление уровень "субдоменности" не имеет значения
Если задаются вопросы по вашей проблеме, значит это нужно вам!
---
Обновления форума, разрешение конфликтов, адаптация модов, исправление ошибок - ваши предложения о сотрудничестве направляйте по адресу smf@maestrosite.ru

tridan

Хорошо, это понятно. Спасибо!
Может подскажете что нужно прописать в роботс главного сайта на домене, что бы через нега агенты заходили на форум?

maestrosite.ru

Цитироватьrobots действует для хоста на котором он сам находится.
То есть никакие настройки на других хостах влиять не будут. Даже настройки на основном для поддоменов.

Что бы роботы начали заходить, им надо адрес предоставить. Ссылку на индексируемом сайте разместить, либо в адурилку добавить
Если задаются вопросы по вашей проблеме, значит это нужно вам!
---
Обновления форума, разрешение конфликтов, адаптация модов, исправление ошибок - ваши предложения о сотрудничестве направляйте по адресу smf@maestrosite.ru

tridan

Тоесть если на главном форуме я првешу кнопку, а адресом перехода на форум-этого будет достаточно?

tridan

и еще такого характера вопрос, не могу установить sitemap. пишет
Вы не можете загрузить или установить новый пакет модификаций, так как директория Пакетов Модификаций защищена от записи (CHMOD)!
подскажите что и где нужно изменить

Yworld_garry

tridan Если у вас форум на поддомене, то роботс в корень поддомена. На каждом свой.
По карте сайта и правам доступа куча тем на форуме, прошу поискать и не в этой теме.

kak2z
У вас каша а не роботс стоит на сайте, еще раз проверьте логику, поднимите карту. Ниже основного блока прописаны директивы в одном блоке саразу для двух ботов...

plintus

Что-то у меня от вашего робота индекс упал в яндексе вдвое! Или так должно быть?
Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

GeorG

Верстка тем по шаблону, их доработка/переработка, переделка тем с версии smf 1.1 на smf 2.0. Примеры работ - insidestyle.ru
Установка модов (заточка под ваш форум); Моды под заказ; Обновление форума; Правильный перенос; Удаление/лечение вирусов; Устранения ошибок.
Обращаться в ЛС
Мой форум
Модуль анти-спама CleanTalk, сам пользуюсь
Сервера которыми сам пользуюсь - cadedic.ru

plintus

Статистика из яндекс вэбмастера подойдёт?
Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10

plintus

Теперь и в гугл упал индекс в половину! Но что интересно, что уников не убавилось, а даже прибавилось? Может поисковики решили что это не помойка как была раньше?
Надёжный хостинг - быстрее быстрого на SSD-дисках от 120 руб/мес  с доменом в подарок Промо-код на скидку в 10%: Skid10


Sergey-N81

Спасибо! очень познавательно, тоже robots.txt настраиваю. Пока жду апы от яндекса  :facepalm:
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Цитата: Sergey-N81 от 26 октября 2012, 18:33:46Спасибо! очень познавательно, тоже robots.txt настраиваю. Пока жду апы от яндекса

На том форуме что у вас в профиле, можно очень долго ждать качественный индекс с таким robots.txt.

Уберите пропуск строки после первого User-agent: *
Host: forum.chelnyelectro.ru  поднимите к основному блоку без пропуска строки
А это запишите так
User-agent: Slurp
Crawl-delay: 100

В этом
User-Agent: W3C-checklink      
Disallow: /

Смысла особого нет.

Sergey-N81

Цитата: Yworld_garry от 26 октября 2012, 18:45:49На том форуме что у вас в профиле, можно очень долго ждать качественный индекс с таким robots.txt.

Спасибо! если правильно понял, значит правильно поправил :). А, что не так в robots.txt там и почему? долго ждать качественный индекс - честно этот сайт сам делаю и форум тоже, но как у многих с роботом бывают проблемы.
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Да, все правильно поправили. Теперь все ок с ним.

Sergey-N81

Цитата: Yworld_garry от 26 октября 2012, 19:10:16Да, все правильно поправили. Теперь все ок с ним.

Уфф, сначала напугали :), ну а потом успокоили - Спасибо! очень благодарен.
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Sergey-N81

У меня возник вопрос к самому первому посту! так как первый пост добавлен 04 Октября 2008, 23:59:13, из этого возникает вопрос? Актуально изменение в файле Themes\index.template.php в теге <meta name="robots" content="noindex" /> на <meta name="robots" content="index, follow" />  :facepalm:
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Цитата: Sergey-N81 от 26 октября 2012, 19:23:28У меня возник вопрос к самому первому посту! так как первый пост добавлен 04 Октября 2008, 23:59:13, из этого возникает вопрос? Актуально изменение в файле Themes\index.template.php в теге <meta name="robots" content="noindex" /> на <meta name="robots" content="index, follow" />  :facepalm:

Если использовать robots.txt, то есть смысл сделать как в первом посте, так как в нем все дубли закрыты. Я вообще не сторонник использования тегов "noindex", подводят в самый не подходящий момент.
Но можно и оставить и тогда robots.txt будет как подстраховка от некорректного отрабатывания ПС "noindex".

Sergey-N81

Цитата: Yworld_garry от 26 октября 2012, 19:35:06Я вообще не сторонник использования тегов "noindex".

Я Вас полностью поддерживаю, единственное в чем возникает вопрос, это если я поправлю на <meta name="robots" content="index, follow" />, как поведет себя поисковик и что именно он выкинет на просмотр. И если не менять а оставить <meta name="robots" content="noindex" />, то и robots.txt получается не нужен, как при начальной установки форума. Я Вас правильно понял...
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

robots лишним не будет в любом случаи. Стоит еще поставить карту сайта.
Поисковик поведет себя адекватно и все что не должно быть в индексе, там и не будет. Выкинет всякий мусор, дубли ...

Sergey-N81

Цитата: Yworld_garry от 26 октября 2012, 20:01:17Стоит еще поставить карту сайта.

Подскажите где найти нормальный sitemap, я о нем думал, но вот только боюсь испортить свой форум поставив кривой мод, так как с форумом я начал только месяц назад примерно..., а на вашем форуме, только сегодня начал общаться и знакомиться с вашим форумом. Пока для меня трудно ориентироваться  здесь, так как я тут новичок :-\ ))

Я как бешеная белка из мультфильма ледниковый период  :o, столько всего вкусного, аж глаза разбегаются )), кстати Вам отдельный респект за оперативную помощь и за поддержку, обязательно плюс поставлю, когда полномочия появятся. я так думаю немогу поставить плюс из-за того что я новичек.
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Про карту тут несколько тем и все вопросы вроде решены тем или иным способом.
В этой теме только про robots.txt.
Так что найдите темки и думаю удастся поставить адекватный мод, там ничего сложного и испортить вряд ли удастся, хотя как стараться )))

Sergey-N81

А для чего у Вас дубль http://www.simplemachines.ru/robots.txt в роботе Disallow: /*all. Это ошибочная строка  :o наверно?
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Цитата: Sergey-N81 от 27 октября 2012, 23:29:15А для чего у Вас дубль http://www.simplemachines.ru/robots.txt в роботе Disallow: /*all. Это ошибочная строка  :o наверно?

ну вот спалили секретный компонент успеха, тайна раскрыта, вам вышлю счет police

Sergey-N81

Есть вопрос по удалению вот таких вот урлов: forum.site.ru/index.php?PHPSESSID=qup6g2p85o5qbusgkl34q1j847&board=151.0, я как новичок в этом деле, при создании форума сделал в самом начале две банальные ошибки, это:

  • Не создал Robots.txt
  • Создал много пустых категорий
В дальнейшем понял, свою глупую ошибку и решил немного подправить:

Но есть непонятный вопрос?, из выше указанного урла выделенный (ораньжевым цветом), я в robots.txt добавил строку Disallow: /*PHPSESSID, но они не удаляются и по мере обхода робота Яши в вебмастере вываливает их на показ, какие меры можно применить для такого случая. Чтобы остались толь те, которые выделил (синим цветом)?

Вот адрес robots.txt http://forum.chelnyelectro.ru/robots.txt
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Цитата: Sergey-N81 от 28 октября 2012, 19:21:17Изменил на более красивые урлы, теперь выглядит вот так: http://forum.site.ru/index.php/board,151.0.html

Выключить и забыть где эта функция включается. Это не чпу, а хрень.

Цитата: Sergey-N81 от 28 октября 2012, 19:21:17Но есть непонятный вопрос?, из выше указанного урла выделенный (ораньжевым цветом), я в robots.txt добавил строку Disallow: /*PHPSESSID, но они не удаляются и по мере обхода робота Яши в вебмастере вываливает их на показ, какие меры можно применить для такого случая.

Удалятся со временем.


Цитата: Sergey-N81 от 28 октября 2012, 19:21:17Чтобы остались толь те, которые выделил (синим цветом)?

Не сделаете как я написал в первом пункте, появятся еще и другие дубли.

Нужно ЧПУ, так поставьте одни из модов, тут они широко описаны.

maestrosite.ru

Ох, уж эти грабли!

1. На site.ru - нет  форума forum.site.ru

2. Вот такой canonical для вашего раздела http://forum.chelnyelectro.ru/index.php/board,151.0.html показывается гостям и роботам:
<link rel="canonical" href="http://forum.chelnyelectro.ru/index.php?PHPSESSID=udn5td0gmfmd5gg0ssjbcsul06&amp;board=151.0" />

- подробнее о PHPSESSID http://www.simplemachines.ru/index.php?topic=14410.0
- исправить canonical http://forum.chelnyelectro.ru/index.php/board,151.0.html
Если задаются вопросы по вашей проблеме, значит это нужно вам!
---
Обновления форума, разрешение конфликтов, адаптация модов, исправление ошибок - ваши предложения о сотрудничестве направляйте по адресу smf@maestrosite.ru

Sergey-N81

Цитата: maestrosite.ru от 29 октября 2012, 09:39:43Ох, уж эти грабли!

Ничего из прочитанного не понял :facepalm:, завтра буду перечитывать. Даа, наделают же конических проблем для чайников  wallbash. Вы мне попроще ответьте, Такой урл http://forum.chelnyelectro.ru/index.php/board,151.0.html допустим при стандартных настройках SMF, роботе и исправления meta name="robots" content="index, follow" />. Из-за чего спрашиваю, просто я не могу пока экспериментировать с модами, если форум рухнет, на восстановление нет времени (((, очень много работы просто  uglystupid. Да кстати Yworld_garry, я отключил ту функцию с урлами, спасибо за совет!
DSelectric.ru – Электротехнический блог готовых энергоэффективных решений, качественной электротехнической продукции и электрооборудования.

Yworld_garry

Что то вы там в своем роботс намутили, нет время проверять. Если он у вас работает правильно и вы его проверили в панель вебмастреа. То тогда с форумом все в порядке.
Я пока не понял зачем вам понадобилось так извращаться в роботс, но если работает, то и пусть.

maestrosite.ru

Цитата: Sergey-N81 от 29 октября 2012, 22:41:23
Ничего из прочитанного не понял :facepalm:, завтра буду перечитывать. Даа, наделают же конических проблем для чайников  wallbash. Вы мне попроще ответьте, Такой урл http://forum.chelnyelectro.ru/index.php/board,151.0.html допустим при стандартных настройках SMF, роботе и исправления meta name="robots" content="index, follow" />. Из-за чего спрашиваю, просто я не могу пока экспериментировать с модами, если форум рухнет, на восстановление нет времени (((, очень много работы просто  uglystupid. Да кстати Yworld_garry, я отключил ту функцию с урлами, спасибо за совет!
Теперь моя очередь: Ничего из прочитанного не понял
Если задаются вопросы по вашей проблеме, значит это нужно вам!
---
Обновления форума, разрешение конфликтов, адаптация модов, исправление ошибок - ваши предложения о сотрудничестве направляйте по адресу smf@maestrosite.ru

Жека

Старожилы, скажите пожалуйста, зачем на этом сайте в robots.txt две строчки:
Цитировать
Disallow: /*wap
Disallow: /*wap2
Ведь только первой достаточно... или как?


И вопрос №2
Allow: /*forum   ---- это на какие страницы, к примеру?

Yworld_garry

Цитата: Жека от 30 октября 2012, 09:38:34Ведь только первой достаточно... или как?

Достаточно, но криминала нет никакого.


Цитата: Жека от 30 октября 2012, 09:38:34Allow: /*forum   ---- это на какие страницы, к примеру?

Если стоит мод портала.