<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Blokowanie zalewu robotów MSNu</title>
	<atom:link href="http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/feed/" rel="self" type="application/rss+xml" />
	<link>http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/</link>
	<description>Open-source development violates almost all known management theories.</description>
	<lastBuildDate>Sat, 03 Sep 2011 18:43:33 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
	<item>
		<title>By: Emanuel</title>
		<link>http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/comment-page-1/#comment-52620</link>
		<dc:creator>Emanuel</dc:creator>
		<pubDate>Sun, 18 Apr 2010 22:25:22 +0000</pubDate>
		<guid isPermaLink="false">http://diary.braniecki.net/?p=1068#comment-52620</guid>
		<description>Niezwykle drapieżny jest MSFT 207.46. Potrafi nawet 10-krotnie przebić Googlebota w dziennej liczbie zapytań i włazi wszędzie &quot;z buciorami&quot;.  Jest co kilka minut, za każdym razem inne IP i udawanie innej przeglądarki, przez 24h na dobę. Zachowuje się jak natrętny kameleon. Chciałem z nim kiedyś delikatnie... ale nic nie pomagało - skuteczne jest tylko całkowite wycięcie 207.46.0.0/16 na poziomie serwera... i po sprawie :)
&lt;code&gt;iptables -I INPUT -s 207.46.0.0/16 -j DROP&lt;/code&gt;
Odtąd spokój.</description>
		<content:encoded><![CDATA[<p>Niezwykle drapieżny jest MSFT 207.46. Potrafi nawet 10-krotnie przebić Googlebota w dziennej liczbie zapytań i włazi wszędzie &#8220;z buciorami&#8221;.  Jest co kilka minut, za każdym razem inne IP i udawanie innej przeglądarki, przez 24h na dobę. Zachowuje się jak natrętny kameleon. Chciałem z nim kiedyś delikatnie&#8230; ale nic nie pomagało &#8211; skuteczne jest tylko całkowite wycięcie 207.46.0.0/16 na poziomie serwera&#8230; i po sprawie <img src='http://diary.braniecki.net/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /><br />
<code>iptables -I INPUT -s 207.46.0.0/16 -j DROP</code><br />
Odtąd spokój.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: HARY</title>
		<link>http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/comment-page-1/#comment-50478</link>
		<dc:creator>HARY</dc:creator>
		<pubDate>Sun, 14 Feb 2010 13:04:32 +0000</pubDate>
		<guid isPermaLink="false">http://diary.braniecki.net/?p=1068#comment-50478</guid>
		<description>Zauważyłem to samo (msnbota w ubranku IE) sporo wcześniej, natomiast nie skojarzyłem, że zmiana nastąpiła po tym, jak wyciąłem go w robots.txt.

Z bandytów rodzimych również Szukacz olewa robots.

Jako ciekawostkę polecam też sprawdzić w logach, co przychodzi z amazon.com i OVH(94.23.) Są bardzo twórczy w wymyślaniu User-Agent.</description>
		<content:encoded><![CDATA[<p>Zauważyłem to samo (msnbota w ubranku IE) sporo wcześniej, natomiast nie skojarzyłem, że zmiana nastąpiła po tym, jak wyciąłem go w robots.txt.</p>
<p>Z bandytów rodzimych również Szukacz olewa robots.</p>
<p>Jako ciekawostkę polecam też sprawdzić w logach, co przychodzi z amazon.com i OVH(94.23.) Są bardzo twórczy w wymyślaniu User-Agent.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: mazdac</title>
		<link>http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/comment-page-1/#comment-50148</link>
		<dc:creator>mazdac</dc:creator>
		<pubDate>Fri, 05 Feb 2010 23:54:22 +0000</pubDate>
		<guid isPermaLink="false">http://diary.braniecki.net/?p=1068#comment-50148</guid>
		<description>miałem coś podobnego z tym że była to pierwsza indeksacja gógla (oczywiście nie właził tam gdzie nie powinien) ale równie mocno dotknął mnie spadek parametrów łącza (bez regułek w tablesach lub konfigu serwera, wysysa calutkie), aktualizacje były już mniej zasobożerne. A msn i wp trzeba wycinać, takie zachowanie jest nie do przyjęcia.</description>
		<content:encoded><![CDATA[<p>miałem coś podobnego z tym że była to pierwsza indeksacja gógla (oczywiście nie właził tam gdzie nie powinien) ale równie mocno dotknął mnie spadek parametrów łącza (bez regułek w tablesach lub konfigu serwera, wysysa calutkie), aktualizacje były już mniej zasobożerne. A msn i wp trzeba wycinać, takie zachowanie jest nie do przyjęcia.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Maciej Piechotka</title>
		<link>http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/comment-page-1/#comment-50128</link>
		<dc:creator>Maciej Piechotka</dc:creator>
		<pubDate>Fri, 05 Feb 2010 17:12:50 +0000</pubDate>
		<guid isPermaLink="false">http://diary.braniecki.net/?p=1068#comment-50128</guid>
		<description>Hmm. Skoro obroną google było to że można wyłączyć kopiowanie treści przez plik robots.txt to oznacza że wp/msn.

PS. W dokumentacji MSN znalazłem Crawl-delay (nigdzie indziej nie znalazłem opisu). Czy on też nie działa? I tak przy okazji - kto chciałby wpisywać minimalny czas indeksowania w sekundach? A dodanie wprost msnbot zamiast *? No i może przed sądem po prostu wysłać list z &lt;del&gt;pogrózkami&lt;/del&gt; wyjaśnieniem sytłacji...</description>
		<content:encoded><![CDATA[<p>Hmm. Skoro obroną google było to że można wyłączyć kopiowanie treści przez plik robots.txt to oznacza że wp/msn.</p>
<p>PS. W dokumentacji MSN znalazłem Crawl-delay (nigdzie indziej nie znalazłem opisu). Czy on też nie działa? I tak przy okazji &#8211; kto chciałby wpisywać minimalny czas indeksowania w sekundach? A dodanie wprost msnbot zamiast *? No i może przed sądem po prostu wysłać list z <del>pogrózkami</del> wyjaśnieniem sytłacji&#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Grzegorz</title>
		<link>http://diary.braniecki.net/2010/02/05/blokowanie-zalewu-robotow-msnu/comment-page-1/#comment-50120</link>
		<dc:creator>Grzegorz</dc:creator>
		<pubDate>Fri, 05 Feb 2010 15:34:06 +0000</pubDate>
		<guid isPermaLink="false">http://diary.braniecki.net/?p=1068#comment-50120</guid>
		<description>Zastanawiam się czy to nie podpada pod jakiś paragraf, czy mówiąc w prostu nie da się postraszyć sądem właściciela bota?</description>
		<content:encoded><![CDATA[<p>Zastanawiam się czy to nie podpada pod jakiś paragraf, czy mówiąc w prostu nie da się postraszyć sądem właściciela bota?</p>
]]></content:encoded>
	</item>
</channel>
</rss>

