<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Comments on: Uus otsingumootor Cuil &#8211; esimene t&#245;sine konkurent Google&#8217;ile?</title>
	<atom:link href="http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/</link>
	<description>Tarkvara. Veeb. Mobiil. Multimeedia. Tehnoloogia</description>
	<pubDate>Wed, 23 May 2012 02:06:45 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6</generator>
		<item>
		<title>By: Anti</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-7213</link>
		<dc:creator>Anti</dc:creator>
		<pubDate>Tue, 30 Dec 2008 21:46:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-7213</guid>
		<description>Tundub, et mull l2ks l6hki.

http://www.techcrunch.com/2008/12/27/cuil-fail-traffic-nearly-hits-rock-bottom/</description>
		<content:encoded><![CDATA[<p>Tundub, et mull l2ks l6hki.</p>
<p><a href="http://www.techcrunch.com/2008/12/27/cuil-fail-traffic-nearly-hits-rock-bottom/" rel="nofollow">http://www.techcrunch.com/2008/12/27/cuil-fail-traffic-nearly-hits-rock-bottom/</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Kalev</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6685</link>
		<dc:creator>Kalev</dc:creator>
		<pubDate>Fri, 01 Aug 2008 10:55:11 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6685</guid>
		<description>Cuil Stats - The Early Numbers
http://weblogs.hitwise.com/bill-tancer/2008/07/cuil_stats_the_early_numbers.html

#12 koht otsimootoritest ja #197 kõigi veebilehtede seas</description>
		<content:encoded><![CDATA[<p>Cuil Stats - The Early Numbers<br />
<a href="http://weblogs.hitwise.com/bill-tancer/2008/07/cuil_stats_the_early_numbers.html" rel="nofollow">http://weblogs.hitwise.com/bill-tancer/2008/07/cuil_stats_the_early_numbers.html</a></p>
<p>#12 koht otsimootoritest ja #197 kõigi veebilehtede seas</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Lembit</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6680</link>
		<dc:creator>Lembit</dc:creator>
		<pubDate>Tue, 29 Jul 2008 11:41:22 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6680</guid>
		<description>Arusaadav. See on muidugi bläkk, kui robot on optimeerimata ja ei austa standardit (ei kuula sõna ja püüab salvestada ka lehekülgi, mis selgesõnaliselt talle keelatakse). Kui vihjad PR-ämbrile, siis jah, see võibki see peamine bläkk olla. Et algul ei olnud veebimeistritel infot, mis toimub ja võimalust suhelda roboti arendajatega. Näib, et praguseks on asi paranenud ja roboti kohta info kenasti üleval, ka IP-aadressid, kust va ämblikku oodata on: http://www.cuil.com/info/webmaster_info/ Seal Cuil mainib ka, et on kohanud liba-Twiceleri.

Rich Skrenta blogis on ka väga huvitav postitus pealkirjaga "Did Powerset outsource their crawl?". Näib, et on olemas keegi page-store.com, kes müüb internetti. Lahe, osta täpselt nii suur tükk, kui sul vaja on. Cuil oleks võinud PR-ämbrit vältida ja samuti kroolimise sisse osta, ilmselt oleks ka hulka odavam.

Võibolla siiski nende imelised algoritmid vajavad &lt;em&gt;custom&lt;/em&gt; robotit ja mingil salapärasel põhjusel on ka vaja iga lk 10 korda kopeerida :P</description>
		<content:encoded><![CDATA[<p>Arusaadav. See on muidugi bläkk, kui robot on optimeerimata ja ei austa standardit (ei kuula sõna ja püüab salvestada ka lehekülgi, mis selgesõnaliselt talle keelatakse). Kui vihjad PR-ämbrile, siis jah, see võibki see peamine bläkk olla. Et algul ei olnud veebimeistritel infot, mis toimub ja võimalust suhelda roboti arendajatega. Näib, et praguseks on asi paranenud ja roboti kohta info kenasti üleval, ka IP-aadressid, kust va ämblikku oodata on: <a href="http://www.cuil.com/info/webmaster_info/" rel="nofollow">http://www.cuil.com/info/webmaster_info/</a> Seal Cuil mainib ka, et on kohanud liba-Twiceleri.</p>
<p>Rich Skrenta blogis on ka väga huvitav postitus pealkirjaga &#8220;Did Powerset outsource their crawl?&#8221;. Näib, et on olemas keegi page-store.com, kes müüb internetti. Lahe, osta täpselt nii suur tükk, kui sul vaja on. Cuil oleks võinud PR-ämbrit vältida ja samuti kroolimise sisse osta, ilmselt oleks ka hulka odavam.</p>
<p>Võibolla siiski nende imelised algoritmid vajavad <em>custom</em> robotit ja mingil salapärasel põhjusel on ka vaja iga lk 10 korda kopeerida <img src='http://www.dt.ee/blog/wp-includes/images/smilies/icon_razz.gif' alt=':P' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: sander85</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6679</link>
		<dc:creator>sander85</dc:creator>
		<pubDate>Tue, 29 Jul 2008 05:49:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6679</guid>
		<description>tegemist pole tegelikult mõne kuuga, oma statistikast, mis ulatub aasta taha on kenasti näha vähemalt ühte nende robotit, mis sama rumalalt on pidevalt kamminud meie foorumit..

miks rumalalt? kui google teeb 68500 hitti ja indekseerib 58300 lehte/faili, siis see võtab ~570MB andmeid, samas teisel kohal olev twiceler 9300 hiti ja 7300 lehe/faili indekseerimisel kasutab ~400MB anmdeid.. siinkohal jääb mul arusaamatuks, et mida krdit nende robot tirib ja miks on nende robot optimiseerimata

nende probleemiks tõenäoliselt saigi see, et kui twiceler oma rumalusi erinevatel veebidel tegema hakkas, siis nende koduleht ei pajatanud midagi tarka, et miks see robot peaks olema mu lehel hea ja mis on ta eesmärk, keegi ei teadnud.. ja nii suuri andmemahtusi lampi raisku lasta on kõigile neile kallis, kellel andmete liikumine on tasustatav..

http://www.theadminzone.com/forums/showthread.php?p=273710 - see foorum näitab, et nende robot on liikvel olnud juba üle kahe aasta ja alustas kohe alguses üsna agressiivselt..</description>
		<content:encoded><![CDATA[<p>tegemist pole tegelikult mõne kuuga, oma statistikast, mis ulatub aasta taha on kenasti näha vähemalt ühte nende robotit, mis sama rumalalt on pidevalt kamminud meie foorumit..</p>
<p>miks rumalalt? kui google teeb 68500 hitti ja indekseerib 58300 lehte/faili, siis see võtab ~570MB andmeid, samas teisel kohal olev twiceler 9300 hiti ja 7300 lehe/faili indekseerimisel kasutab ~400MB anmdeid.. siinkohal jääb mul arusaamatuks, et mida krdit nende robot tirib ja miks on nende robot optimiseerimata</p>
<p>nende probleemiks tõenäoliselt saigi see, et kui twiceler oma rumalusi erinevatel veebidel tegema hakkas, siis nende koduleht ei pajatanud midagi tarka, et miks see robot peaks olema mu lehel hea ja mis on ta eesmärk, keegi ei teadnud.. ja nii suuri andmemahtusi lampi raisku lasta on kõigile neile kallis, kellel andmete liikumine on tasustatav..</p>
<p><a href="http://www.theadminzone.com/forums/showthread.php?p=273710" rel="nofollow">http://www.theadminzone.com/forums/showthread.php?p=273710</a> - see foorum näitab, et nende robot on liikvel olnud juba üle kahe aasta ja alustas kohe alguses üsna agressiivselt..</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Lembit</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6677</link>
		<dc:creator>Lembit</dc:creator>
		<pubDate>Tue, 29 Jul 2008 00:00:20 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6677</guid>
		<description>Tänud linkide eest. Vaat siis, kuidas. Mina polnud Cuilist ja robot Twicelerist enne praegust meedikära midagi kuulnud.

Tjah, eks mõningane agressiivsus interneti kroolimisel (Gunnari tõlge-sõnamäng &lt;em&gt;crawl&lt;/em&gt; baasil) on mõistetav, kui vaja mõne kuuga kogu internet oma servudesse kopeerida.

Rich Skrenta iroonias on ehk ka terake tõtt, kui ta kirjutab, et ohtrate foorumite puudumine Cuili indeksist võib selle kvaliteedile isegi kasuks tulla ;)</description>
		<content:encoded><![CDATA[<p>Tänud linkide eest. Vaat siis, kuidas. Mina polnud Cuilist ja robot Twicelerist enne praegust meedikära midagi kuulnud.</p>
<p>Tjah, eks mõningane agressiivsus interneti kroolimisel (Gunnari tõlge-sõnamäng <em>crawl</em> baasil) on mõistetav, kui vaja mõne kuuga kogu internet oma servudesse kopeerida.</p>
<p>Rich Skrenta iroonias on ehk ka terake tõtt, kui ta kirjutab, et ohtrate foorumite puudumine Cuili indeksist võib selle kvaliteedile isegi kasuks tulla <img src='http://www.dt.ee/blog/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: sander85</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6676</link>
		<dc:creator>sander85</dc:creator>
		<pubDate>Mon, 28 Jul 2008 22:31:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6676</guid>
		<description>http://newsgroups.derkeiler.com/Archive/Alt/alt.internet.search-engines/2005-10/msg00444.html
http://www.skrenta.com/2008/04/cuill_is_banned_on_10000_sites.html
http://www.phpbb.com/community/viewtopic.php?f=1&#38;t=550093

jne, internet on täis selliseid teemasi.. probleem peamiselt selles, et see robot ei arvesta üldse sellega, et võib tõsiselt segada veebiserverite tööd ja teiste kasutajate mugavust.. lihtsalt imeb end saidi külge ja vägistab serverit nii kuidas jõuab..
teine suurem probleem on see, et kuna meie süsteem saadab iga kasutajate poolt saavutatud vea kohta teate, siis twiceler genereerib ise kokku urle, mida tegelikult olemas ei ole.. see aga kuhjab üles tõsise vigade nimekirja.. yahoo slurp on küll üsna lähedale, kuid see vähemalt ei ürita serverit ära kõrvetada..</description>
		<content:encoded><![CDATA[<p><a href="http://newsgroups.derkeiler.com/Archive/Alt/alt.internet.search-engines/2005-10/msg00444.html" rel="nofollow">http://newsgroups.derkeiler.com/Archive/Alt/alt.internet.search-engines/2005-10/msg00444.html</a><br />
<a href="http://www.skrenta.com/2008/04/cuill_is_banned_on_10000_sites.html" rel="nofollow">http://www.skrenta.com/2008/04/cuill_is_banned_on_10000_sites.html</a><br />
<a href="http://www.phpbb.com/community/viewtopic.php?f=1&amp;t=550093" rel="nofollow">http://www.phpbb.com/community/viewtopic.php?f=1&amp;t=550093</a></p>
<p>jne, internet on täis selliseid teemasi.. probleem peamiselt selles, et see robot ei arvesta üldse sellega, et võib tõsiselt segada veebiserverite tööd ja teiste kasutajate mugavust.. lihtsalt imeb end saidi külge ja vägistab serverit nii kuidas jõuab..<br />
teine suurem probleem on see, et kuna meie süsteem saadab iga kasutajate poolt saavutatud vea kohta teate, siis twiceler genereerib ise kokku urle, mida tegelikult olemas ei ole.. see aga kuhjab üles tõsise vigade nimekirja.. yahoo slurp on küll üsna lähedale, kuid see vähemalt ei ürita serverit ära kõrvetada..</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Lembit</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6675</link>
		<dc:creator>Lembit</dc:creator>
		<pubDate>Mon, 28 Jul 2008 17:53:19 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6675</guid>
		<description>Sander, äkki täpsustad.</description>
		<content:encoded><![CDATA[<p>Sander, äkki täpsustad.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: sander85</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6674</link>
		<dc:creator>sander85</dc:creator>
		<pubDate>Mon, 28 Jul 2008 17:22:37 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6674</guid>
		<description>see on siis see va värdjas twiceler jah, üks kõige rohkem peavalu valmistanud otingurobot ever, päris mitmes enda hallatavas saidis selle ära blokeerinud ja see on selle roboti puhul üsna laialt levinud käitumine, nii et otsingu tulemused võivad seetõttu tugevalt kannatada</description>
		<content:encoded><![CDATA[<p>see on siis see va värdjas twiceler jah, üks kõige rohkem peavalu valmistanud otingurobot ever, päris mitmes enda hallatavas saidis selle ära blokeerinud ja see on selle roboti puhul üsna laialt levinud käitumine, nii et otsingu tulemused võivad seetõttu tugevalt kannatada</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Jaana</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6673</link>
		<dc:creator>Jaana</dc:creator>
		<pubDate>Mon, 28 Jul 2008 17:14:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6673</guid>
		<description>Minu testiotsing andis küll hulga tulemusi aga nende järjestus oli Google'ga võrreldes risti-vastupidi ja mitte heas mõttes...</description>
		<content:encoded><![CDATA[<p>Minu testiotsing andis küll hulga tulemusi aga nende järjestus oli Google&#8217;ga võrreldes risti-vastupidi ja mitte heas mõttes&#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Margus</title>
		<link>http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6672</link>
		<dc:creator>Margus</dc:creator>
		<pubDate>Mon, 28 Jul 2008 15:26:23 +0000</pubDate>
		<guid isPermaLink="false">http://www.dt.ee/blog/www/otsingumootorid/2008/07/otsingumootor-cuil-google-konkurent/#comment-6672</guid>
		<description>Väike võrdlus ütleb kõik:

http://www.google.ee/search?hl=et&#38;q=estonia&#38;lr=
VS.
http://www.cuil.com/search?q=estonia&#38;sl=long</description>
		<content:encoded><![CDATA[<p>Väike võrdlus ütleb kõik:</p>
<p><a href="http://www.google.ee/search?hl=et&amp;q=estonia&amp;lr=" rel="nofollow">http://www.google.ee/search?hl=et&amp;q=estonia&amp;lr=</a><br />
VS.<br />
<a href="http://www.cuil.com/search?q=estonia&amp;sl=long" rel="nofollow">http://www.cuil.com/search?q=estonia&amp;sl=long</a></p>
]]></content:encoded>
	</item>
</channel>
</rss>

