Super-rychlé třídění webových stránek

2.6.2003

Vědci na Stanfordské Universitě vyvinuli několik technologií pro pořádání www stránek, analogických technologiím používaných vyhledávačem Google, avšak umožňující až 5x rychlejší vyhledávání. Prohledávacímu algoritmu používanému Googlem (nazývanému "Computing PageRank Algorithm") by v současné době trvalo několik dní, než by prohledal a uspořádal 3 miliony existujících webových stránek. Pro jeho urychlení použil stanfordský tým tři různé strategie. První využívá extrapolační metody, které používají určitých předpokladů o struktuře webových stránek, které nemusí být nezbytně vždy splněny, ale které významně urychlují vyhledávací proces. Výsledek potom může být zpřesněn klasickým "PageRank" algoritmem. Druhá strategie využívá vylepšení nazývaného "BlockRank", který eliminuje redundanci při pořádání stránek, které patří k téže www prezentaci (web site). Konečně jako třetí strategie použil stanfordský tým tzv. "Adaptivní PageRank", který eliminuje ještě více redundanci způsobenou opětným zpracováním stránek, které byly při vyhledávací proceduře již navštíveny dříve. Další zrychlení je pak možné využitím všech tří metod v kombinaci.

Tyto výsledky se zdají opravňovat naději, že vyhledávače typu Google se již brzy propracují k algoritmům, které umožní individualizované vyhledávání podle osobních zájmů a preferencí. A možná budou internetové vyhledávače nakonec vědět co chceme lépe než my sami ?

Odeslat komentář k článku " Super-rychlé třídění webových stránek "



Opište text z obrázku:

Odeslat článek " Super-rychlé třídění webových stránek " e-mailem

Diskuse/Aktualizace