přejít na obsah přejít na navigaci

Linux E X P R E S, RDC - kdopak tady lže?

RDC - kdopak tady lže?

Už dávno mě trápila otázka, jak moc jsou pravdivé informace, které o sobě někteří poskytovatelé českého webhostingu tvrdí. Zrovna včera jsem narazil na reklamu jedné nejmenované firmy, která o sobě prohlašuje, že na svých serverech se zachováním maximální kvality a minimální ceny naprosto bezproblémově provozuje několik tisíc domén. O této společnosti jsem nikdy dříve neslyšel a tak jsem začal bádat, zda-li je (ze strany zákazníka) vůbec možné tuto informaci ověřit.


Po několika minutách vyhledávání jsem došel k závěru, že žádná přímá cesta (rozumějme centrální databáze) neexistuje. Při googlování mě však napadla myšlenka "zneužít" k tomuto účelu některý z vyhledávačů. Pročetl jsem poměrně podrobně jejich „návody“ a začal tvořit kód. Základním prvkem se stal vyhledávač live.com, který umí prohledat svou databázi webových stránek podle jejich IP adresy. Z prohlížeče si to můžete vyzkoušet sami, pokud zadáte do adresní řádky řetězec

http://search.live.com/results.aspx?q=ip:

a za něj bez mezery IP adresu hledaného serveru. Výsledkem je seznam domén a odkazy na jejich nejnavštěvovanější stránky. Abychom však zjistili i veškeré subdomény k vyhledaným doménám podle IP adresy, je nutné, položit dalšímu vyhledávači ještě jeden dotaz. K tomuto účelu se mi více líbil google, který umí zobrazit veškeré stránky (a tím pádem i subdomény) v námi určené doméně. Opět si to můžeme ověřit v prohlížeči zadáním řetězce

http://www.google.cz/search?q=site:

za který doplníme název domény.

K programu jsem chtěl mít webový front-end a tak jsem ho celý vytvořil ve skriptovacím jazyku PHP. Nejdůležitější část programu tvoří funkce curl, která se dotazuje vyhledávačů na požadované domény (IP adresy). Dále jsem použil několik základních funkcí pro práci s řetězci (oříznutí textu, downcase písmen) a trojici regulárních výrazů pro úpravu odkazů. Výsledek si můžete prohlédnout na mých stránkách.

reverse_domain_check.png

Uvedená metodika vyhledávání sice není zcela stoprocentní . Ve výstupu nenaleznete domény, které jsou aktivní teprve chvíli (tj. nejsou ještě zindexované vyhledávačem). Poskytovatel také může mít více serverů s několika IP adresami (kvůli rozložení zátěže) - v tomto případě je nutné provést vyhledávání pro každou IP adresu zvlášť a výsledky nakonec sečíst. Pro naši představivost je však dané vyhledávání zcela dostačující. Tak schválně – který český poskytovatel má na jedné IP adrese nejvíce domén? Já například nalezl na IP adrese 87.236.199.95 více jak 450 domén.


Nahoru

Milan Kozák

Milan Kozák

I přestože jsem paranoidní neznamená, že mě nedostanou...


  • Distribuce: Debian, *BSD, Slackware

| blog


Geotronic