Vissza a Google ajánlatokhoz

Az itt leírtak, módosítás nélküli google ajánlatok.

Ezen weboldalon, a következő Google ajánlatokról olvashatunk

 

 

Az Ön webhelye a Google indexben

Oldalak blokkolása vagy eltávolítása robots.txt fájl segítségével

Metatagek

 

 

 

Különleges keresések is használhatók az olyan eredmények megtekintéséhez, amelyek a webhely Google általi indexelési módjának megtekintésére szolgálnak. Ezek teljes listájának megtekintéséhez az info: operátor használható a következő módon: info:google.com. További információk alább találhatók az egyes keresési típusokról.

Webhelyének indexelt oldalai

Webhelyének indexelt oldalait a site: operátor segítségével tekintheti meg, a következő módon: site:google.com. (Megjegyzés: az operátor és a weboldal URL-címe közé nem szabad szóközt tenni.)

A keresést végre lehet hajtani a teljes domainre vagy csak egy aldomainre vagy alkönyvtárra — például site:google.com/webmasters.

Ha bizonyos oldalakat ki szeretne zárni a keresésből, tegyen mínusz jelet az operátor elé. Például a következő kereséséhez: site:google.hu -site:adwords.google.hu operátor segítségével a google.hu domain valamennyi indexelt oldala megjelenik, kivéve az adwords.google.hu oldalról származó oldalakat.

Az Ön webhelyének főoldalára hivatkozó oldalak

A www.google.hu címre hivatkozó webhelyek megtekintéséhez használja alink:google.hu

 keresést. (A link:google.hu vagy a link:www.pelda.hu keresések bármelyike megadható, viszont az előbbi keresés alkalmazásával teljesebb eredmények érhetők el.) Adott oldalakra vagy könyvtárakra is lehet keresni: link:google.com/webmasters.

Webhelyének aktuális gyorsítótára

A cache: operátor megjeleníti a megadott, Google által indexelt oldal archivált példányát. A cache:google.hu operátor például a Google főoldal legutóbb indexelt változatát jeleníti meg a gyorsítótárazott változat adataival együtt. Az oldal csak szöveges változata is megtekinthető. Ez azért hasznos, mert úgy mutatja az oldalt, ahogy a Googlebot látja azt.

Ha azt szeretné, hogy a keresők ne érjék el az oldala gyorsítótárazott változatát, használja a noarchive metataget az alábbi példában látható módon:

<meta name="robots" content="noarchive">

A Google továbbra is feltérképezi és indexeli majd az oldalt, viszont a felhasználók részére megjelenített keresési eredmények között nem jelenik meg a Tárolt változat link.

Az Ön webhelyéhez hasonló oldalak

A related: operátor a keresett webhelyhez hasonló webhelyeket jeleníti meg. Ugyanazokat az eredményeket jeleníti meg, mintha a keresési eredményoldalon szereplő találatok valamelyike mellett a Hasonló oldalak linkre kattintana.

Ez a keresés olyan, mintha egy könyvesboltban az első Harry Potterhez hasonló könyveket keresne. Az eredmények között más gyermekeknek szóló könyvek, J. K. Rowling-életrajzok és a gyermekirodalommal foglalkozó szakirodalmi kötetek is megjelenhetnek. Ezzel az operátorral általában az átfedésben lévő forrásokat szokták keresni. A legjobb és leghasznosabb eredményeket úgy érheti el, hogyha széles tartalmi skálán mozgó webhelyeket használ.

A Google számos tényező figyelembevételével határozza meg a különböző webhelyek hasonlóságának fokát. A megjelenő webhelyek minősége azonban nem befolyásolja az Ön rangsorolását, mint ahogy azt sem, hogyan indexeli a Google az Ön webhelyét.

 

 

 

 

 

Oldalak blokkolása vagy eltávolítása robots.txt fájl segítségével

A robots.txt fájl korlátozza az internetet feltérképező keresőrobotok hozzáférését webhelyéhez. A keresőrobotok automatizált eszközök, és mielőtt hozzáférnének egy webhely oldalaihoz, ellenőrzik a robots.txt fájl jelenlétét, amely megakadályozza őket abban, hogy megnyissanak bizonyos oldalakat. (Annak ellenére, hogy minden helyesen viselkedő robot betartja a robots.txt fájl utasításait, különböző robotok különbözőképpen értelmezhetik azokat. A robots.txt fájl tiszteletben tartását ugyanakkor nem lehet ellenőrizni, így egyes spammelők vagy más "rosszakarók" figyelmen kívül hagyhatják azt. Ezért azt javasoljuk, hogy a bizalmas információkat jelszóval védje.)

Önnek csak akkor van szüksége a robots.txt fájl használatára, ha nem szeretné, hogy a keresőmotorok a webhelyén megjelenő bizonyos tartalmat feltérképezzenek. Ha azt szeretné, hogy a keresőmotorok a webhelye teljes tartalmát felvegyék az indexbe, akkor nem kell megadnia robots.txt fájlt (még üres fájlt sem).

Habár a Google nem térképezi fel és nem indexeli a robots.txt fájlban blokkolt oldalak tartalmát, az URL-címeket továbbra is indexelhetjük, ha más internetes oldalakon találjuk meg őket. Ennek eredményeképpen az oldal URL-címe, és esetleg más nyilvánosan elérhető információk, például a webhelyre mutató linkek utalószövege, vagy az Open Directory Projectben (www.dmoz.org) szereplő cím, megjelenhetnek a Google keresési eredményeiben.

Annak érdekében, hogy használhassa a robots.txt fájlt, hozzáféréssel kell rendelkeznie a szerver gyökérkönyvtárához (ha nem biztos a dolgában, érdeklődjön a webes szolgáltatónál). Amennyiben nincs hozzáférési jogosultsága a domain gyökeréhez, a ROBOTS metatag segítségével korlátozhatja a keresőrobot hozzáférését.

Ha teljes körűen szeretné megakadályozni, hogy egy oldal tartalma bekerüljön a Google internetes indexébe, még akkor is, ha más oldalak hivatkoznak rá, használja a noindex metataget. Amennyiben a Googlebot eljut erre az oldalra, látni fogja a noindex metataget, és megakadályozza, hogy az oldal bekerüljön a webindexbe.

 

A szabvány leírása a következő webhelyen érhető el: http://www.robotstxt.org/meta.html. Ez a módszer akkor hasznos, ha nincs hozzáférése a szervere gyökérszintjéhez, ugyanis a módszer a webhelyhez oldalankénti hozzáférés-irányítást tesz lehetővé.

Ha szeretné megakadályozni, hogy a keresőrobotok fel tudják venni a webhelyén található oldalt az indexbe, a következő metataget kell elhelyeznie az oldal <head> részébe:

<meta name="robots" content="noindex">

Ha pedig azt szeretné, hogy más keresőrobotok felvegyék az indexbe a webhelyén található oldalt, a Google keresőrobotjai viszont ne:

<meta name="googlebot" content="noindex">

Amikor egy oldalon a noindex metataget észleljük, a Google teljesen kihagyja az oldalt a keresési eredményei közül, még akkor is, ha más oldalak hivatkoznak rá. Más keresőmotorok azonban másként is értelmezhetik ezt az utasítást. Ennek eredményeképp az oldal linkje megjelenhet keresési eredményeikben.

Vegye figyelembe, hogy mivel a noindex metatag észleléséhez fel kell térképeznünk az oldalát, van egy kevés esély arra, hogy a Googlebot nem látja meg és nem alkalmazza a noindex metataget. Ha oldala továbbra is megjelenik a keresési eredményekben, az azért lehet, mert nem térképeztük fel a webhelyét a címke hozzáadása óta. (Emellett, ha Ön a robots.txt fájlban beállította ennek az oldalnak a blokkolását, akkor nem látjuk meg a címkét sem.)

Ha a tartalom jelenleg szerepel az indexben, a legközelebbi feltérképezéskor fogjuk eltávolítani. Az eltávolítási folyamatot felgyorsíthatja a Google Webmestereszközök URL-eltávolítási kérelmi eszköz

 

 

 

 

 

Metatagek

 

A metatagek nagyszerű lehetőséget nyújtanak a webmestereknek arra, hogy webhelyükkel kapcsolatos adatokat biztosítsanak a keresőmotorok számára. Metatagek használatával bármilyen típusú ügyfélprogram számára lehet adatokat szolgáltatni, és az egyes rendszerek kizárólag az általuk értelmezhető metatageket dolgozzák fel, a többit pedig figyelmen kívül hagyják. A metatagek a HTML oldal <head> részébe kerülnek, és általában a következőképpen néznek ki:

 
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">

<html>

<head>

<META NAME="Description" CONTENT="Szerző: Szerző N. L., Képek: K. Képek, Kategória: Könyvek, 
Ár:   £9.24, Terjedelem: 784 oldal">

<META http-equiv="Content-Type" CONTENT="text/html; charset=iso-8859-1">

<META NAME="google-site-verification" CONTENT="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>

<title>Példakönyvek - kiváló minőségű használt könyvek gyermekek számára</title>

<META NAME="robots" CONTENT="noindex,nofollow">

 
 
 
 
 

A Google a következő metatageket (és kapcsolódó elemeket) ismeri fel:

 

<meta name="description" content="Az oldal leírása" />

Ez a címke rövid leírást nyújt az oldalról. Bizonyos esetekben ezt a leírást jeleníti meg a rendszer a keresési eredményekhez tartozó oldalrészletben. További információ

<title>Az oldal címe</title>

Habár ez a címke technikailag nem metatag, gyakran használják a leírásra szolgáló címkével együtt. A címke tartalma általában címként jelenik meg a keresési eredményekben (és természetesen a felhasználó böngészőjében is). További információ

<meta name="robots" content="..., ..." />
<meta name="googlebot" content="..., ..." />

Ezekkel a metatagekkel vezérelhető a keresőmotorok feltérképezési és indexelési tevékenysége. A robots metatag valamennyi keresőmotorra érvényes, míg a "googlebot" metatag kizárólag a Google keresőmotorjára vonatkozik. Az alapértelmezett beállítások az "index, follow" (megegyezik az "all" értékkel), és a hozzájuk tartozó értékeket nem kell megadni. Rendszerünk a következő értékeket ismeri fel (több érték megadása esetén vesszővel kell elválasztani azokat):

  • noindex: az oldal indexelésének tiltása
  • nofollow: megakadályozza, hogy a Googlebot kövesse az adott oldalról más oldalakra mutató linkeket.
  • nosnippet: megakadályozza, hogy egy oldalrészlet megjelenjen a keresési eredmények között.
  • noodp: megakadályozza, hogy a rendszer felhasználja az ODP/DMOZ-adatokból származó alternatív leírást.
  • noarchive: megakadályozza, hogy a Google megjelenítse egy oldal gyorsítótárazott linkjeit.
  • unavailable_after:[date]: megadhatja, hogy a rendszer pontosan mely napon és időpontban állítsa le az oldal feltérképezését és indexelését.
  • noimageindex: megadhatja, hogy a rendszer ne jelenítse meg az oldalt hivatkozott oldalként a Google keresési eredményekben megjelenő képhez.

Ezt az információt az "X-Robots-Tag" HTTP fejléc-paranccsal megadhatja az oldalak fejlécében is, széljegyzetként. Ez különösen hasznos lehet akkor, ha tökéletesíteni szeretné a nem HTML-fájlok, például ábrák vagy egyéb dokumentumtípusok feltérképezését és indexelését.

<meta name="google" value="notranslate" />

Ha rendszerünk észleli, hogy egy oldal tartalma nem azon a nyelven jelenik meg, amelyen a felhasználó valószínűleg olvasni szeretné, a keresési eredmények között gyakran megjelenítjük az oldal fordított változatára mutató linket is. Így általában lehetősége nyílik arra, hogy webhelye egyedülálló és értékes tartalmát szélesebb felhasználói közönség számára jelenítse meg. Azonban előfordulhatnak olyan helyzetek, amikor Ön ezt nem szeretné. A metatag segítségével megadhatja, hogy a Google ne biztosítson fordítást az adott oldalhoz. További információ

<meta name="google-site-verification" content="..." />

Ha ezt a címkét beilleszti a webhelye felső szintű oldalába, ezáltal igazolhatja a webhely tulajdonjogát a Webmestereszközök számára. Felhívjuk szíves figyelmét arra, hogy a "name" és a "content" attribútum értékének (beleértve a kis- és nagybetűket) pontosan meg kell egyeznie az itt leírtakkal, azonban annak nincs jelentősége, ha a címke formátumát XHTML-ről HTML-re változtatja, vagy ha az oldal formátumához igazítja a címke formátumát. További információ

<meta http-equiv="Content-Type" content="...; charset=..." />

Ez a metatag az oldal tartalmának típusát és karakterkészletét határozza meg. Ügyeljen arra, hogy a Content attribútum értékét idézőjelek közé zárva adja meg, mert különben a rendszer hibásan értelmezheti a Charset attribútumot. 1További információ

<meta http-equiv="refresh" content="...;url=..." />

Ez a metatag egy bizonyos idő elteltével egy új URL-címre továbbítja a felhasználót, és bizonyos esetekben az átirányítás egyszerű formájaként használható. Azonban nem minden böngésző támogatja a használatát, és zavaró lehet a felhasználó számára. A W3C nem javasolja a címke használatát. Javasoljuk, hogy a címke helyett szerveroldali 301-es átirányítást használjon.

Egyéb fontos tudnivalók:

Ez a felsorolás nem tartalmazza az összes használható metataget, így szabadon használhat más metatageket is, ha fontosnak tartja a webhelye szempontjából. Tartsa szem előtt azonban, hogy a Google figyelmen kívül hagyja azokat a metatageket, amelyeket nem ismer fel.

 

 

Vissza a lap elejére