|
||||||||
|
PBO_Resources_Glossary_fr |
||||||||
|
|
||||||||
|
GLOSSAIRE |
||||||||
|
Achat de mots-clés L'achat de mots-clés dans les moteurs de recherche est uniquement possible à travers les bandeaux. Tous les principaux moteurs de recherches (sauf EuroSeek et GoTo) insistent que cet achat de mots-clés n'est lié qu'à l'apparition de bannières et n'influence en rien le résultat des requêtes. Un service "Bannerstake" proposé par Thomson et Thomson à l'adresse suivante : http://www.namestake.com permet de comprendre la logique d'affichage de bandeaux en fonction de la requête faite. Adjacency Advertiser (aussi référencé comme marchand, commerçant, commerçant en ligne ...). Tous les sites internet qui vendent des produits ou service, acceptent des paiements, et des commandes. un "Advertiser" place des annonces et des liens de vendeurs sur d'autres sites web (publishers) et paie ces "publisher"une commission pour amener ou vendre le produit ou la prestation depuis leur site. C'est la méthode qu'utilise un Moteur de Recherche ou un Répertoire pour relier les mots-clés d'une requête avec le contenu de chaque page, de telle sorte que les pages Web trouvées correspondent bien au sujet de la requête. Chaque Moteur de Recherche ou Répertoire est susceptible d'utiliser un algorithme différent et de le changer ou de l'améliorer de temps en temps. C'est un moteur de recherche très populaire avec la plus grande base de données sur Internet, indexant plus de 140 millions de pages. Son URL principale est http://www.altavista.com. Jusqu'en 1998, ce moteur était utilisé par Yahoo pour la recherche d'informations. Altavista indexe tous les mots d'une page et les nouvelles pages sont rajoutées dans la base de données très rapidement, généralement, dans les deux jours ouvrables. Il vous est demandé de soumettre juste la première page de votre site, le robot d'Altavista explorera votre site et indexera vos pages. Quelques problèmes de spamming ont été notés. L'utilisation des mots-clés dans les meta-tags est pénalisée. Altavista propose différentes options alternatives avant les résultats de sa recherche tel que des suggestions de questions (en utilisant les services de Ask Jeeves) et RealNames. Les premières places achetées commencent à apparaître dans les pages de résultats. AOL Netfind Cf Netfind C'est un petit programme dans votre page web, souvent écrit en Java, qui s'exécute au niveau de votre navigateur. Il est possible que la présence de ce programme stoppe l'indexation de votre page par le robot. C'est la partie du Moteur de Recherche qui surfe sur la toile, enregistre les URLs, classe les mots-clés et le texte de chaque page qu'il trouve. En français, le terme plus souvent employé est robot. Vous pouvez trouver plus d'information sur chaque araignée au niveau du Search Engine Watch. ArchitextSpider C'est le petit nom de l'araignée du Moteur de Recherche d'Excite. Un méta moteur de recherche a qui il est possible de poser des questions en anglais. Ce service est utilisé par Altavista et trouvable à http://www.askjeeves.com.
|
||||||||
|
Background & Font Spoofs Cf Tromperie sur Fontes & Fond C'est le fait d'"appâter" le visiteur et de le "transferer" ensuite vers une autre page. Une page d'un certain style est pris en compte par les outils de recherche mais une autre page apparaît à la même URL pour les navigateurs. Diffèrentes méthodes peuvent être utilisée comme la substitution de pages ou l'IP Delivery. Balise Méta Cf Méta Tag Banner C'est une image de promotion cliquable (lien). C'est l'outils le plus utilisé pour promouvoir, un site internet, un produit ou service. Bourrage de Mot-Clé La répétition des mots-clés et des phrases-clés dans les Méta-tags ou ailleurs. Bridge Page
|
||||||||
|
CGI Common Gateway Interface - interface standard entre le serveur web et d'autres programmes fonctionnant sur la même machine. Cgi Program Channels, Channel Listings Client Un ordinateur, un programme ou un processus qui demande des informations à partir d'un ordinateur, d'un programme ou d'un processus différent. Les navigateurs sont des programmes-clients. Les robots des Moteurs de Recherche sont des clients (ou peut-être on leur dit de se comporter comme tel!). Click through Le fait de cliquer sur un lien dans un Moteur de Recherche et de sortir de la page pour visiter un autre site. C'est un moyen important pour recevoir des visiteurs sur son site à partir des Moteurs de Recherche. Etre bien placé dans un Moteur de Recherche ne sert à rien si personne ne clique sur le lien qui mène à votre site. Le secret est d'avoir un titre bien explicatif et une description précise et intéressante. Cloaking Clustering Cf Regroupement Les balises HTML <!-- et --> sont utilisées pour cacher du texte au navigateur et commenter votre travail afin de mieux vous y retrouver. Certains moteurs ignorent le texte entre ces balises mais d'autres indexent le texte comme si les balises commentaires n'étaient pas là ! Les balises commentaires sont souvent utilisées pour cacher du code javascript qui n'est pas supporté par certains navigateurs. Des fois, ces balises sont utilisées pour fournir des mots clés à certains moteurs de recherche (principalement chez Excite). Contenu dynamique Ce sont des pages web avec des informations qui changent ou sont changées automatiquement en fonction d'une base de données ou d'éléments provenant de l'utilisateur. Il est possible, certaines fois, de se rendre compte que cette technique est utilisée quand l'URL fini avec les extensions suivantes: .asp, .cfm, .cgi ou .shtml. Il est aussi possible d'avoir des pages avec un contenu dynamique et finissant avec les extensions habituelles à savoir .html ou .htm. Les moteurs de recherche référencent ces pages dynamiques de la même manière que les pages avec un contenu statique. Attention, les adresses qui contiennent le caractère ? ne sont généralement pas indexées. Dans le contexte de visiteurs d'une page Web, un coup est une demande simple d'accès à un fichier texte ou à un graphique sur le serveur. Si, par exemple, votre page contient dix boutons (10 images séparées), la simple visite d'une personne utilisant un navigateur web avec l'option graphique mise en place implique onze coups sur le serveur. (Souvent, il arrive que les accès ne vont pas aussi loin que le serveur du site que vous visitez parce que la page se trouve dans la mémoire cache de votre fournisseur d'accès local). Dans le contexte d'un Moteur de Recherche, un coup est la mesure du nombre de sites apparaissant lors de la réponse à une requête d'un visiteur. Pour ne pas surcharger les serveurs, la plupart des robots des Moteurs de Recherche s'autolimitent dans leur accès à chaque serveur. Si votre page est hebergée sur le même serveur que des milliers d'autres pages, le robot peut ne jamais venir sur votre page (et l'indexer). C'est un argument important en faveur du fait de posséder son propre serveur. Crawler ou Chenille, cf Araignée
|
||||||||
| D | ||||||||
|
De-Listing Cf Délistage Dead Link Cf Lien Mort Un méta-moteur de recherche qui est trouvable à http://www.debriefing.com/. La suppression d'un site d'un Moteur de Recherche. La suppression peut s'expliquer par différentes raisons comme le manque de fiabilité de la machine qui héberge le site ou en raison de tentatives perçues de spamdexing. Une des propriétés qui permet d'indiquer l'importance de certains mots dans le texte d'une page Web. Certains Moteurs de Recherche utilisent cette propriété pour le positionnement. Des analyseurs sont disponibles pour effectuer des comparaisons entre les pages. Des pages peuvent être alors créées avec la même densité de mots clés que celles qui obtiennent un bon classement dans les résultats des Moteurs. La formule de calcul de la densité est simple en fait: nombre d'occurrences du mot demandé / nombre de mots total de la page. Imaginons qu'une page Web comporte 10 mots dans son texte visible. Si la page contient une fois le mot microsoft, ce mot clé aura une densité de 10%. Si le mot est présent deux fois, sa densité passe à 20%. Si les dix mots sont égaux et sont donc microsoft, la densité de ce mot passera à 100%. Autre façon de voir les choses : Si la page ne contient qu'un mot, celui-ci reçoit automatiquement une densité (je préfère personnellement parler d'"indice de densité", mais, bon, les définitions, hein...) de 100%. S'il y a deux mots différents, ils ont chacun une densité de 50%, etc. A noter cependant : le calcul ne prend pas en compte les "stop words" ou mots inutiles (at, the, I, of, to, etc.). L'indice de densité des mots clés est l'un des critères majeurs pris en compte lorsqu'on crée une page satellite (ou page alias), c'est-à-dire une page créée spécifiquement par rapport à un moteur de recherche précis. La formule de calcul est quasiment toujours la même. Par contre, les moteurs diffèrent au niveau de l'importance donnée à cet indice. Il existe un logiciel intitulé Keyword Density Analyzer qui vous permet d'analyser l'indice de densité d'une page, ce qui fait gagner pas mal de temps. Description Le texte descriptif, qui est associé à une page web, est celui affiché (habituellement le titre de la page et son URL) quand un visiteur fait une demande à travers un Moteur de Recherche ou un Répertoire. Certains Moteurs de Recherche prennent cette description au niveau des méta tags, d'autres générent leur propre texte à partir de la page. Les Répertoires demandent souvent le texte à l'enregistrement. Direct Hit Un système qui contrôle la selection des utilisateurs des Moteurs de recherche au niveau de la page des résultats. Ce système compte les résultats qui sont choisis le plus par les visiteurs et le nombre de temps passé sur le site afin d'en améliorer la pertinance. Direct Hit est utilisé par HotBot et comme un plug-in dans le dernier système de recherche d'Apple, Sherlock. Voir http://www.directhit.com. Directory Cf Répertoire C'est le fait de cacher, de dissimuler le contenu de ses pages. L'objectif est de généralement (je précise bien, généralement) de dissimuler des pages optimisées aux voleurs de contenu !!! Cf aussi Bait-and-Switch. Un méta-moteur de recherche qui est trouvable à http://www.dogpile.com/. Domaine Un sous-ensemble des adresses Internet. La partie la plus significative de l'adresse se trouve à la fin. Les domaines généralistes sont com, net, org, edu, gov, mil qui correspondent à des domaines spécifiques d'utilisation; com pour commercial, net pour network, etc. Il y a également des domaines correspondant à chaque pays, par exemple ar (Argentine), ca (Canada), fr (France), us (Etats-Unis), etc... La logique des Moteurs de Recherche est telle que les sites qui ont leur propre Nom de Domaine (par exemple http://www.nativetongues.com/) auront souvent un meilleur positionnement que les sites qui sont des sous-répertoires d'une autre organisation, société. (par exemple, http://ourworld.compuserve.com/homepages/tijana/). Domaine Virtuel Un domaine hébergé qui est hebergé sur un Serveur Virtuel. Doorway Page
|
||||||||
| E | ||||||||
|
Ecriture L'écriture du texte pour une page Web. Semblable à l'écriture pour n'importe quel autre type de publication, l'écriture correcte peut avoir un meilleur effet sur le Moteur de Recherche. Ainsi, l'écriture forme une partie importante de l'optimisation. C'est l'action d'informer un Moteur de Recherche ou un Répertoire qu'une nouvelle page ou un nouveau site doit être indexé. Plusieurs
moteurs de recherche donnent plus d'importance et de poids au texte
trouvé entre les commandes d'en-tête au niveau du html (heading
tags en anglais). Il est généralement conseillé d'utiliser ces
commandes d'en-tête dans une page web et d'y mettre des mots clés
dedans. ( Un moteur de recherche qui se concentre sur les informations ayant rapport avec l'Europe. L'adresse est http://www.euroseek.com. Il est regardé comme un des meilleurs moteurs de recherche avec sa base de données de 55 millions de pages. Il peut être lent à indexer de nouveaux sites. Son adresse est http://www.excite.com et pour la version française, c'est http://www.excite.fr. Les sites utilisant des trames doivent avoir l'option NOFRAMES pour se retrouver indexé. Du spamming a été observé dernièrement. Excite ignorait jusqu'ici les méta tags DESCRIPTION mais il semble que le moteur en tienne compte ces derniers temps (bien que ça n'améliore pas énormement la pertinance des résultats puisque c'est principalement basé sur le titre et le texte dans le corps). L'utilisation de pages passerelles et de texte caché est autorisé. Excite a la possibilité d'effectuer des recherches sur de l'audio et du video qui est une partie du RealNetworks' RealPlayer G2.
|
||||||||
| F | ||||||||
|
Fake Copy Listings Parfois une société malveillante volera une page ou le contenu entier d'un site pour les republier à une adresse différente. Elle les inscrira dans un ou plusieurs Moteurs de Recherche. Ça peut causer une perte de trafic pour le site initial si les Moteurs de Recherche placent la copie plus haute dans les listes lors des requêtes. Si vous constatez que quelqu'un a volé votre site de cette façon, contactez d'abord la société concernée et demandez-leur de retirer le contenu volé. Entrez en contact également avec la société qui héberge le site, ainsi que n'importe quelle société concernée par le vol (comme les Moteurs de Recherche). Si les voleurs refusent toujours d'enlever les documents ou décident de vous ignorer, obtenez une assistance juridique. Il est également conseillé d'imprimer les pages pour justifier votre plainte et démontrer que votre site était là le premier et que vous en possédez le copyright! Cf aussi Site Mirroir False Drop Cf Mauvais Coup Les gens font souvent des fautes de frappe ou d'inattention dans leurs requêtes en utilisant les Moteurs de recherche. Les pages qui prennent en compte ces erreurs reçoivent souvent des hits supplémentaires. La technique consiste à inclure ces erreurs au niveau de la balise alt, des mots clés, du nom de la page et du titre. Un effet similaire est l'oubli d'espace entre deux mots. Ce sont des pages qui contiennent de nombreux liens. L'objectif est d'augmenter la popularité dans les outils de recherche des sites qui ont un lien sur ces pages. C'est un fichier présent sur votre serveur et qui conserve les informations concernant les accès sur votre site. L'analyse de votre fichier log peut-être un moyen très efficace pour mieux connaître le visiteur qui vient voir votre site. Il est possible de savoir d'où il vient, les pages qu'il a consulté, les mots-clés qu'il a utilisé dans sa requête, etc. Il existe de nombreux programmes pour analyser un fichier log. Il y a NetTracker proposé par Sane Solutions, WebLog proposé par Awsd, etc, etc. Flash Page Cf Splash Page Font & Background Spoofs Cf Tromperie sur Fontes & Fond Frames Cf Trames
|
||||||||
| G | ||||||||
|
Gateway Page Un portail ouvert en partenariat entre Infoseek et Disney avec une partie moteur de recherche fournie par le moteur Infoseek à l'adresse suivante http://go.com/. Un moteur de recherche utilisant la technologie d'Inktomi et qui retourne, au niveau de la page des résultats, uniquement une URL par domaine. GoTo propose dans sa page de résultat un schéma de "pay per click" où les sites peuvent payer pour améliorer leur classement. Son adresse est http://www.goto.com. Gulliver C'est le petit nom de l'araignée du Moteur de Recherche de Northern Light.
|
||||||||
| H | ||||||||
|
Heading Cf En-Tête Cf Coup C'est un des plus grands moteurs de recherche avec ces 140 millions de pages référencées. Il utilise la base de données, la puissance de Inktomi. Les nouvelles inscriptions sont prise en compte sous deux semaines voire plus. Son adresse est http://www.hotbot.com. HTML HyperText Markup Language - le (principal) language utilisé pour écrire des pages Web. HTTP HyperText Transfer Protocol - le (principal) protocole de communication entre les serveurs web et les navigateurs (clients).
|
||||||||
| I | ||||||||
|
Image Cliquable Cf Image Map C'est une série de liens hypertextes attachés à une image. Ils sont définis dans la page ou à travers un fichier externe. Si l'image cliquable est définie comme un fichier externe, les Moteurs de recherche peuvent avoir des problèmes pour indexer vos autres pages, à moins que vous ayez défini aussi des liens hypertextes plus conventionnels. Si l'image cliquable est définie dans votre page, les Moteurs de recherche n'auront pas de problèmes pour suivre les liens. Il est quand même conseillé de fournir aussi sur votre page des liens au format texte pour aider ceux qui ont des problèmes de vision ainsi que ceux qui accédent au site sans les graphismes ou en utilisant un navigateur texte. Index Cf Répertoire - Fait aussi référence à la base de données qui contient les pages web d'un Moteur de Recherche et/ou d'un Répertoire. Un méta-moteur de recherche trouvable à http://www.infind.com. C'est un des plus grands moteurs de recherche. Les nouveaux sites sont ajoutés généralement très rapidement, à savoir en 1 ou 2 jours ouverts. L'adresse est http://www.infoseek.com/. Infoseek est un des rares moteurs de recherche à considerer le singulier et le pluriel d'un mot comme le même mot. Infoseek est très sensible à la popularité d'une page dans son algorythme de positionnement. Cette base de données est utilisée par certains des plus gros moteurs de recherche, dont HotBot. Inktomi est aussi utilisé par Yahoo quand une requête n'est pas trouvée dans la base de données de Yahoo. Similaire à l'Agent Name Delivery. Cette technique permet d'avoir un contenu différent en fonction de l'adresse IP du client. C'est très difficile de découvrir les pages cachées utilisant cette méthode puisque la page qui s'affiche dépend de l'adresse IP. Il y a peu de chance de voir la page préparée pour l'adresse IP d'un moteur de recherche, par exemple, sauf si celui garde en cache cette page et offre, comme Google, la possibilité au visiteur de consulter la page.
|
||||||||
| J | ||||||||
|
Un langage de programmation dont les programmes peuvent être executés par différentes sortes d'ordinateurs et/ou d'OS. Souvent utilisé pour créer des applets pour les pages web. Un langage simple interprété qui permet d'executer des petites taches au sein de vos pages web en HTML. Les scripts sont normallement interprétés (ou executés) sur l'ordinateur client (du visiteur) par le navigateur. Quelques moteurs de recherche ont, à un certain moment, indexés ces scripts, surement par erreur. Le rapport entre les mots dans une requête dans un Moteur (ou Répertoire) de Recherche. Les Moteurs de Recherche permettent souvent aux utilisateurs de préciser si les mots doivent être l'un à côté de l'autre ou séparés dans les pages Web recherchées.
|
||||||||
| K | ||||||||
|
Keyword Cf Mot Clé Keyword Density Keyword Domain Name Keyword Phrase Cf Phrase Clé
|
||||||||
| Lead | A lead constitutes a situation in which a user registers, signs up for, or downloads something on an advertiser site. A lead might also comprise a user filling out a form on the advertiser's site. | |||||||
|
Un lien hypertexte vers une page particulière venant de quelquepart et apportant du trafic à cette page. Les liens à l'arrivée sont souvent un instrument de mesure pour connaître la popularité d'une page. La recherche des liens à l'arrivée est faisable sur Altavista, Infoseek et Hotbot. Un lien qui ne mène plus à une page ou à un site, probablement parce que le serveur est en panne ou que la page a été déplacée ou alors n'existe plus. La plupart des Moteurs de Recherche ont des techniques pour retirer de telles pages de leurs listes automatiquement. Internet continuant à augmenter en taille quotidiennement, il devient de plus en plus plus difficile pour un Moteur de Recherche de contrôler régulièrement toutes ces pages. Reporter des liens morts aide à maintenir les Moteurs propres et précis. On peut le faire en soumettant le lien mort au Moteur de Recherche. Link popularity farms Cf Ferme de popularite des liens Ce sont des listes de liens de sites Web pré-choisis (et généralement, les plus populaires). Ces listes sont mises à jour par des Moteurs ou des Répertoires de recherche et sont triés à travers des catégories ou des canaux. Les sites sont sélectionnés par le responsable du canal, souvent en raison du bon placement du site dans les Moteurs de Recherche. Certains Moteurs, annuaires autorisent les visiteurs à nommer des sites pour les inclure dans leurs listes. Log File Cf Fichier Log Un répertoire de taille moyenne, son adresse URL est http://www.looksmart.com/. Un des moteurs de recherche le plus importants. Lycos semble se transformer peu à peu en répertoire en utilisant le projet Open Directory pour résultat de sa recherche. Il peut être assez lent à indexer votre page. Le robot de Lycos ignore les commandes méta dans les pages des sites. Son adresse URL est http://www.lycos.com/ et pour la France, http://www.lycos.fr/.
|
||||||||
| M | ||||||||
|
La page de résultats affichée par le Moteur de Recherche ou le Répertoire ne correspond pas à la requête effectuée. Plusieurs raisons peuvent l'expliquer: · La page contient bien les mots-clés, mais ils sont utilisés dans un mauvais contexte, ou alors avec une signification différente ou une corrélation différente que celle que vous avez prévu. · La page est une tentative de spamdexing. · Le Moteur de Recherche a un problème dans sa base de données ou une anomalie dans son programme de requête. Un méta-moteur de recherche qu'il est possible de trouver à l'adresse suivante: http://www.metacrawler.com/. Le résultat d'une requête dans différents moteurs est résumé sur une page facile à lire. Un méta-moteur de recherche qui est trouvable à http://www.metafind.com/. Un serveur qui passe des requêtes à plusieurs moteurs de recherche et/ou répertoires et résume les résultats. Ask Jeeves, Debriefing, Dogpile, Infind, Metacrawler, Metafind et Metasearch sont des exemples de méta-moteurs de recherche. Méta Recherche La recherche des recherches. Une requête est soumise à plus d'un Moteur de Recherche ou Répertoire. Les résultats de tous les moteurs sont affichés après élimination des doubles et un triage. Un méta-moteur de recherche qui est trouvable à http://www.metasearch.com/. Une construction placée dans l'entête HTML de votre page Web, fournissant des informations qui ne sont pas visibles par les navigateurs. Les méta-tags les plus courants (et les plus utiles pour les Moteurs de Recherche) sont KEYWORDS (mots-clés) et DESCRIPTION. Le méta-tag KEYWORD permet à l'auteur de souligner l'importance de certains mots et phrases utilisés dans sa page. Certains Moteurs de Recherche tiendront compte de cette information - d'autres l'ignoreront. N'utilisez pas des guillemets autour des mots ou phrases clés. Le méta-tag DESCRIPTION permet à l'auteur de contrôler le texte affiché quand la page paraît au niveau des résultats d'une recherche. Certains Moteurs de Recherche peuvent ignorer cette information. Le méta-tag HTTP-EQUIV est employée pour émettre des commandes HTTP et est fréquemment employée avec le tag REFRESH pour remettre à jour le contenu de page après un nombre donné de secondes. Les pages passerelle emploient parfois cette technique pour forcer les navigateurs à aller vers une page ou un site différent. La plupart des Moteurs de Recherche en sont conscients et classeront la page à la fin et/ou réduiront le placement du site. Infoseek est contre cette technique et pénalise le site ou même l'interdit. D'autres méta-tags sont GENERATOR (pour ceux utilisant un logiciel d'assisté :-) à la création de pages) et AUTHOR (utilisé pour créditer l'auteur de la page qui contient souvent son adresse E-mail, l'URL de son site et toute autre information utile). Mining Company Un grand répertoire présent sur plusieurs adresses URL. L'adresse principale est http://www.miningco.com. Mirror Site Cf Site Miroir Misspellings Un mot qui forme (une partie de) la requête dans un Moteur de Recherche. L'utilisation de mots clés comme partie de l'adresse URL d'un site. C'est un moyen d'améliorer le positionnement dans la page des résultats pour certains moteurs de recherche quand des mots clés sont utilisés dans l'adresse URL. Un serveur ou un groupe de serveurs qui se consacre au référencement des pages Internet. Lors de requêtes particulières, ces Moteurs renvoient des listes de liens correspondants à la demande. L'enregistrement dans ces moteurs se fait par les robots, la plupart du temps. Les principaux Moteurs de Recherche sont Altavista, Excite, Hotbot, Lycos, Infoseek, Northern Light et Webcrawler. Notez que Yahoo n'est pas un Moteur de Recherche mais un Répertoire. Le terme Moteur de Recherche est bien souvent employé pour décrire les deux, Répertoire et Moteurs de recherche. Multicrawl est un moteur de recherche qui offre à ceux qui le désirent leur propre version personalisée du moteur. http://www.multicrawl.com/
|
||||||||
| N | ||||||||
|
Le moteur de recherche par défaut pour les usagers du FAI (Fournisseur d'Accès à Internet) AOL. C'est un site qui est très "occupé". Son adresse URL est http://www.netfind.com. Netfind utilise le même moteur de recherche qu'Excite. Cf l'Open Directory Project. Un moteur de recherche avec la possibilité d'accéder de manière payante à une collection spéciale d'articles sur les affaires, la santé et la consommation. Le premier moteur de recherche a bannir les méta moteur de recherche de sa base de données.L'adresse URL est http://www.northernlight.com.
|
||||||||
| O | ||||||||
|
Un projet de répertoire mis en place par des milliers d'éditeurs volontaires. En principe, c'est un moyen très intéressant et très puissant pour organiser le web. En pratique, il y a le problème du comportement de certains éditeurs qui ont causés quelques difficultés initiales aux organisateurs. Connu à la base comme NewHoo, ce projet est maintenant intégré à Netscape (et par conséquent, AOL). Voir http://directory.mozilla.org. Open Text C'est un grand répertoire pour les entreprises uniquement. L'adresse est la suivante : http://www.opentext.com. Optimisation Les changements faits à une page pour améliorer le positionnement de cette page dans un ou plusieurs Moteurs de Recherche. C'est aussi les moyens d'aider les clients ou les visiteurs potentiels à trouver un site Web. L'optimisation peut impliquer des changements de design, de contenu, un nouveau texte pour le titre, pour les méta-tags, pour les alt des images, les entêtes, etc... Une grande image cliquable (image-map) au début de la page doit être déplacée plus bas dans la page. Les trames doivent être évitées (à moins que des liens alternatifs pour la navigation sans trames soient également fournis).
|
||||||||
|
Équivalent à une Page Passerelle mais affiche un texte avant de transporter le visiteur vers la page principale. C'est extrêmement ennuyant. Page d'Entrée
Une page
spécifiquement pré-préparée, soumise à un Moteur de Recherche en
particulier pour donner à ce Moteur les données qu'il désire, dans le
format qu'il a besoin, afin de placer le site à un bon niveau pour un
ou plusieurs sujets désirés (cette importance de classement que l'on
appelle le "placement" ou "positionnement"). Il y a plusieurs raisons qui peuvent expliquer la mise en place de ce genre de page. Par exemple, l'auteur ne désire pas révéler publiquement sa logique de placement. Ou bien le format pour que la page soit acceptée par certains Moteurs ne correspond pas au format désiré pour les visiteurs, d'un point de vue esthétique. Ou alors un bon format pour un Moteur n'est pas forcément le bon format pour un autre Moteur, en utilisant des pages passerelles, vous pouvez présenter vos pages de la meilleure manière connue ou supposée connue pour un Moteur en particulier. Un exemple de page passerelle: http://www.isquare.com/gateway.htm Cf Site Miroir En anglais,
c'est page view Voir aussi Hit et Visiteur Unique. Une phrase qui forme (en partie) la requête dans un Moteur de Recherche. Placement Plusieurs Noms de Domaines Avoir plusieurs noms de domaines supplémentaires permet de posseder plusieurs portes d'entrée pour le même site. Plusieurs Tags Mot-Clé L'utilisation de plusieurs Méta-tags KEYWORDS afin d'essayer d'augmenter la pertinence des mots-clés dans une page. Ce n'est pas recommandé. C'est détecté comme une technique de Spamming, où tous les tags sont alors simplement ignorés. Plusieurs Titres Il était possible de répéter le tag TITLE plusieurs fois dans l'en-tête d'une page HTML pour améliorer le positionnement dans les Moteurs de Recherche. Aujourdhui, la plupart des Moteurs de Recherche détectent cette méthode. Politeness Window Cf Courtoisie Popularité d'une Page, des Liens Mesure le nombre et la qualité des liens pointant vers une page particulière (des liens à l'arrivée). Plusieurs moteurs de recherche (et le plus connu étant Infoseek) utilisent de plus en plus ce procédé dans le processus de positionnement. Le nombre et la qualité des liens à l'arrivée se révèle être de plus en plus important comme l'optimisation du contenu de la page. Un service gratuit qui mesure la popularité de votre page peut être trouvé à http://www.linkpopularity.com. Cf la page passerelle mais peut aussi désigner le site portail. C'est le processus de classement des sites, des pages web dans un Moteur de Recherche ou un Répertoire de façon à ce que les sites les plus appropriés apparaissent en premier sur la page résultat lors d'une requête spécifique. Des logiciels tel que AgentWebRanking Freeware (Logiciel gratuit permettant de suivre la position de son site ou d'un site concurrent dans les principaux moteurs de recherche et annuaires en fonction de mots clés. Ce graticiel permet aussi d'améliorer sa position dans les moteurs, d'inscrire votre site, de vérifier les liens et vos pages web.) PositionAgent, Rank This et Webposition peuvent être utile. Ils vous aident à définir votre position dans la page résultat d'un Moteur de Recherche en utilisant pour la recherche une phrase ou un groupe de mots particulier. Le site GoHip Search vous permet d'avoir des informations sur votre positionnement dans les principaux moteurs de recherche et l'ensemble affiché sur une même page. À proprement parlé, ce sont tous les programmes qui manipulent des données d'entrée et de sortie selon la norme CGI. Dans la pratique, les programmes CGI sont employés pour manipuler des formulaires et des requêtes de base de données et produire ainsi un contenu non-statique de pages web.
|
||||||||
| Q | ||||||||
|
Query Cf Requête
|
||||||||
| R | ||||||||
|
Rang ou Ranking, Cf Positionnement Un système d'adresse alternatif de sites webs qui est en fonction sur Altavista. Les marques déposées utilées dans les requêtes sont directement redirigées vers le site web approprié, généralement parce que la société qui possédent la marque à payer un loyer à RealNames. http://www.realnames.com. c'est le processus de se promener sur le web, d'emmagasiner des URLs, d'indexer des mots clés, des liens et du texte. Même les plus gros Moteurs de recherche ne peuvent pas recenser toutes les pages du réseau. Les raisons en sont la quantité énorme d'informations disponible, la vitesse d'apparition de nouvelles données, la pratique d'une certaine courtoisie et une certaine limite dans le nombre page visitable en une fois. Les Moteurs de recherche ont trouvé des compromis dans leur méthode d'indexation. Par exemple, certains Moteurs indexent uniquement la page de garde des sites, d'autres visitent uniquement les sites pour lequel ils ont eu une demande, d'autres jugent de l'importance du site en fonction du nombre de liens externes avant d'indexer plus profondement. "Stemming" dont la traduction exacte en français m'est inconnue mais qui correspond, en gros, à une recherche élargie. C'est une fonction que possédent certains moteurs de recherche et répertoires permettant d'obtenir des résultat sur les mots qui ont la même base que le mot-clé saisi. Par exemple, lorsque vous selectionnez cette recherche élargie et que vous voulez avoir des informations sur la danse, vous pouvez saisir dans* comme mot-clé et vous aurez dans les résultats danse, danseur, danseuse et dansant. Referer Le referer, c'est l'URL d'où vient votre visiteur. Le fichier de referer-log de votre serveur vous indique cette information. Si un visiteur vient directement d'un résultat de Moteur de Recherche, la requête utilisée pour trouver la page sera encodée dans le referer-log, rendant plus facile la connaissance des mots-clés qui amènent des visiteurs. L'information referer peut également être consultée à partir du document.referer dans JavaScript ou par l'intermédiaire de la variable d'environnement HTTP_REFERER. Refresh La balise de rafraichissement. Voir le paragraphe sur les méta tags. Registration Le regroupement consiste en l'affichage d'une seule page et donc adresse pour chaque site web sur la page des résultats après une requête auprès des moteurs de recherche ou des répertoires. Cette méthode permet d'éviter qu'un petit nombre de sites occupe toutes les premières positions de résultats et par la même occasion, cela rend la liste affichée par les moteurs plus claire et surtout beaucoup plus pratique pour l'utilisateur. Relevancy Algorithm Un serveur ou un groupe de serveurs dédiés à l'indexation des pages du web. Ces répertoires retournent une liste de pages de liens selon les requêtes particulières faites par le visiteur. Les répertoires (aussi connu comme des annuaires) sont généralement mis à jour manuellement, le plus souvent suite à la demande de l'utilisateur (comme à Whatsnew.com) et la plupart mettent en place un procédé éditorial de sélection et/ou de catégorisation (comme Yahoo et Looksmart). ou bien query en anglais. Un mot, une expression ou un groupe de mots employés pour passer des instructions à un Moteur de Recherche ou à un Répertoire afin de localiser des pages sur le sujet recherché. Pour des détails sur quelles requêtes sont utilisées, visitez le site en anglais GoTo.com Search Inventory. Un résumé de ce que recherche, avant tout, les gens peut être trouvé à cette adresse http://www.synergy-marketing.com/search.html. Un programme gratuit s'appellant Word Market vous récupère les mots utilisés dans les moteurs de recherche et est disponible à http://www.softwaresolutions.net/free.htm. Le Réseau Canadien de Courrier Electronique (CEBN) propose un moteur de recherche cherchant sur les commandees méta mots-clés à http://www.cebn.com/metatags.htm et qui permet la recherche à travers des centaines de données existantes (attention, très, immensement long à la détente!). Ressoumission C'est le fait de répéter une ou plusieurs fois l'enregistrement dans les Moteurs de Recherche d'une même page ou d'un même site. Dans certaines circonstances, c'est considéré avec suspicion par les Moteurs de Recherche, car ça peut indiquer qu'une personne expérimente les techniques de Spamming. Les Moteurs de Recherche d'Infoseek et d'Altavista sont particulièrement vulnérables au Spamming parce qu'ils enregistrent les sites très rapidement. Les deux Moteurs delistent les sites qui sont ressoumis trop souvent et Infoseek, par exemple, ne permet pas plus d'une soumission de la même page en 24 heures. La ressoumission occasionnelle lorsque les pages ont changées n'est pas un problème. Tous les programmes de navigation qui suivent les liens hypertexte des pages de Web mais qui ne sont pas directement sous contrôle humain. Les exemples sont les araignées des Moteurs de Recherche, les programmes ("harvester") qui extraient les adresses E-mail à partir des pages Web ou groupes de News ainsi que différents programmes de recherche intelligents. Une base de donnée des robots est maintenue par Webcrawler. robots.txt C'est un fichier texte déposé dans le répertoire principal de votre site pour interdire l'accès aux robots de certains pages ou sous-répertoires du site. Seuls les robots qui sont conformes à la norme d'exclusion de robots (Robots Exclusion Standard) liront et obéiront aux commandes dans le fichier. Les robots liront ce fichier à chaque visite, de sorte que des pages ou les zones des sites puissent être rendues publiques ou privées à tout moment en changeant la teneur du fichier robots.txt. L'exemple simple ci-dessous permet d'empêcher tous les robots de visiter le répertoire /secret.
Pour plus d'information, visitez la page d'Altavista sur le robots.txt.
|
||||||||
| S | ||||||||
|
Scooter C'est le petit nom de l'araignée du Moteur de Recherche d'Altavista. Search Engine Searchking Un petit moteur de recherche qui autorise les visiteurs à voter sur la pertinance des pages renvoyées par leurs requêtes afin de mieux classer les sites en fonction de l'opinion des visiteurs. http://www.searchking.com. Un ordinateur, un programme ou un processus qui répond aux demandes d'informations d'un client. Sur l'Internet, toutes les pages web sont stockées sur des serveurs y compris les Moteurs et Répertoires de recherche qui sont accessibles de l'Internet. Un compte ouvert sur le serveur d'une société d'hébergement généralement lié vers son propre domaine. Ca permet de posseder son propre site web avec son propre nom de domaine à un coût moindre. Cette manière permet de posseder son propre site comme une grande société sans avoir à investir dans une machine complète et son entretien. Sidewinder C'est le petit nom de l'araignée du Moteur de Recherche d'Infoseek. Siphonnage L'utilisation de divers moyens pour voler le trafic d'un autre site. Les techniques utilisées incluent la copie totale d'une page d'un site (la page copiée est modifiée légèrement pour rediriger les visiteurs vers un site différent) et l'utilisation de mots-clés ou de phrases-clé appartenant à d'autres sites Internet. Site Hit Cf Hit C'est la copie multiple de sites ou de pages Web sur différents serveurs, le plus souvent. Le processus d'enregistrement de ces miroirs dans les Moteurs de Recherche est souvent traité comme du spamdexing, parce que ça augmente artificiellement la pertinence des pages. Les filtres tels que le Sniffer d'Infoseek retirent maintenant les miroirs multiples. C'est un terme générique pour désigner un site qui sert de point d'entrée sur Internet pour un nombre significatif d'utilisateurs. Les exemples de sites portail sont les Moteurs de recherche, les annuaires, la page par défaut d'un navigateur, la page de base du site d'un fournisseur d'accès, les sites offrant de l'hébergement gratuitement ou des emails ou même des news et tous les sites populaires (et pleins de publicités) pour devenir des pages par défaut. Skewing Le Moteur de Recherche change artificiellement les résultats de sorte que les requêtes des visiteurs renvoient sur des listes artificiellement créées. Infoseek expérimente actuellement cette technique. Infoseek utilise un groupe de critiques pour forcer artificiellement une plus grande visite pour certains sites. Slurp C'est le petit nom de l'araignée utilisée par Inktomi. Snap! C'est un grand répertoire. L'URL est http://www.snap.com. Sniffer C'est le nom du programme de filtre employé par le Moteur de Recherche Infoseek pour empêcher le spamdexing. Il détecte les nombreuses pages miroir, les tricheries entre les fontes et le fond (background), les tags TITLE trop nombreux, l'abus des mot-clés et probablement de nombreux autres types de spamdexing. Soumission d'URL La création ou modification d'un document avec l'intention de tromper un catalogue ou un système de classement électronique. Toute technique qui a pour objectif d'augmenter la position potentielle d'un site aux dépens de la qualité de la base de données du Moteur de Recherche peut également être considérée comme du spamdexing (également connu sous le nom de spamming ou spoofing). Le spamming (autrement appelé spam, spamdexing, keyword stuffing et autres) consiste à employer des techniques de fraude dans le code HTML d'une page Web afin qu'elle soit classée dans les 10 meilleurs résultats des Moteurs de recherche en texte integral pour certains mots clés donnés. En règle générale, les Moteurs savent sans problème détecter du spamming comme la répétition de mots clés des centaines de fois, en caractères petits, en blanc sur fond blanc ou en clair sur fond blanc, la répétition dans les balises IMG (attribut ALT), dans les faux liens ou les fausses images, les balises <TITLE> repétées, etc... bref toute la panoplie de la fraude basée sur la répétition des mots clés consistant donc à faire augmenter l'indice de densité d'un mot donné. D'autres techniques de spam sont également utilisées, notamment l'emploi de la balise Méta Refresh (TRÈS mal vue par les moteurs) ou la technique consistant à repérer les adresses ou les numéros IP des robots des Moteurs pour leur fournir une page différente de celle fournie logiquement aux internautes (technique dite de la substitution de pages). Je passe sur les détails. Selon les Moteurs, les mesures suivantes peuvent être prises : · Baisse automatique de la note de la page sur un mot clé donné (la page est releguée en fond de classement) · Si des pages identiques et spammées sont trouvées (technique des pages satellites), la plupart sont enlevées de l'index et une seule occurrence est gardée mais sera mal classée si elle contient du spam · La page est virée de l'index · Le site complet est viré de l'index. Cela pose des problèmes, surtout pour les sites d'hébergement gratuit (imaginez que mygale.org, chez.com ou geocities.com soient virés d'AltaVista ou de HotBot !) Spamming Cf spamdexing. Le Spamming est plus généralement employé pour se rapporter à l'envoi de courrier électronique en bloc non sollicité. L'utilisation de ce mot au niveau des Moteurs de Recherche est dérivée de ce terme. Spider, Spyder Cf Araignée Spidering Cf Recensement Similaire à une page de Garde mais impose l'affichage d'une séquence aux visiteurs avant qu'ils puissent rejoindre la page principale. C'est une sorte d'introduction mais qui se révèle plus ennuyante qu'autre chose. Spoofing Cf Spamdexing SSI Server Side Includes - Utilisé pour ajouter, par exemple, un contenu dynamique à une page web. Stealth Script Un script CGI qui permet de changer le contenu de la page en fonction de qui ou de quoi accede au site. Voir Agent Name Delivery. Stop Word Un mot qui est ignoré lors d'une requête auprès d'un moteur de recherche. Le mot est trop souvent utilisé que son utilisation n'améliore en rien la pertinance des résultats. Comme exemples, en anglais, les mots liés au net comme computer, web et des mots plus généralistes comme get, I, me, the, you, etc Submission Service Différents agents qui soumettent votre site a plusieurs moteurs de recherche et annuaires. Pratique pour s'enregistrer dans plusieurs moteurs de recherches d'importance moindre, mais il ne faut pas faire confiance à ce genre de programmes pour être repertorié dans les principaux moteurs. Plusieurs de ces services sont automatiques et fonctionnels à partir de sites web et d'autres fonctionnent hors-ligne. Certains de ces services sont gratuits ! Attention à ne faites pas trop confiance aux supposés FFA (Free For All - Gratuit Pour Tous) en donnnt votre adresse électronique, vous risquez de vous retrouver victime de spams ! C'est un processus permettant d'envoyer les robots des Moteurs de Recherche vers une page spécifique, pour diriger ensuite vos visiteurs vers ce que vous voulez qu'ils voient. C'est fait en utilisant les server side includes (ou d'autres méthodes de contenu dynamique). Le SSI, par exemple, permet de délivrer un contenu différent au client selon la valeur de son HTTP_USER_AGENT. La plupart des navigateurs normaux ont une chaîne de caractères agent qui commence par "Mozilla" (créé à partir des termes Mosaic et Godzilla). La plupart des robots des Moteurs de Recherche ont un nom d'agent spécifique comme "Gulliver", "Infoseek sidewinder", "Lycos spider" et "Scooter". En changeant la valeur de votre HTTP_USER_AGENT (par un processus appelé agent detection), différentes pages peuvent être affichées à la même URL, de sorte que vos visiteurs ne voient jamais la page soumise aux Moteurs de Recherche (et vice versa). C'est théoriquement quelquechose d'assez simple. Certains Moteurs de Recherche prétendent être de "vrais navigateurs mozilla" afin, justement, d'éviter ces substitutions. L'utilisation des substitutions de pages peut se réveler difficile et même ne pas fonctionner. Comment découvrir une substitution au travail ? C'est assez difficile puisque les possesseurs de substitutions arrivent à contrôler ce que vous voyez ! Vous pouvez être capable de deviner qu'une page utilise cette technique si elle est, par exemple, indexée incorrectement ou le titre ou la description ne correspondent pas à ce que vous voyez; mais la raison peut être beaucoup plus simple, la page a changé depuis que le Moteur l'a indexé. La meilleure solution consiste à écrire un petit programme (avec PERL, par exemple) et de récuperer plusieurs fois la page index en mettant un HTTP_USER_AGENT différent à chaque fois. Si une substitution de pages est utilisé, une ou plusieurs pages devraient se révéler différentes des autres ! Voir aussi le texte caché et le IP delivery.
|
||||||||
|
Technique de Positionnement C'est le fait de modifier sa page web de sorte que les Moteurs de Recherche (ou un Moteur de Recherche en particulier) traitent la page comme la plus appropriée à une requête spécifique (ou à un ensemble de requêtes). Terme Recherché Cf Requête C'est du texte sur une page qui est visible pour les robots des Moteurs de Recherche mais invisible aux visiteurs. C'est généralement parce que le texte a la même couleur que le fond, ou bien parce que des tags multiples de <TITRE> ont été utilisés ou alors parce que le texte est un commentaire en HTML. Le texte caché est souvent utilisé pour le spamdexing. Beaucoup de Moteurs de Recherche peuvent maintenant détecter l'utilisation du texte caché et souvent retirent les pages de leur base de données ou abaissent la position des pages. Le texte peut être caché en utilisant la substitution de pages (agent name delivery en anglais) ou l'IP delivery, ce qui permet de presenterun texte différent aux différents robots des moteurs de recherches ou de cacher les vrais sources HTML aux concurrents. Le "Stealth META Tag CGI Script" utilise probablement cette technique et est disponible à http://www.OutRank.com/stealth.shtml. Un autre logiciel permettant de cacher le source HTML s'appelle Psyral Phobia et est disponible à http://www.merlesworld.com/software.htm. Titre C'est le texte compris entre les deux balises HTML <title> et </title>. Ce texte est associé (et non pas affiché) avec la page web qui contient ces balises et affiché dans une place spéciale de votre navigateur (souvent le haut de la fenêtre). Le texte du titre est important car c'est bien souvent le lien avec votre site qui s'affiche au niveau des listes de résultats des Moteurs de recherche. De même, lors de l'indexation de votre site, les Moteurs font particulièrement attention au titre. Attention, il ne faut pas confondre ce titre avec le texte de votre page qui peut ressembler à un titre mais qui n'est juste que l'utilisation d'une balise HTML "H" ou d'une police plus grande. Cf Web Désigne les visiteurs sur une page ou un site. Fait référence au nombre de visiteurs, de hits, d'accès, etc sur une période donnée. C'est une technique de programmation en HTML pour combiner deux documents ou plus séparés dans une fenêtre de navigateur web. Les documents agissants l'un sur l'autre à travers différentes sous-fenêtres, le site peut être créé dans l'objectif d'être plus interactif, plus pertinent. Un site tramé pose souvent de grands problèmes pour les Moteurs de Recherche et ne peut pas être classé correctement. Les Moteurs de Recherche classeront souvent seulement la partie du site encadrée dans la section <NOFRAMES>. Ainsi assurez-vous que la section <NOFRAMES> contient bien le texte approprié pour être repertorié par les robots. Si votre site utilise des trames, pensez à fournir une page passerelle ou ajoutez des liens dans les pages tramées. Soumettez la page principale - celle contenant le <FRAMESET> - aux Moteurs de Recherche et si vous utilisez une page passerelle, soumettez celle-ci séparément. Il existait diverses techniques pour placer du texte invisible dans une page Web afin d'améliorer le positionnement sans en affecter l'aspect. La plupart du temps, elles sont basées sur une couleur similaire pour les fontes et celle du fond (par exemple blanc). Aujourdhui, la plupart des Moteurs de Recherche détecte ces tours.
|
||||||||
| U | ||||||||
|
URL Universal Resource Locator - Une adresse qui peut indiquer n'importe quelle ressource spécifique à Internet. Le début de l'adresse indique le type de ressource - par exemple http: pour des pages Web, ftp: pour des transferts de fichier, mailto: pour des adresses E-mail, etc
|
||||||||
| V | ||||||||
|
Un "vrai" visiteur sur votre site. Les serveurs web enregistrent les adresses IP de chaque visiteur. Ces enregistrements peuvent être utilisés pour mesurer le taux de vrais visiteurs sur votre site web. Si par exemple une personne visite 20 pages de votre site, le serveur ne comptabilisera qu'un unique visiteur (car toutes les pages accédées sont associées à la même adresse IP) mais vingt accès de page.
|
||||||||
| W | ||||||||
|
ou Toile. Le web designe plus largement l'ensemble du réseau de sites où vous pouvez naviguer avec votre navigateur. Un moteurs de recherche important dont l'adresse URL est http://www.webcrawler.com/.
|
||||||||
| X | ||||||||
|
Extensible Markup Language. Un nouveau language qui permet une transmission plus efficace de données à travers le web. XML ne fonctionne pas tout le seul et à besoin d'être implémenté en utilisant un parser ou XSL. Extensible Scripting Language - un language XML de feuilles de style supporté par les derniers navigateurs Internet Explorer 5 et Communicator 5.
|
||||||||
| Y | ||||||||
|
Yahoo est equivalent à un moteur de recherche mais avec une base de données gérée à la main. C'est l'outil de recherche le plus utilisé mondialement. L'adresse URL est http://www.yahoo.com et pour la France, c'est http://www.yahoo.fr. Il est très difficile de se faire enregistrer sur yahoo.com et quand c'est fait, il est encore plus difficile de faire modifier des données voire même de les suprimer ! Pour améliorer vos chances d'être indexé, suivez ces conseils : · Selectionnez correctement les trois catégories où vous désirez être affiché. Tenez compte aussi des catégories régionales. Verifiez bien que les catégories correspondent au contenu de votre site. · Soumettez votre site à l'une de leurs filiales dans votre pays ou ville. · Soyez sûr que votre site est bien fait et facilement naviguable. · Soyez sûr que votre site n'a pas de liens morts. · Soyez sûr que vos pages se chargent rapidement. · Fournissez de bonnes informations pour rentrer en contact avec vous sur votre site. Si vous arrivez à faire rajouter votre site dans Yahoo, gardez l'email que Yahoo vous envoit. Vous pouvez ecrire à cette même personne si vous avez des modifications à apporter à votre référencement, par la suite. |
||||||||
| Z | ||||||||
|
PascalBizOpp.com Copyright © 2002-2007. All Rights Reserved. |
||||||||