Un moteur de recherche est un programme informatique avec lequel des informations peuvent être recherchées dans une certaine collection; il peut s’agir d’une bibliothèque, d’Internet ou d’une collection personnelle.
Sans autre spécification, cela fait généralement référence à un service Web avec lequel des mots clés complets peuvent être recherchés sur le Web mondial à l’aide de mots clés gratuits.
Contrairement aux pages d’accueil ou aux guides Web, peu ou pas d’intervention humaine n’est requise; la visite des pages Web et le tri des classements se font à l’aide d’un algorithme.
Techniques
Les moteurs de recherche indexent automatiquement les pages Web à l’aide de robots / araignées. Ce sont des programmes qui grattent des pages Web, puis extraient des informations utiles de ces pages, telles que des mots et des références (« liens ») à d’autres pages Web. Ces liens sont à leur tour également donnés à l’araignée pour téléchargement. Les mots trouvés sont stockés dans une gigantesque base de données.
Les moteurs de recherche fonctionnent avec différentes techniques. À l’origine, les moteurs de recherche utilisaient les termes de recherche (mots-clés) saisis par les webmasters, mais cela était beaucoup utilisé parce que les webmasters utilisaient des mots-clés qui attiraient beaucoup de public, mais n’étaient pas liés au contenu de la page, comme le mot ‘sexe’.
Par conséquent, diverses autres techniques alternatives ont été développées. Par exemple, Google fonctionne avec la popularité des sites Web: le nombre de fois qu’un site Web est répertorié sur d’autres sites Web. Sur les sites Web des moteurs de recherche, vous pouvez généralement trouver des informations sur leur fonctionnement.
Le nombre de moteurs de recherche basés sur des araignées est limité. Les principaux moteurs de recherche internationaux incluent Google, DuckDuckGo, Teoma, Bing et Yahoo !.
Il existe également des méta moteurs de recherche, des moteurs de recherche qui fonctionnent à travers les résultats d’autres moteurs de recherche. Les exemples sont Metacrawler, Ixquick et Ez2Find.
Wolfram Alpha est un moteur de recherche sur Internet qui ne recherche pas les pages (comme le fait Google), mais pour les réponses aux questions, il le fait en recherchant une base de données d’informations.
Domaines
La plupart des moteurs de recherche sont conçus pour trouver quelque chose sur le Web via le protocole HTTP. Il s’agit d’informations qui peuvent également être consultées avec un navigateur Web. De plus, certains moteurs de recherche peuvent également trouver des informations dans les groupes de discussion. Par exemple, Google copie de nombreux groupes de discussion sur ses propres serveurs, afin qu’ils puissent être recherchés. Enfin, certains moteurs de recherche peuvent rechercher des fichiers via le protocole de transfert de fichiers.
Marketing des moteurs de recherche
Le marketing par moteur de recherche (marketing par moteur de recherche) est l’ensemble des activités destinées à classer une page Web dans les résultats de recherche d’un moteur de recherche, pour des mots clés ou des termes de recherche pertinents pour la page Web. Le marketing des moteurs de recherche se compose de deux parties:
- Optimisation des moteurs de recherche
- Publicité sur les moteurs de recherche
Annoncez avec les moteurs de recherche
Une autre façon de «marquer des points» sur les moteurs de recherche est de faire de la publicité. Initialement, une place élevée dans le classement pourrait être «achetée» comme publicité. Aujourd’hui, avec presque tous les moteurs de recherche, une telle pratique n’est plus possible, car les utilisateurs ne l’acceptent plus. Au lieu de cela, les soi-disant «liens sponsorisés» sont affichés dans un endroit séparé (souvent à droite, parfois aussi en haut). Cela est perçu comme moins dérangeant par les utilisateurs, car les «résultats réels» et les publicités sont plus clairement identifiables.
L’espace publicitaire des liens sponsorisés est généralement «vendu» aux enchères via le système de paiement par clic. Par exemple, avec AdWords, la position parmi les liens sponsorisés est déterminée en multipliant l’enchère de l’annonceur par le taux de clics.
Inconvénients des moteurs de recherche
En plus des nombreux avantages des moteurs de recherche tels que Google, l’utilisation de gros moteurs de recherche présente également des inconvénients. L’augmentation des données rend de plus en plus difficile la recherche dans une zone spécifique ou dans une langue autre que l’anglais. Souvent, vous pouvez obtenir des informations spécifiques dans votre langue sur les petits moteurs de recherche régionaux, comme décrit ci-dessus, mais les qualités de recherche et d’analyse ne sont pas disponibles avec ces types de moteurs de recherche. C’est un défi pour de nombreux moteurs de recherche majeurs d’inclure ces petits sites régionaux dans leurs résultats de recherche.
Étant donné que les moteurs de recherche peuvent cartographier l’ensemble d’Internet, ils posent également un problème de confidentialité. Une fois que les données sensibles à la confidentialité sont publiées sur Internet, même si elles sont supprimées du site Web où elles se trouvaient, elles peuvent souvent être trouvées dans les archives du moteur de recherche.
Chez Google, cela se reflète dans la possibilité d’afficher le cache. En outre, Google ne traiterait pas correctement la confidentialité des utilisateurs des moteurs de recherche. Par exemple, Google stockerait les données sous une forme anonyme pour afficher des publicités plus appropriées en fonction de l’historique de recherche de l’utilisateur.
Le moteur de recherche open source DuckDuckGo offre une alternative non filtrée et sans danger pour la vie privée.
Fonction de recherche
Un site Web et un programme tel qu’un navigateur ou un lecteur ont souvent une fonction de recherche. Parfois, ces options ont « marquer tout » et « sensible à la casse ». Lors de la recherche dans un document, il existe parfois l’option « Tout marquer » et souvent la direction de la recherche peut être déterminée: en avant ou en arrière. Parfois à la fin de la recherche, la recherche continue automatiquement depuis le début (et vice versa avec la recherche inversée), parfois la recherche s’arrête à la fin / au début. Parfois, le programme se souvient du début de la recherche, puis s’arrête après un cycle.
Histoire
HotBot a été lancé en mai 1996 par HotWired, un outil fournissant des résultats de recherche servis par la base de données Inktomi. Le moteur de recherche a été développé conjointement par Inktomi, une start-up âgée de quatre mois et composée d’étudiants de l’Université de Californie à Berkeley. HotBot a été lancé en utilisant une stratégie de marketing « nouveaux liens », prétendant indexer l’intégralité du Web chaque semaine, plus souvent que des concurrents comme AltaVista, et son site Web a déclaré qu’il était « l’index Web le plus complet en ligne » avec 54 millions de documents. Son interface colorée et ses fonctionnalités impressionnantes (par exemple, pouvoir rechercher avec n’importe quel mot saisi ou une phrase entière) ont été acclamées et populaires.
Les résultats du répertoire ont été fournis à l’origine par LookSmart puis DMOZ à partir de la mi-1999. HotBot a également utilisé les données de recherche de Direct Hit Technologies pour une période commençant en février 1999, qui était un outil qui utilisait des données de clic pour manipuler les résultats. La technologie SmartCrawl d’Inktomi, permettant l’exploration hebdomadaire de 10 millions de pages Web, a été intégrée à HotBot en mars 1997. HotBot était le 19e site Web le plus visité en fonction du trafic Web en 1998.
Lycos a acquis HotBot dans le cadre de son acquisition de Wired en octobre 1998 et il était géré séparément, aux côtés du moteur de recherche déjà existant de Lycos. Par la suite, HotBot a souffert d’un développement limité et d’une part de marché en baisse. Un navigateur HotBot NeoPlanet a également été publié qui intégrait HotBot et d’autres liens Wired et Lycos. Fin 2002, HotBot a été relancé en tant qu’outil de recherche à options multiples, offrant aux utilisateurs la possibilité de rechercher dans les bases de données FAST, Google, Inktomi ou Teoma.
En mars 2004, Lycos a lancé une version bêta d’un produit de recherche de barre d’outils gratuit, Lycos HotBot DeskTop, qui, selon la société, était « le premier produit à intégrer la recherche de bureau traditionnelle à la recherche Web dans le navigateur ». Le HotBot DeskTop peut effectuer des recherches sur Internet à l’aide d’Inktomi, des dossiers de messagerie pour Microsoft Outlook ou Outlook Express et des documents utilisateur stockés sur un disque dur. Il a également intégré un bloqueur de publicités pop-up et une syndication RSS News Reader. Les index créés pour suivre les e-mails et les fichiers utilisateur sont restés stockés localement pour protéger la confidentialité des utilisateurs. Des annonces textuelles ont été affichées lors de l’affichage des résultats de plusieurs types de recherches sur Internet. Lycos a autorisé la technologie dtSearch pour alimenter les options de recherche locale.
En juillet 2011, HotBot a été relancé avec une nouvelle mascotte robotique, un nouveau logo et une conception de site moderne. Dans la version bêta, HotBot est devenu un portail, renvoyant non seulement les résultats de recherche sur le Web, mais également les recherches à partir de divers sites Web Lycos, tels que News, Shopping et Weather Zombie. L’interface du portail a duré environ six mois, et ces fonctionnalités ont plutôt été réintégrées dans la refonte du site Web de 2012 Lycos, ramenant HotBot à une interface de recherche simplifiée.