«Moteurzine». -- Bonjour.
Avant tout, je me permet de rappeler un précédent entretien fait avec
J. Thieck en septembre 1999.
Les choses ont bien changé depuis et ceci, aussi bien chez Voila que dans le monde des outils
de recherche. Il me semble donc intéressant, à travers un nouvel interview, de faire un bilan de
la situation auprès du premier moteur de recherche français : Voila.
Pierre Aubert. -- Bonjour,
«Moteurzine». -- Est-ce que vous pouvez, tout d'abord, vous présenter aux
lecteurs ?
Pierre Aubert. -- Je suis « lead developper » chez Wanadoo Opérations
(pour info : Echo interactive a été racheté par Wanadoo et n'existe plus en tant que tel). Un
lead developper s'occupe d'une équipe de développement et dans notre cas, du développement du
service de recherche de Voila / Wanadoo.
Je partage le leadership avec Christophe Chaland, un des developpeurs historique du moteur
Voila. Dans une vie antérieure, j'étais Maître de conférence en mathématiques appliquées à l'INSA
de Lyon. J'ai quitté l'éducation nationale pour faire des choses plus pratiques et surtout plus
passionnantes.
«Moteurzine». -- Comment définissez-vous Voila aujourd'hui ?
Pierre Aubert. -- Voila est un portail. La part du service de recherche est
importante mais elle n'est qu'une des composantes d'un portail. Le service de recherche est
composé de plusieurs services, un guide, une encyclopédie, des news, de la pub et, bien sûr,
un moteur de recherche web.
«Moteurzine». -- Qu'en est-il de vos projets à l'international et plus
particulièrement en Europe ? Les versions des sites à l'international sont soit fermées,
soit des redirections vers Voila.fr (par exemple : voila.co.uk). Il ne reste plus que Voila.com
qui est devenu Voila "pour les geeks" et Hahooa.com qui n'existait pas lors du précédent interview.
Un retour sur le marché européen est-il à prévoir ?
Pierre Aubert. -- La politique Europe de Wanadoo a été clairement affirmée
par le PDG de Wanadoo. Je ne sais pas comment cela va évoluer à court terme.
«Moteurzine». -- Quels sont vos concurrents en France mais aussi à l'international ?
Pierre Aubert. -- Alors la c'est clair. Sur le marché francais, il ne reste que
3 gros acteurs : Google, Fast et KE (aka le moteur de Voila) et quelques petits qui deviendront peut-être
gros (Exalead chez AOL, Mirago ... ).
A l'international, on ne veut/peut pas faire de concurrence aux mammouths :)
Le concurrent c'est Google. Les autres choisissent d'autres créneaux, par
exemple, FAST s'affiche comme le champion de la fraîcheur.
«Moteurzine». -- Que pensez-vous de la situation des outils de recherche en France,
aujourdhui ? Il y a eu le recentrage de Voila vers le marché français, la concentration d'outils comme
Ecila et Lokace qui sont devenus des redirections vers Nomade, la disparition d'autres moteurs comme
Excite.fr et Infoseek.fr mais aussi l'arrivée d'autres moteurs européens en France comme Abacho et Mirago ?
Pierre Aubert. -- Je pense qu'en France ça va chauffer pour les survivants.
La pression de Google est très forte. Ils ont clairement prit le segment marketing du
meilleur moteur de recherche. Et donc, c'est très dur pour les autres. Altavista et Yahoo! baissent
régulièrement et il ne reste que très peu d'indépendants. Ces indépendants survivent essentiellement
derrière de gros portails. Néanmoins pour beaucoup de portails, la question de l'indépendance
du service de recherche se pose. On ne voit pas MSN abandonner son moteur de recherche. AOL a le sien
maintenant, sans doute pour les mêmes raisons. Je ne pense pas que Mirago ou Abacho vont pouvoir prendre
de grosses parts de marché mais ils peuvent sans doute occuper des niches.

Copie écran de la page de garde du site Voila
«Moteurzine». -- Selon le dernier baromètre Xiti - 1ère Position, Google
domine en France et génère plus de 46% du trafic. Qu'est-ce qui explique cet
engouement pour Google ? Personnellement et / ou officiellement, que pensez-vous de Google ?
Pierre Aubert. -- Personnellement, je pense que Google est très fort
dans un certain nombre de domaines :
- leur base est la plus complète
- leur temps de réponse est excellent
- il n'y a pas de pub dans leurs pages
- le moteur est pertinent
- il répond aussi bien sur des requêtes FR que des requêtes EN (à mon avis
la plus grosse difference avec voila.com)
Ces différents points expliquent en partie le succès de Google.
Un autre domaine où Google est très fort, et qui est moins visible, est le
marketing et le lobbying. Je suis impressionné par la manière astucieuse de
promotion de l'outil.
D'un autre côté, comme Google est un pur player, il n'est pas pertinent sur
des requêtes locales (trouver les horaires de cinéma sur Google n'est pas
évident).
«Moteurzine». -- Quelle est l'architecture matérielle et logiciel derrière Voila ?
Pierre Aubert. -- Des PCs classiques pour le matériel, 1G de ram, 2pIII et pleins
de disques durs. Le réseau est classique a 100M/B.
Le logiciel est lui entièrement écrit en interne, aux alentours de 120000 ligne de C++ au dernier comptage
et 10000 lignes de shell/perl. C'est sa troisième incarnation et il est extrêmement fiable et performant.
«Moteurzine». -- Par rapport à ce que disait J. Thieck sur les choses à faire
ou ne pas faire pour améliorer son référencement sur Voila, que pouvez-vous rajouter ?
Pierre Aubert. -- Les choses ont bien changé depuis. Je pense que pour améliorer
son référencement, il vaut mieux dépenser son énergie à améliorer le contenu de son site que d'essayer par
tous les moyens de spammer les moteurs. Pleins de bons conseils existent sur internet pour améliorer son
référencement. Des entreprises entières vivent sur ce créneau.
«Moteurzine». -- Qu'est-ce que vous considérez comme une tentative de spam sur
votre moteur ?
Pierre Aubert. -- De plus en plus de choses. Actuellement, à la mode, l'achat
de noms de domaine bidons, les liens dans tous les sens à la populiens, les modifications DNS du genre
toto.spammer.com == titi.spammer.com, les modifs qui font voir au robot un document différents de celui
rendu par le browser, etc, etc.
«Moteurzine». -- Fin 2001, le référencement dans le guide de Voila est devenu
payant. Quelle démarche a amené Voila à proposer ce référencement payant ?
Pierre Aubert. -- Un service de recherche coûte cher, très cher, en personnel,
en machines, en bande passante. Il faut donc le rentabiliser. Je ne pense pas que ce soit
la peine de chercher plus loin.
«Moteurzine». -- Quel bilan faîtes-vous aujourdhui de cette offre ? Et qui
l'utilise plus particulièrement ?
Pierre Aubert. -- L'offre est essentiellement utilisées par les grosses
sociétés et par les entreprises de référencement pour lesquelles il existe une offre spéciale.
«Moteurzine». -- Est-ce qu'il est envisageable que le référencement sur
la partie moteur de Voila devienne aussi payant ?
Pierre Aubert. -- Non. Par contre, nous nous réservons le droit de refuser
des sites dans le moteur. En particulier, les soumissions sont nettoyées. Nous recevons 95% de
spam dans ces soumissions. Je pense que dans un futur proche, ça va devenir plus difficile de rentrer
dans la base. En particulier, il faudra justifier d'un certain contenu, de liens externes de sites
raisonnablement populaires, modifier ses pages au moins de temps en temps ...
«Moteurzine». -- Combien de sites référencez-vous chaque jour sur votre
annuaire et combien viennent de vos offres de référencement payant ? Pour votre moteur, est-ce uniquement
des sites francophones ou des sites internationaux ?
Pierre Aubert. -- La plupart des sites sont maintenant référencés via
l'offre payante. Les cyberdocs ne sont pas nombreux et ils traitent en priorité les offres payantes.
Le moteur indexe essentiellement des sites francophones et espanisants. Nous avons dans la base de
crawl 50M de documents FR, 20M ES et 150M divers.
«Moteurzine». -- Aujourdhui, de nombreux portails et outils de recherche
proposent en plus des résultats de leur base des liens en "pay-per-click" obtenu à travers les deux
leaders du marché : Espotting et Overture. Avez-vous en projet d'intégrer les résultats d'une de ces
sociétés ou bien comptez-vous développer et proposer votre propre solution comme Google ?
Pierre Aubert. -- Nous avons notre propre solution actuellement sur Voila /
Wanadoo.
«Moteurzine». -- Quelle est la part de la publicité, du référencement payant
et de la revente ou de la location de la technologie Echo dans les revenus de Voila ?
Est-ce que Voila peut être considéré comme un outil de recherche positif financièrement ?
Pierre Aubert. -- La première partie de la question est confidentielle.
Voila est très positif financièrement (i.e.: le service de recherche coûte moins cher que ce qu'il
rapporte via la publicité et la vente de flux).
«Moteurzine». -- Enfin, comment voyez-vous l'évolution des outils de recherche
dans les mois à venir et plus particulièrement celle de Voila ?
Pierre Aubert. -- Pour les concurrents, je ne sais pas ce qu'ils ont sous le
coude. Pour Voila, nous aimerions mettre un moteur international correct dans les
portails Voila / Wanadoo. L'algorithme de classement est en cours de réecriture pour prendre en
compte plus de parametres. Nous attendons beaucoup de cet algorithme. Il a une tolerance au spam
assez faible :)
«Moteurzine». -- Si un webmaster décide de monter un petit moteur de
recherche sur son hébergement mutualisé, que lui conseillerez-vous comme solution technique?
Pierre Aubert. -- Comme je ne suis pas à l'aise sous Windows, je ne peux
que conseiller des solutions sous Linux. ASPseek (aspseek.org) me plait bien, il est simple, efficace
et relativement rapide. Il utilise une SGDB type mysql et est donc assez facile à manipuler.
OpenMuscat est pas mal non plus même si le developpement à l'air en stand by. mnoGoSearch est très
correct aussi. Ces solutions sont libres, marchent bien et ne vous poserons pas de problèmes tant
que l'on atteint pas les limites d'une machine. Ces solutions ne sont pas, par contre, distribuées.
Leur taille maximale est à peu près celle de DMOZ. Un gros PC peut indexer le guide DMOZ mais c'est
un peu gros pour ASPseek par exemple.
«Moteurzine». -- Chez les référenceurs, le dernier jeu à la mode, c'est le
Googlewhack. Un Voilawhack est-il envisageable ?
Pierre Aubert. -- C'est moins drôle vu la taille de la base. En FR, ça ne
doit pas changer grand chose, on a, à peu près, la même base que Google.
«Moteurzine». -- Merci beaucoup pour vos réponses et le temps que vous
nous avez consacré.
Pierre Aubert. -- Mais de rien.