Sémantique : choisir le bon moteur de recherche pour son entreprise

Frederik Cailliau, chercheur chez l’éditeur français Sinequa, détaille les questions qu’il faut se poser afin d’évaluer différents moteurs de recherche d’entreprise.

Pertinence : Est-ce que les documents renvoyés en réponse à une requête sont pertinents pour chaque utilisateur ? Est-ce que la liste des réponses est ordonnée par pertinence décroissante ? Est-ce que les documents sont correctement classés dans les catégories ? Est-ce que le moteur fait plus que simplement chercher des mots-clés ?

Convivialité de la recherche : Quelles fonctionnalités sont incluses dans le moteur pour optimiser le processus de recherche ? Quels outils facilitent la formulation de la requête et la spécification de filtres supplémentaires au cours de la recherche ?

Traitements linguistiques : Est-ce que le moteur dispose des traitements linguistiques spécifiques nécessaires pour toutes les langues dans lesquelles j’ai des documents ? Par exemple, fait-il de la décomposition des mots composés agglutinés en allemand ; est-ce qu’il interprète le tiret et l’apostrophe comme il faut ?

Performance et ‘scalabilité’ : Est-ce que le moteur est capable d’indexer toutes les données dans des temps avec un nombre de serveurs raisonnables ? Si la quantité de données augmente, est-il possible d’adapter facilement l’architecture sans impacter la pertinence ni la performance ? Peut-il servir un nombre croissant d’utilisateurs sans rupture du service ? Est-ce que la réponse est immédiate ?

Qualité des connecteurs : Est-ce que l’éditeur dispose des connecteurs pour toutes mes sources de données ? Est-ce que ces connecteurs extraient bien toutes les informations ?

Respect de la sécurité : Est-ce que la sécurité de l’accès aux documents définie par l’entreprise est bien respectée partout ? N’y a-t-il pas de fuites cachées par exemple à la complétion automatique de la requête ?

Généricité : Faut-il adapter le moteur aux données de l’entreprise ? Est-ce qu’il est facile à prendre en main (installation, configuration, mises à jour) ? Fait-il du text mining de façon générique et/ou fournit-il des outils de text mining en standard ?

Article écrit par Jean-François Prevéraud – Industrie et technologie
Lire l’article en ligne

+1Share on LinkedInShare on Twitter

Le rachat d’Autonomy par HP démontre l’importance du marché de la gestion des informations d’entreprise

–< Click here to view this post in english >–

10,3 milliards de dollars pour le rachat d’Autonomy, associé à un bonus de 64% proposé aux actionnaires par rapport au cours actuel sur le marché, voilà un investissement conséquent pour une société de recherche des données métier (« Enterprise Search ») et d’accès à l’information, même pour un acteur comme HP qui tente de faire la preuve d’un virement de cap radical de sa stratégie, en abandonnant une activité PC à faible marge pour se tourner vers les logiciels et les services, plus lucratifs.

Cette transaction confirme la création d’un nouveau marché, celui Business Search, dont le but est d’aider les utilisateurs à mieux « comprendre » les données métier, tant structurées (bases de données, applications métier) que non structurées (emails, documents, fichiers, audio, vidéo, etc.).

On peut objecter qu’il ne s’agit pas là d’un marché nouveau mais au contraire mature, qui a vu le jour il y a plus de 10 ans. Certains analystes, qui considèrent le marché de la recherche de donnéesSearch Market ») comme un outil banalisé avec quelques niches spécialisées, ne pourront que soutenir ce constat. Bien évidemment, la recherche de données existe depuis belle lurette, et en l’absence de Google, le Web aurait croulé sous un excès d’information depuis déjà longtemps. Mais la recherche des données métier (« Enterprise Search ») a mis du temps à trouver sa place au sein des entreprises, car son usage principal a été confiné au Web ou aux sites intranet et à certaines applications de gestion de contenu d’entrepriseECM »), ce qui correspond en effet à des usages banalisés.

L’émergence d’un marché de la gestion de l’information renforcée par la recherche

Le nouveau marché de la recherche, comme le souligne le rachat d’Autonomy et les profits futurs que HP espère en retirer (et il a placé la barre très haut) concerne l’utilisation de la recherche au cœur des métiers. La recherche a enfin fait son entrée au cœur des systèmes informatiques des entreprises.

Bien entendu, ce type d’utilisation de la recherche est souvent lié aux applications métier, d’où l’appellation d’applications basées sur la recherche (« Search Based Applications », ou « SBA ») qui lui est souvent donné, alors que l’on devrait plutôt parler d’applications avec « fonctions de recherche avancées ». Nous appelons ce type d’utilisation « Business Search » ou la « recherche de données métier », car la recherche est utilisée pour étendre ou renforcer les fonctions métier.

Autonomy n’est aujourd’hui plus considérée comme une société de recherche de données d’entreprise à part entière. Toutefois, un grand nombre de ses produits intègrent la technologie IDOL de son moteur de recherche. La recherche dans toutes les sources de données a toujours été le concept sous-jacent de la vision d’Autonomy. C’est ce concept qui a jusqu’ici guidé la feuille de route de ses acquisitions, le but étant d’enrichir un portail de recherche de données d’entreprise « simple » en lui adjoignant des fonctionnalités métier supplémentaires (telles que la reconnaissance, la gestion du contenu Web, le centre d’appel, etc.). Ce marché de la recherche des données d’entreprise, des applications avec fonctions de recherche avancées, et des véritables applications basées sur la recherche (c’est-à-dire utilisant l’index de recherche pour créer de nouvelles applications) est le « nouveau marché de la recherche », ou « marché de la gestion de l’information renforcée par la recherche » en lequel HP a tellement foi.

Sinequa comme acteur référent de la recherche des données métier

Sinequa se réjouit vivement de cette évolution du marché. Elle confirme notre expérience sur nos grands projets récents. Il aurait été difficile de qualifier notre expérience de « tendance », mais nous sommes désormais absolument convaincus que cette tendance, caractérisée par des projets stratégiques ayant pour composante essentielle la recherche des données métier, existe bel et bien. Nous en avons comme indice nos grands projets au Crédit Agricole ou chez GDF, SFR, Siemens, Total, etc.

Il est délicat de définir ce nouveau marché, puisque le terme « recherche » était lié à l’ancien marché banalisé, et que les applications basées sur la recherche (« SBA ») recouvrent un concept trop flou. Notre profession s’est donc efforcée de mettre au point une description des scénarios métier correspondant à la nouvelle utilisation de la recherche, mais sans réellement réussir à définir un marché avec clarté. La conséquence est que l’un des grands cabinets d’analyse du marché a accusés la profession « d’intellectualiser à l’excès les possibilités de la recherche ». Peut-être qu’HP réussira-il mieux que nous à définir le nouveau marché de la recherche métier. Après tout, il a misé gros sur cet enjeu.

+1Share on LinkedInShare on Twitter

The Acquisition of Autonomy by HP shows the Importance of the Enterprise Information Management Market

–< Cliquez ici pour lire ce billet en français >–

$ 10.3 B to buy Autonomy, offering a 64% premium over the current market price to shareholders, that is a hefty investment in an enterprise search and information access company – even for an HP trying to demonstrate a dramatic shift in strategy, away from low-margin PC business to higher margin software and services. This transaction confirms the creation of a new market, that of Business Search, which helps users make sense of business data, structured (databases, business application) and unstructured (emails, documents, files, audio, video, etc.).

You may object that this is not a new but a mature market having been created more than 10 years ago. Some analysts will agree to this, considering the search market as a commodity with a few specialized niches. Of course, search has been around for quite some time, and without Google, the Web would have choked on information overload quite some time ago. But enterprise search has been slow in finding its true place within organizations, its main usage having been confined to Web or intranet sites and some enterprise content management – commoditized usages indeed.

The new search market, highlighted by the Autonomy deal and HP’s (very) high expectation of future profits, is in the use of search for core business functions. Search has finally entered the core of organizations’ IT systems. Of course, this type of search usage is often tied to business applications, causing people to speak of Search Based Applications, even though they are rather “search enhanced” applications. We call this type of usage “Business Search”, since search is used to enhance business functions.

A search enabled information management market is on its way

Autonomy is today no longer seen as a pure enterprise search company. But a lot of its products integrate IDOL-technology. Global Search has always been an underlying vision of Autonomy. It drove its past acquisition roadmap to enhance a “simple” enterprise search portal with additional business functionality (like discovery, web content management, call center, etc.) This market of enterprise search, search enhanced applications, and true search based applications (making use of search and the search index to create applications of a new kind) is the “new search market” or “search enabled information management market” in which HP is putting so much faith.

At Sinequa we are very pleased about this evolution of the market. It confirms our experience with recent large projects. It would have been difficult for us to call our experience a “trend”, but we are now absolutely convinced that this trend to strategic projects with business search as a core component does exist. Points in case are large projects at Crédit Agricole, GDF, SFR, Siemens, Total, etc.

It has been difficult to define this new market, since “search” was linked to the old commoditized market, and Search Based Applications could mean everything and nothing. Hence our profession has tried to come up with the description of business cases for search usage, without really succeeding in clearly defining a market. This caused one of the big market analyst companies to accuse us all of “over-intellectualizing what search can do”. Maybe HP will succeed in doing a better job of defining the new business search market. After all, there is a lot at stake for them.

+1Share on LinkedInShare on Twitter

Quel est le meilleur moteur de recherche pour un site d’e-Commerce ?

–< Click here to view this post in english >–

Tous les spécialistes vous le diront : un des services essentiels d’un site d’e-commerce est l’outil de recherche qu’il propose à ses visiteurs. Et derrière celui-ci, se profile donc pour le e-commerçant le choix du moteur de recherche qu’il intégrera à son backoffice. Ce choix est loin d’être simple puisqu’il faudra composer avec trois éléments qui peuvent paraître antagonistes : offrir les meilleures réponses possibles à l’internaute ; tenir compte des stratégies commerciales du vendeur ; répondre aux attentes du service IT en terme de performance, d’ouverture et de fiabilité. Face à ces besoins complexes, les solutions de Business Search s’affichent comme les plus pertinentes pour satisfaire les sites d’e-commerce.

Cela fait longtemps que j’échange sur le sujet avec les grands acteurs du secteur, comme Leroy Merlin, RueDuCommerce ou encore Pixmania. L’actualité nous a d’ailleurs rattrapé puisque ce dernier vient d’annoncer que le géant Carrefour lui déléguait toute la gestion de son e-commerce non alimentaire. Ce rapprochement apporte justement de l’eau à notre moulin, puisque Pixmania utilise depuis plusieurs années les solutions de Business Search proposées par Sinequa.

Le premier avantage apporté par une solution de Business Search est celle de pouvoir apporter une réponse dans 100 % des cas aux demandes des internautes. De telles performances ne peuvent pas être offertes avec une approche réduite à de simples requêtes sur un moteur classique ou sur une base de données SQL. En effet, dans ces dernier cas, cela signifierait vouloir demander à l’internaute de formuler ses demandes en respectant les nomenclatures ou identifiants produits précis du vendeur. Si l’internaute ne rentre pas le bon, le moteur simple ou la  BDD renverra un aveu d’échec, créant une déception chez l’acheteur potentiel… et donc une opportunité pour ce dernier de quitter le site pour aller voir ailleurs.

Une solution de Business Search s’adapte nativement aux stratégies commerciales des sites d’e-commerce

Effet Google oblige, l’internaute souhaite pouvoir poser une question libre. Une solution de Business Search est ainsi capable d’interpréter des requêtes d’internautes posées en langage naturel, et de ramener non pas une, mais des réponses mises en contexte en exploitant l’ensemble des informations hétérogènes accessibles chez l’e-commerçant. Cette faculté permet de répondre de manière pertinente directement à la question de l’acheteur potentiel, mais également à des questions mal formulées et de présenter les réponses organisées par facettes très contextuelles.

Cette solution favorise également les principes de CrossSelling ou d’UpSelling : indexant l’ensemble des informations “commerciales” du vendeur (la liste produit, les stocks, les promotions, etc.), elle est capable d’afficher par similarité des produits complémentaires en lien avec la recherche du client. Une demande concernant un iPhone remontera ainsi non seulement des réponses sur les différents modèles disponibles, mais également des informations sur les accessoires, les applications, etc. Il n’est même pas utile pour le vendeur d’avoir prévu a priori et en dur les liens entre ces différents produits. Une solution de Business Search le fait nativement, et organise les réponses intelligemment, par catégories, par prix, etc.

Il est également possible de surpondérer des catégories, afin de compléter la pertinence standard du moteur. Ceci permet de donner une priorité dans les réponses à des produits en promotion, par exemple. Le site d’e-commerce a ainsi toute liberté de mettre en place des stratégies commerciales particulières, ponctuelles et tactiques : elles seront automatiquement relayées par le moteur de recherche. Le Business Search s’affiche donc comme une solution pour répondre aux besoins des internautes sur un site de commerce en ligne, d’enrichir leur expérience client, tout en respectant les impératifs business du vendeur.

Un moteur de recherche “e-commerce” doit pouvoir supporter 1000 requêtes par seconde

Pour terminer, un e-commerçant a également besoin d’un service capable de suivre les contraintes de saisonnalités de son activité. Lors de la période de Noël, les acteurs majeurs du commerce en ligne peuvent recevoir des dizaines de millions de requêtes par jour. Dans ce cadre, seuls des acteurs spécialistes peuvent offrir des solutions suffisamment stables et évolutives pour supporter plus de mille requêtes par seconde en conservant un niveau de performance et de stabilité optimum.

Robustesse, ouverture, respect des stratégies commerciales du vendeur, satisfaction de l’acheteur : voici donc un ensemble de prérequis pour un moteur de recherche adapté à un site d’e-commerce. L’actualité Carrefour-Pixamania en apporte un nouveau : une solution de Business Search s’adapte de manière naturelle aux modèles B2B et stratégies d’expansion des acteurs du e-commerce (market place, solutions en marque blanche, infogérance directe), avec un grand nombre de catalogues hétérogènes provenant  d’autres vendeurs. C’est là où les facultés de connectivité et d’indexation de données issues de sources multiples et volumineuses d’un Sinequa Business Search feront également la différence.

+1Share on LinkedInShare on Twitter

What kind of search engine is best adapted to an e-commerce site?

–< Cliquez ici pour lire ce billet en français >–

All the experts will tell you: one of the essential services of an e-commerce site is the search tool that it proposes to visitors. This means that e-merchants have to choose the search engine to be integrated not only with their Website but also their back-office application. The choice is far from simple since it needs to take into account three potentially contradictory objectives: offering the best possible answers to visitors’ queries; taking into account the commercial strategies of the merchant; fulfilling the requirements of the IT department in terms of performance, openness, and reliability. Facing these requirements, Business Search solutions turn out to be the most adequate for e-commerce Websites.

I have been communicating for some time with big players of this industry, like Leroy Merlin, RueDuCommerce or Pixmania. The latter is at the center of recent news since industry giant Carrefour delegated its non-food e-commerce to Pixmania. This is a point in case of our argument for Business Search, since Pixmania has been using Business Search solutions from Sinequa for a number of years.

The first advantage of a Business Search solution is to offer responses to all requests formulated by visitors of an e-commerce site. Such a feat cannot be accomplished by asking simple (keyword-based) questions to a classic search engine or formulating SQL queries for a relational database. Indeed, the latter case would require the internet customer to formulate queries respecting the terminology or precise product names of the vendor. If the internet customer makes a mistake, the simple search engine or the database will come back with an error message – creating frustration for the potential customers and incite them to leave the site and look elsewhere.

A Business Search solution adapts natively to the commercial strategies of the e-merchants

Due to the influence of Google, Internet users want to ask questions without constraints. A Business Search solution is able to interpret requests in natural language, and to come back with not just one answer but a series of answers within the context of a user’s request, making use of all the heterogeneous information available at the e-merchant. This capability allows to not only give relevant answers to a potential buyer’s questions but also to answer imprecise questions, and to present answers ordered by context-oriented facets.

Such a solution also favours cross-selling and up-selling: by indexing the entirety of commercial information of the vendor, (list of products, stocks, promotions, etc.) it is capable of showing similar complementary products related to a user’s request. A request for an iPhone will thus not only return the available models but also information on accessories, applications, etc. The vendor need not establish “hard-coded” a-priori links between these different offerings. A Business Search solution does that on its own, and organizes the responses intelligently, by category, by price, etc.

It is also possible to attach different “weights” to categories, thus influencing the relevance naturally allocated by the engine. This allows, for example, giving priority to promoted articles in response lists. The e-merchant has thus complete freedom to implement special commercial strategies and ad-hoc tactics. They will be automatically taken up by the search engine. Thus, Business Search imposes itself as a solution that corresponds to the needs of customers of an e-commerce site, enhancing their customer experience, while also respecting the business imperatives of the e-merchant.

An “e-commerce search engine” must be able to process 1000 requests per second.

Finally, e-merchants also need to cope with the seasonal constraints of their business. During Christmas season, the major players in e-commerce may receive tens of millions of requests per day. Facing such challenges, only specialised search companies are able to offer sufficiently scalable solutions, supporting more than a thousand requests per second while preserving an optimum level of performance and stability.

Robustness and scalability, openness, support for the commercial strategies of the e-merchant, and customer satisfaction: here is a set of requirements for a search engine well adapted for an e-commerce site. The topical Carrefour-Pixmania deal adds another one: A Business Search solution must adapt naturally to the B2B models and expansion strategies of e-commerce players (market places, generic brands, outsourcing), with a large number of catalogues from different vendors. This is where the capabilities of Sinequa Business Search in connecting to and indexing large volumes of heterogeneous data make a real difference.

+1Share on LinkedInShare on Twitter