"Il y a, dans la création des Cieux et de la Terre et dans la succession de la nuit et du jour, des signes pour ceux qui sont doués d'intelligence" Coran
"Il y a, dans la création des Cieux et de la Terre et dans la succession de la nuit et du jour, des signes pour ceux qui sont doués d'intelligence"Coran

Bienvenue sur le site de Mehdi Badr !

Né en 1985 à Tunis, je suis Docteur en Informatique (PhD), spécialisé en science des données et en Machine Learning. Je suis co-auteur de plusieurs articles scientifiques essentiellement dans le domaine de la recherche d'information, l'indexation de données et l'apprentissage automatique (ici la liste complète). J'ai travaillé entre mars 2015 et avril 2017, à Qwant le moteur de recherche Enropéen en tant que Lead Data Scientist. J'ai occupé précédemment les postes de chef de projet et directeur de recherche à Trimane, une société spécialisée en Business Intelligence. J'ai aussi travaillé comme expert externe pour l'Agence Nationale de la Recherche (ANR). Entre 2009 et 2013, j'ai travaillé comme Enseignant/Chercheur d'abord à l'Université de Cergy-Pontoise puis à l'ENSEA (Grande École d'Ingénieurs Généraliste Électronique, Informatique et Télécommunications). Durant ma formation universitaire, je suis passé par l'Université de Paris Dauphine pour mon master 2 (Informatique: Systèmes Intelligents) ainsi que l'Ecole Supérieure de Commerce de Tunis (ESC). 

 

Publications

A general top-k algorithm for web data sources

Several algorithms for top-k query processing over web data sources have been proposed, where sources return relevance scores for some query predicate, aggregated through a composition function. They assume specific conditions for the type of source access (sorted and/or random) and for the access cost, and propose various heuristics for choosing the next source to probe, while generally trying to refine the score of the most promising candidate. We present BreadthRefine (BR), a generic top-k algorithm, working for any combination of source access types and any cost settings. It proposes a new heuristic strategy, based on refining all the current top-k candidates, not only the best one. We present a rich panel of experiments comparing BR with state-of-the art algorithms and show that BR adapts to the specific settings of these algorithms, with lower cost.

 

 

Co-author: Dan Vodislav

MULTI-CRITERIA SEARCH ALGORITHM: AN EFFICIENT APPROXIMATE K-NN ALGORITHM FOR IMAGE RETRIEVAL

We propose a new method for approximate k-NN search in large scale image databases, based on top-k multi-criteria search techniques. The method defines a simple index structure based on sorted lists, which provides a good compromise between fast retrieval, storage requirements and update cost. The search algorithm delivers approximate results with guarantees about false negatives, with fast emergence of good approximations, monotonically improved and leading if necessary to an exact result. Experiments with the on-disk implementation show that our method produces very good approximate results several times faster than the Baseline method.

 

 

Co-authors: Dan Vodislav, David Picard, Shaoyi Yin, Philippe-Henri Gosselin

Comment me joindre

contact@mehdibadr.com

 

Actualités

Retrouvez mon nouvel article intitulé: Algorithmes, formes diachroniques et métadesign

JDN : Derniers contenus

Ela Innovation : des puces RFID pour des pas de géant dans l'IoT (Wed, 24 May 2017)
Cette PME fondée en 2000 compte réaliser 10 millions d'euros de chiffre d'affaires d'ici trois ans avec ses tags RFID actifs, mais aussi via de nouveaux relais de croissance comme des capteurs connectés en LoRa.
>> Lire la suite

Médias traditionnels ou sociaux : les marques ont leurs préférences (Wed, 24 May 2017)
Besoin de crédibiliser un message de marque ou de faire du ciblage d'audience ? Les annonceurs adaptent le choix de leur support à leurs objectifs de communication.
>> Lire la suite

Version imprimable Version imprimable | Plan du site
Mehdi BADR website 2017