A presentation at Snowcamp 2023 in in Grenoble, France by David Pilato
Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.
Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.
Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :
The following resources were mentioned during the presentation or are useful additional information.
Source code for the demos
Here’s what was said about this presentation on social media.