HTML to Markdown
Le module HtmlToMarkdown convertit du contenu HTML au format Markdown, en ne renvoyant que le texte.
Fonctionnalités
Conversion avec BeautifulSoup et moteur lxml
Extraction du texte brut (pas d’images ou liens)
Usage
La fonction convert_html_to_markdown
est utilisée dans :
la fonction
retrieve_url
du module URLRetriever, pour convertir en Markdown le contenu HTML des pages web indiquées dans le csvCSV_URL_HORAIRES
.