Jusqu’à présent l’indexation des fichiers CSV n’était disponible que pour le traitement de données structurées.

Google a annoncé cette nouvelle fonctionnalité qui peut être intéressante pour les spécialistes SEO : Google indexe désormais les fichiers CSV.

Les utilisateurs peuvent maintenant gagner en visibilité et améliorer le SEO grâce à l’indexation des informations contenues dans les fichiers CSV ( csvfile en anglais ).

Google précisait déjà qu’il pouvait utiliser les fichiers CSV dans certains cas pour les données structurées des ensembles de données (Dataset,DataCatalog,DataDownload)

Les ensembles de données sont plus faciles à identifier lorsque vous fournissez des informations complémentaires telles que leur nom, leur description, leur créateur et leurs formats de distribution en tant que données structurées. L’approche de Google en matière de découverte des ensembles de données repose sur l’utilisation de schema.org et d’autres normes de métadonnées qui peuvent être ajoutées aux pages décrivant des ensembles de données. Le but de ce balisage est d’améliorer la découverte de ces derniers dans des domaines divers tels que les sciences de la vie, les sciences sociales, le machine learning, les données civiques et gouvernementales, et plus encore. Au besoin, utilisez l’outil de recherche d’ensembles de données.

Ces fichiers sont généralement utilisés pour stocker des données structurées, de manière à ce qu’elles puissent être facilement analysées et traitées par des programmes informatiques. Exemple de données CSV : Nom,Prénom,Age,Ville Max,Dupont,33,Montréal, Martin,Lagrange,28,Quebec«` Dans cet exemple, chaque ligne représente une personne différente, avec ses nom, prénom, âge et ville de résidence.

Les fichiers CSV sont une solution pratique pour afficher des données liées, telles que des articles de blog ou des informations sur les produits. Les chefs de produit peuvent ainsi facilement organiser leurs fichiers et les rendre accessibles aux moteurs de recherche.

Les données stockées dans le fichier CSV peuvent être indexées par Google, attention toutefois à la confidentialité des dites données, si les fichiers CSV contiennent des informations sensibles ou privées et qu’ils ne sont pas protégés ou exclus de l’indexation via le fichier robots.txt, ils pourraient être indexés et affichés dans les résultats de recherche. Actuellement, aucun fichier .csv n’apparaît encore dans les résultats de Google.

Pour rappel voici le type de fichiers indexables par Google:

  • Adobe Portable Document Format (.pdf)
  • Adobe PostScript (.ps)
  • Google Earth (.kml, .kmz)
  • GPS eXchange Format (.gpx)
  • Hancom Hanword (.hwp)
  • HTML (.htm, .html, autres extensions de fichier)
  • Microsoft Excel (.xls, .xlsx)
  • Microsoft PowerPoint (.ppt, .pptx)
  • Microsoft Word (.doc, .docx)
  • Présentation OpenOffice (.odp)
  • Feuille de calcul OpenOffice (.ods)
  • Texte OpenOffice (.odt)
  • Texte mis en forme (.rtf)
  • Scalable Vector Graphics (.svg)
  • TeX/LaTeX (.tex)
  • Texte (.txt, .text et autres extensions de fichiers), y compris le code source dans les langages de programmation courants :
    • Code source Basic (.bas)
    • Code source C/C++ (.c, .cc, .cpp, .cxx, .h, .hpp)
    • Code source C# (.cs)
    • Code source Java (.java)
    • Code source Perl (.pl)
    • Code source Python (.py)
    • Valeurs séparées par des virgules (.csv)
  • Wireless Markup Language (.wml, .wap)
  • XML (.xml)
  • Différents formats vidéo : 3GP, 3G2, ASF, AVI, DivX, M2V, M3U, M3U8, M4V, MKV, MOV, MP4, MPEG, OGV, QVT, RAM, RM, VOB, WebM, WMV et XAP
  • Différents formats d’image : BMP, GIF, JPEG, PNG, WebP et SVG