Digital Asset Management (DAM)

Le DAM est une extension TYPO3 qui permet de gérer des documents et des ressources multimédia. Il permet d’organiser ses fichiers en catégories (un fichier pouvant apparaître dans plusieurs catégories sans être recopié physiquement), et d’y adjoindre des méta-données comme l’auteur, les informations de copyright, …

Il m’est arrivé en effet de créer un site TYPO3 pour une association dont les exigences en terme de gestion documentaire était telles que le système de fichiers intégré, le fameux « FileList » suffisait. Mais voilà, le nombre de documents croissant, il serait désormais utile de pouvoir « aller plus loin » ; et c’est là qu’intervient l’ extension DAM.

Ces prochains jours, donc, je vais présenter ici comment j’ai pu mettre en place cet outil fabuleux comme gestionnaire des documents publiés sur Internet de l’ Unité Pastorale Sainte-Claire, dans le canton de Fribourg, en Suisse.

Installation des extensions

Voici les extensions nécessaires et/ou recommandées :

  • dam : inutile de dire que c'est l'extension indispensable...
  • dam_catedit : permet de gérer des catégories de documents
  • dam_index : pour indexer les documents
    • cc_metaexif : extraction des données  EXIF et  IPTC des images (nécessite le programme externe exiftags)
    • cc_meta_xmp : extraction des données  XMP des images JPEG
    • cc_metaexec : extraction des méta-données des fichiers PDF (nécessite le programme externe pdfinfo)
    • kyak_metaaudio : extraction des méta-données des fichiers audio WAV, MP3 et OGG
    • cc_txtextexec : extraction du contenu des fichiers PDF, DOC et XLS (nécessite les programmes externes pdftotext, catdoc et xls2csv)
    • cc_txtextphp : extraction du contenu de fichiers texte tels que TXT, HTML, XML et SGML

Toutes ces extensions une fois installées, il est bon de vérifier que l’environnement DAM est opérationnel (en particulier l’extraction de contenu et des méta-données). Pour se faire, ouvrons le menu Media > File, onglet Indexing et dans la liste sous l’onglet, choisissons la rubrique Services Info. Vous devriez obtenir la liste suivante :

Si les programmes externes ne sont pas disponibles, typiquement si vous avez des lignes de ce type dans le tableau récapitulatif des services :

alors vérifiez que vous autorisez l’exécution des programmes :

$TYPO3_CONF_VARS['BE']['disable_exec_function'] = '0';

Si ça ne fonctionne toujours pas, peut-être avez-vous une configuration un peu « blindée » de PHP et que le problème est lié à l’utilisation de liens symboliques dans un répertoire listé dans le paramètre de configuration open_basedir de votre php.ini ( voir mon rapport de bug). Auquel cas, je vous conseille d’appliquer mon patch  class.t3lib_exec.php.patch (compatible TYPO3 4.1.6 et 4.2.0).

Indexer un document

Pour les besoins d’un test d’indexation de document avec extraction des méta-données, j’ai créé un fichier  dam_test.pdf (35 KB) en LaTeX :

\documentclass[11pt,a4paper]{article}
 
\def\doctitle{Using DAM to manage documents}
\def\docauthor{Xavier Perseguers}
 
\usepackage[
  pdftex,
  pdftitle={\doctitle},
  pdfauthor={\docauthor},
  pdfsubject={How to use TYPO3's DAM to index documents},
  pdfkeywords={TYPO3 DAM}
]{hyperref}
 
\title{\doctitle}
\author{\docauthor}
 
\begin{document}
 
\maketitle
 
\section{Lorem ipsum dolor sit amet}
 
Consectetuer adipiscing elit...
 
\end{document}

Source :  dam_test.tex.

Nous sommes donc en possession d’un fichier contenant de nombreuses méta-données (titre, auteur, mots-clés, dimensions, nombre de pages, …) :

Nous n’avons donc plus qu’à déposer ce fichier dans le DAM et à vérifier que ses méta-données sont extraites correctement :

Exemples de fichiers à indexer

Voici quelques fichiers qui contiennent de nombreuses meta-informations et que vous pouvez dès lors utiliser pour vérifier que les services d’indexation fonctionnent parfaitement :

Flattr