Outils logiciels | ||
page précédente les différentes étapes de récupération d'un ".doc" |
[ table des matiéres ] [ Retour a la page d'accueil ] [ liste générale des documents ] |
page suivante Script "FAIT" |
"htmlsoclean" Vise à supprimer les formatage "physiques" du HTML par des formatages logiques.
# "htmlsoclean" supprime toutes les balises sauf :
H1 H2 # Niveau de titre H3 P # Niveau de texte SPAN BR BLOCKQUOTES DIV TABLE # Tableau TR TD THEAD TBODY TFOOT CAPTION COLSPAN ROWSPAN ALIGN VALIGN BORDER UL #listes LI OL ACRONYM # Type de texte (formatage logique) EM # (texte mis en évidence) STRONG # (autre mise en évidence) PRE # (pré-formaté) CITE # (origine d'une citation) ADDRESS ABBR # (abréviation) CODE # (code programme informatique.) DEL # (texte supprimé) INS # (texte inséré) SUB # indice SUP # exposant A # texte barré (strike) S # Liens IMG # Images HTML HEAD BODY
# remplacement de toutes les formatages physiques par des formatages logique <EM> sauf le S (Strike : barré) :
# Remplacement des <font size> agrandi par des STRONG
# Remplacement des balises anciennes <CENTER> par <DIV ALIGN="CENTER">
# La balise P ne doit garder que l'attribut ALIGN avec les valeurs possibles : CENTER, LEFT, RIGHT, JUSTIFY
# Remplacement des ALIGN="LEFT" par rien dans les balise P
# les balises de formatage logique sont vidées :
H1 H2 H3 UL #listes LI OL ACRONYM # Type de texte (formatage logique) EM # (texte mis en evidence) STRONG # (autre mise en évidence) PRE # (préformaté) CITE # (origine d'une citation) ADDRESS ABBR # (abreviation) CODE # (code programme informat.) DEL # (texte supprimé) INS # (texte inséré) SUB # indice SUP # exposant S # texte barré (strike) BODY
CIP glenan BP 525 29185 CONCARNEAU CEDEX cip.glenans@free.fr
page précédente les différentes étapes de récupération d'un ".doc" |
[ table des matiéres ] [ Retour a la page d'accueil ] [ liste générale des documents ] |
page suivante Script "FAIT" |
|