Le balisage structurel d'un document Web est fourni avec . Voyez ce que "Markup Language" est dans d'autres dictionnaires. Langage de balisage HTML

Langages de balisage

Langage de balisage(texte) dans la terminologie informatique, un ensemble de caractères ou de séquences insérés dans le texte pour transmettre des informations sur sa sortie ou sa structure. Il appartient à la classe des langages informatiques. Un document texte écrit à l'aide d'un langage de balisage contient non seulement le texte lui-même (sous forme de séquence de mots et de signes de ponctuation), mais également des informations supplémentaires sur ses différentes parties - par exemple, une indication des titres, des surlignages, des listes, etc. complexe Dans certains cas, un langage de balisage vous permet d'insérer des éléments interactifs et du contenu d'autres documents dans un document.

Il convient de noter qu'un langage de balisage n'est pas complet de Turing et n'est généralement pas considéré comme un langage de programmation, bien qu'il le soit à proprement parler.

HTML (de l'anglais. Langage Signalétique Hyper Text- "Hypertext Markup Language") - a été développé par le scientifique britannique Tim Berners-Lee vers 1986--1991 dans les murs du Centre Européen pour la Recherche Nucléaire à Genève (Suisse). HTML a été créé comme un langage d'échange de documentation scientifique et technique, utilisable par des personnes non spécialistes dans le domaine de la mise en page. HTML a géré avec succès la complexité de SGML en définissant un petit ensemble d'éléments structurels et sémantiques appelés descripteurs. Les descripteurs sont aussi souvent appelés "tags". Avec HTML, vous pouvez facilement créer un document relativement simple mais magnifiquement conçu. En plus de simplifier la structure du document, la prise en charge de l'hypertexte a été ajoutée au HTML. Des fonctionnalités multimédias ont été ajoutées plus tard.

Initialement, le langage HTML a été conçu et créé comme un moyen de structurer et de mettre en forme des documents sans être lié aux moyens de reproduction (affichage). Idéalement, le texte avec balisage HTML doit être reproduit sans distorsions stylistiques et structurelles sur des équipements dotés de divers équipements techniques (écran couleur d'un ordinateur moderne, écran monochrome d'un organisateur, écran de taille limitée d'un téléphone ou d'un appareil mobile et programmes de reproduction vocale de les textes). Cependant, l'utilisation moderne du HTML est très loin de son objectif initial. Par exemple, balisez

, utilisé plusieurs fois pour la mise en page, est conçu pour créer les tableaux les plus courants dans les documents. Au fil du temps, l'idée centrale de la plate-forme d'indépendance HTML a été sacrifiée au profit des besoins modernes de conception multimédia et graphique.

XML(Anglais) eX tensibleM arkupL angle-- langage de balisage extensible ; prononcé [ ex-em-eml]) est un langage de balisage recommandé par le World Wide Web Consortium (W3C). La spécification XML décrit les documents XML et décrit partiellement le comportement des processeurs XML (programmes qui lisent les documents XML et donnent accès à leur contenu). XML a été conçu pour être un langage avec une syntaxe simple et formelle qui permettrait aux programmes de créer et de traiter facilement des documents, tout en étant facile à lire et à créer pour les humains, en mettant l'accent sur l'utilisation du Web. Le langage est dit extensible car il ne fixe pas le balisage utilisé dans les documents : le développeur est libre de créer du balisage en fonction des besoins d'un domaine particulier, n'étant limité que par les règles de syntaxe du langage. La combinaison d'une syntaxe formelle simple, de la convivialité, de l'extensibilité et du recours aux encodages Unicode pour représenter le contenu des documents a conduit à l'utilisation généralisée de XML lui-même et d'une variété de langages dérivés spécialisés basés sur XML dans une grande variété d'outils logiciels.

XHTML(Anglais) EX tensibleH ypert posteM arkupL angle-- langage de balisage hypertexte extensible) -- une famille de langages de balisage de pages Web basés sur XML qui répètent et étendent les capacités de HTML 4. Les spécifications XHTML 1.0 et XHTML 1.1 sont des recommandations du World Wide Web Consortium, mais au moment son développement a été arrêté avec la recommandation d'utiliser HTML. Les nouvelles versions de XHTML ne sont pas publiées.

La principale différence entre XHTML et HTML est le traitement du document. Les documents XHTML sont traités par leur module (parser) de la même manière que les documents XML. Lors de ce traitement, les erreurs commises par les développeurs ne sont pas corrigées.

XHTML est conforme à la spécification SGML car XML en est un sous-ensemble. HTML a de nombreuses fonctionnalités en cours de traitement et a en fait cessé d'appartenir à la famille SGML, qui est inscrite dans le projet de spécification HTML 5.

Le navigateur choisit l'analyseur pour traiter le document en fonction de l'en-tête de type de contenu reçu du serveur :

HTML - texte/html

XHTML - application/xhtml+xml

· Pour l'affichage local sur le client, la sélection est basée sur l'extension de fichier.

· Dans Internet Explorer jusqu'à la version 8, il n'y a pas d'analyseur pour traiter les documents XHTML.

WML(Anglais) Langage de balisage sans fil-- "langage de balisage sans fil") -- langage de balisage de document à utiliser dans les téléphones portables et autres appareils mobiles conformément à la norme WAP.

La structure ressemble à du HTML quelque peu simplifié, mais il existe des différences essentielles, car WML est destiné aux appareils qui n'ont pas les capacités des ordinateurs personnels (petit écran, tous les appareils ne peuvent pas afficher des graphiques, petite taille de mémoire, etc.) : toutes les informations dans WML est contenu dans les soi-disant "decks" (eng. plate-forme). Dec est la plus petite unité de données pouvant être transférée par le serveur. Les jeux contiennent des "cartes" ( carte) (chaque carte est limitée par des balises et). Il devrait toujours y avoir au moins une carte dans un jeu, mais il peut y en avoir plusieurs. Dans le même temps, une seule carte s'affiche à la fois sur l'écran de l'appareil et l'utilisateur peut basculer entre elles en cliquant sur les liens - ceci est fait pour réduire le nombre de demandes d'informations au serveur; dans le même temps, la taille des pages WML ne doit pas dépasser 1 à 4 kilo-octets.

VML(Anglais) Langage de balisage vectoriel-- langage de balisage vectoriel) a été développé par Microsoft pour décrire les graphiques vectoriels. VML a été soumis au W3C par Microsoft, Macromedia et d'autres en 1998. À peu près au même moment, Adobe, Sun et plusieurs autres sociétés ont soumis des documents PGML pour examen. Ces deux langages sont devenus plus tard la base de SVG.

PGML (Langage de balisage graphique de précision, vaguement traduit en russe - "langage de balisage graphique de précision") - un langage de balisage basé sur XML utilisé pour décrire des graphiques vectoriels sur une page Web (diagrammes, éléments d'interface individuels) sous forme de texte au format XML, utilise un modèle de construction d'image , similaire à PDF et PostScript. Il a été soumis au consortium W3C par Adobe Systems, IBM, Netscape Communications et Sun Microsystems en 1998, mais n'a pas été accepté tel que recommandé. Presque simultanément, Microsoft a soumis son projet VML pour examen, un an plus tard, un langage SVG plus avancé a été développé, basé sur l'idée de deux technologies. SVG a reçu une recommandation du W3C et est devenu le principal format de description de graphiques vectoriels sur une page Web.

SVG(de l'anglais. S calableV secteurg raphiques-- graphiques vectoriels évolutifs) -- le langage de balisage des graphiques vectoriels évolutifs, créé par le World Wide Web Consortium (W3C) et inclus dans un sous-ensemble du langage de balisage extensible XML, est conçu pour décrire des vecteurs bidimensionnels et mixtes vecteur/bitmap graphiques au format XML. Prend en charge les graphiques interactifs fixes et animés - ou, en d'autres termes, déclaratifs et scriptés. Ne prend pas en charge la description d'objets tridimensionnels. Il s'agit d'un standard ouvert qui est une recommandation du W3C, l'organisation à l'origine de standards tels que HTML et XHTML. SVG est basé sur les langages de balisage VML et PGML. Développé depuis 1999.

XBRL(Anglais) eX tensibleB EntrepriseR déclarationL angle, allumé. Extensible Business Reporting Language est une norme ouverte pour les rapports financiers électroniques. Le format XBRL est basé sur le XML du langage de balisage extensible. XBRL utilise la syntaxe XML ainsi que des technologies liées à XML telles que l'espace de noms XML, XML Schema, XLink et XPath. L'un des objectifs de XBRL est de représenter et d'échanger des informations financières, telles que les états financiers des entreprises. La spécification du langage XBRL est développée et publiée par XBRL International, Inc., une organisation internationale indépendante.

Pour améliorer la perception visuelle du Web, la technologie CSS est devenue largement utilisée, ce qui vous permet de définir des styles de conception uniformes pour de nombreuses pages Web. Une autre innovation à noter est le système de nommage des ressources URN. Nom de ressource uniforme).

Un concept populaire pour le développement du World Wide Web est la création d'un Web sémantique. Le Web sémantique est un complément au World Wide Web existant, qui est conçu pour rendre les informations publiées sur le réseau plus compréhensibles pour les ordinateurs. Le Web sémantique est le concept d'un réseau dans lequel chaque ressource en langage humain est dotée d'une description qu'un ordinateur peut comprendre. Le Web sémantique donne accès à des informations clairement structurées pour toute application, quelle que soit la plate-forme et quels que soient les langages de programmation. Les programmes seront capables de trouver eux-mêmes les ressources nécessaires, de traiter les informations, de classer les données, d'identifier les relations logiques, de tirer des conclusions et même de prendre des décisions sur la base de ces conclusions. S'il est largement adopté et bien mis en œuvre, le Web sémantique a le potentiel de révolutionner Internet. Pour créer une description informatique d'une ressource, le Web sémantique utilise le format RDF (Eng. Cadre de description des ressources), qui est basé sur la syntaxe XML et utilise des URI pour identifier les ressources. Nouveau dans ce domaine est RDFS (Eng. Schéma RDF) et SPARQL (ang. Protocole et langage de requête RDF) un nouveau langage de requête pour un accès rapide aux données RDF.

Envoyer votre bon travail dans la base de connaissances est simple. Utilisez le formulaire ci-dessous

Les étudiants, les étudiants diplômés, les jeunes scientifiques qui utilisent la base de connaissances dans leurs études et leur travail vous en seront très reconnaissants.

Documents similaires

    Définition de la notion d'hypertexte. Les parties principales d'un document SGML. L'histoire de la création du langage de balisage standard pour les documents HTML. Différences entre la syntaxe XHTML et HTML. RSS est une famille de formats XML pour décrire les flux d'actualités. Utilisation du langage de balisage KML.

    présentation, ajouté le 15/02/2014

    Fondamentaux du langage de programmation des pages Web - HTML. Les types d'informations qu'une page Web peut contenir sont du texte, des graphiques, du son, de l'animation et de la vidéo. Boîte à outils pour créer des pages Web. Éditeurs HTML de base utilisés pour la conception Web.

    résumé, ajouté le 19/01/2011

    Caractéristiques générales du langage de balisage hypertexte. La structure du document HTML. Un aperçu des principales fonctionnalités de HTML. Éléments de conception de pages Web modernes. Analyse de l'application pratique du HTML (sur l'exemple des programmes de formation).

    dissertation, ajouté le 24/11/2012

    Balises et attributs de base du langage HTML. Création d'un site web, qui devrait être plusieurs pages interconnectées. Considérez différentes valeurs d'attributs et de balises sur les pages et autres documents. Formulaires d'écran des pages développées.

    travail de laboratoire, ajouté le 16/04/2014

    Qu'est-ce que le balisage. Un langage de balisage est un ensemble de conventions sur les principes de formatage utilisés pour coder les blocs de texte. Possibilités de formats SGML, HTML, XML, historique de création, spécificités de l'application, contrôle du placement des informations.

    résumé, ajouté le 22/03/2010

    Le nouveau langage de balisage hypertexte XHTML. Validation des documents XHTML, détermination de leur type. Erreurs courantes dans le balisage XHTML. Conformité des agents utilisateurs. Utilisation de XHTML avec d'autres espaces de noms. Extension de la sémantique HTML.

    dissertation, ajouté le 14/07/2009

    Etude de l'algorithme de descente récursive et du système de construction de la grammaire à l'aide de l'analyseur lexical Lex. Ecriture d'un programme interpréteur pour le langage de balisage HTML. Vérification de la séquence d'entrée pour l'exactitude de l'entrée en tant que fonction générale du programme.

    travaux de contrôle, ajouté le 25/12/2012

Nous avons publié un nouveau livre, "Social Media Content Marketing : Comment entrer dans la tête des abonnés et les faire tomber amoureux de votre marque".

HTML est un langage de balisage hypertexte.

La langue est utilisée pour organiser les pages Web. Faisons une analogie. Vous achetez un journal. Il contient plusieurs articles. Chaque article a un titre, il a des photos. Et le texte est tapé dans plusieurs colonnes. C'est la structure d'une page de journal.

Sur le site, tout est pareil. Pour créer la structure correcte de l'article - contenu - vous devez utiliser le langage de balisage du texte.

A quoi sert le HTML ?

HTML est nécessaire pour indiquer au navigateur comment afficher la page à l'écran.

La langue est omniprésente. Il s'agit d'un outil universel pour décorer le contenu d'une page. Il peut être utilisé dans n'importe quel navigateur. Si vous écrivez du code dans un langage de programmation, vous devez connaître certaines fonctionnalités, opérateurs, types de données, etc.

HTML se compose d'un ensemble de balises - commandes et d'attributs - propriétés. Ils sont faciles à retenir et vous pouvez toujours trouver des documents de référence.

Qu'est-ce que le code HTML

Le code est les instructions données au navigateur pour afficher la page. Il y a une structure qui doit toujours être respectée. Par exemple, la présence d'un seul titre H1 sur la page, les principales informations sont placées dans des rubriques, etc.

Le langage a trois outils.

Il existe deux types de balises - appariées et simples.

La structure du code HTML sur la page

Nous avons dit que la structure de tout document html est toujours la même. Vous trouverez ci-dessous les éléments requis.

  1. !- indique que le document utilise HTML.
  2. ...- Cette balise contient l'intégralité du code de la page. Tout ce qui n'y est pas placé n'est pas reconnu par le navigateur et n'est pas affiché.
  3. ...- une balise paire, elle contient des informations techniques, par exemple sur l'encodage d'un document.
    1. ... est le titre de la page et est placé à l'intérieur de la section d'en-tête. Chaque page doit avoir son propre titre unique.
    2. - Ce sont des informations officielles. Il relie les styles individuels à la page - css, etc. Il n'est pas affiché à l'utilisateur.
  4. ...

    - le corps de la page. Toutes les informations de base sont contenues dans cette balise.
    1. ...- des hyperliens.
    2. - Images.
    3. ...- Miniature.
    4. ...- italiques.

Il peut y avoir un nombre illimité d'éléments à l'intérieur du corps.

Par exemple, voici à quoi ressemble une partie du code de la page d'un de nos articles de blog.

Plus vous utilisez souvent des balises, plus elles sont mémorisées rapidement. Vous pouvez toujours trouver un livre de référence avec toutes les balises, les attributs et leurs valeurs.

Langages de balisage légers

Les langages conçus pour une écriture facile et rapide de texte dans un simple éditeur de texte sont appelés poids léger(fr:Langage de balisage léger). Caractéristiques de ces langues :

  • Fonctionnalités minimales.
  • Petit ensemble de balises prises en charge .
  • Facile à apprendre.
  • Le texte source dans une telle langue se lit avec la même facilité que le document fini.

Ils sont utilisés lorsqu'une personne doit préparer du texte dans un éditeur de texte standard (blogs, forums, wikis), ou lorsqu'il est important qu'un utilisateur disposant d'un éditeur de texte standard puisse également lire le texte. Voici quelques langages de balisage légers largement utilisés :

  • Balisage Wiki (voir Wikipedia:Comment éditer des articles)
  • Divers systèmes d'auto-documentation (par exemple Javadoc).

Histoire

Le terme "markup" (balisage) vient de l'expression "balisage" ( marque, balisage- Eng.) de la pratique éditoriale traditionnelle consistant à apposer des marques conditionnelles spéciales dans les marges et dans le texte d'un manuscrit ou à le relire avant de l'envoyer à l'impression. Ainsi, des "hommes de balisage" indiquaient la police, le style et la taille de la police pour chaque partie du texte. De nos jours, les éditeurs, les relecteurs, les graphistes - et, bien sûr, les auteurs eux-mêmes sont engagés dans le balisage de texte.

GenCode

L'idée d'utiliser des langages de balisage dans le traitement de texte informatique a probablement été introduite pour la première fois par William Tunnicliffe. William W.Tunnicliffe ) lors d'une conférence en 1967. Il a lui-même appelé sa proposition "codage universel" (Eng. codage générique). Au cours des années 1970, Tunnicliffe a dirigé le développement de la norme GenCode pour l'industrie de l'édition et est devenu plus tard président d'un comité de l'Organisation internationale de normalisation (ISO). Organisation internationale de normalisation ), qui a créé SGML, le premier langage de balisage descriptif. Brian Reid (ur. Brian Reid ) dans sa thèse, qu'il a soutenue en 1980 à l'Université Carnegie (Eng. L'université de Carnegie Mellon ), dans le développement du concept proposé, a réalisé la mise en œuvre pratique du balisage descriptif.

Cependant, le chercheur d'IBM Charles Goldfarb est maintenant communément appelé le "père" des langages de balisage. Charles Goldfarbe ). Le concept de base lui est venu en 1969 alors qu'il travaillait sur un système de gestion de documents primitif conçu pour les cabinets d'avocats. La même année, il participe à la création du langage IBM GML, introduit pour la première fois en 1973.

Certaines premières implémentations de langages de balisage informatique peuvent être trouvées dans les utilitaires de typographie UNIX tels que troff et nroff . Ils permettent d'insérer des commandes de formatage dans le texte d'un document pour le formater selon les exigences de l'éditeur.

Disponibilité d'un logiciel de publication avec fonction WYSIWYG (eng. "Ce que vous voyez est ce que vous obtenez" ce que vous voyez est ce que vous obtenez) a supplanté la plupart de ces langages parmi les utilisateurs généraux, bien que les travaux de publication sérieux utilisent toujours le balisage pour des structures de texte non visuelles spécifiques, et les éditeurs WYSIWYG enregistrent désormais le plus souvent les documents dans des formats basés sur des langages de balisage. .

Texas

Un autre standard de publication important est TeX, créé puis amélioré par Donald Knuth dans les années 70 et 80 du XXe siècle. TeX a réuni de puissantes capacités de formatage de texte et de description de polices, en particulier pour les livres de mathématiques de qualité professionnelle. Cela a pris beaucoup de temps à Knuth pour apprendre l'art de la composition. Cependant, TeX s'est dégradé de sorte qu'il est maintenant principalement utilisé dans le monde scientifique, où il est de facto la norme dans de nombreuses disciplines scientifiques. En plus de Tex, il y a LaTeX, qui est un système de balisage descriptif basé sur TeX largement utilisé.

Scribe, GML et SGML

Le premier langage avec une distinction claire et distincte entre la structure et le type de document était Scribe, créé et décrit par la thèse de doctorat de Brian Reid en 1980. Scribe était révolutionnaire dans le nombre de façons dont il était traité, notamment en raison de l'introduction de l'idée de styles distincts du texte et de la grammaire proprement dite et contrôlant l'utilisation d'éléments descriptifs. Scribe a joué un rôle important dans le développement du langage GML (plus tard SGML) et est également l'ancêtre direct de HTML et LaTeX.

Au début des années 80, l'idée que le balisage devait se concentrer sur les aspects structurels d'un document et laisser la représentation externe du document à l'interpréteur a conduit à la création de SGML. Le langage a été développé par un comité dirigé par Goldfarb. Il a combiné des idées provenant de nombreuses sources, dont le projet Tunnikofflick, GenCode. Sharon Adler, Anders Berglund et James A. Marke étaient également des membres clés du comité SGML.

SGML a défini avec précision la syntaxe pour inclure le balisage dans le texte, ainsi que pour décrire séparément quelles balises sont autorisées et où (DTD - Document Type Definition). Cela a permis aux auteurs de créer et d'utiliser n'importe quel balisage qu'ils souhaitaient, en choisissant les balises à utiliser et en leur donnant des noms dans le langage normal. Ainsi, SGML doit être considéré comme un métalangage ; plusieurs langages de balisage spéciaux en sont issus. La fin des années 80 a été marquée par l'émergence de nouveaux langages de balisage basés sur SGML, tels que TEI et DocBook.

En 1986, SGML a été publié en tant que norme internationale par l'ISO 8879. SGML a été largement accepté et a été largement utilisé dans de très grands projets. Cependant, il s'est généralement avéré lourd et difficile à apprendre, un effet secondaire du langage étant qu'il essayait d'en faire trop et d'être trop flexible. Par exemple, SGML a créé des balises de fin (ou des balises de début, voire les deux) qui n'étaient pas toujours nécessaires car il pensait que ce balisage serait ajouté manuellement par le personnel de support du projet, qui apprécierait les économies de frappes.

HTML

En 1991, l'utilisation de SGML était limitée aux programmes commerciaux et aux bases de données, tandis que les outils WYSIWYG (qui enregistraient les documents dans des formats binaires propriétaires) étaient utilisés pour d'autres programmes de traitement de documents. La situation a changé lorsque Sir Tim Berners-Lee a entendu parler de SGML par son collègue Anders Bergland. Anders Berglund ) et d'autres au CERN, ont utilisé la syntaxe SGML pour générer le HTML. Il était similaire à d'autres langages de balisage basés sur la syntaxe SGML, mais il était beaucoup plus facile de démarrer, même pour les développeurs qui ne l'avaient jamais fait. Steven DeRose a fait valoir que le HTML utilisant le balisage descriptif (et du SGML en particulier) était un facteur majeur dans le développement du Web car il a été conçu pour être flexible et extensible (ainsi que d'autres facteurs dont la notion d'URL et la libre utilisation par les navigateurs ). HTML est le langage de balisage le plus attrayant et le plus utilisé au monde aujourd'hui.

Cependant, le statut de HTML en tant que langage de balisage a été contesté par certains informaticiens. Leur principal argument est que HTML restreint le placement des balises en exigeant que les deux balises soient imbriquées dans d'autres balises ou dans les balises principales du document. En conséquence, ces chercheurs considèrent HTML comme un langage conteneur suivant un modèle hiérarchique.

XML

XML (Extensible Markup Language) est un langage de méta balisage largement utilisé aujourd'hui. XML est développé par le World Wibe Web Consortium dans un comité présidé par Jon Bosak. L'objectif principal de XML est d'être plus simple que SGML et de se concentrer sur un problème spécifique - les documents sur le Web. XML est un méta langage comme SGML, les utilisateurs sont autorisés à créer les balises qu'ils veulent (donc "extensibles"). L'essor de XML a été facilité car chaque document XML pouvait être écrit de la même manière qu'un document SGML, et les programmes et les utilisateurs utilisant SGML pouvaient migrer assez facilement vers XML.

Cependant, XML a perdu de nombreuses fonctionnalités centrées sur l'humain de SGML qui le rendaient plus facile à utiliser (jusqu'à ce que la quantité de balisage augmente et que la lisibilité et la possibilité de modification soient restaurées au même niveau). D'autres améliorations ont résolu certains problèmes SGML au niveau international et ont rendu possible l'analyse hiérarchique d'un document même si aucune DTD n'était disponible.

XML a été conçu principalement pour les environnements semi-structurés tels que les documents et les publications. Cependant, il en résultait un juste milieu entre flexibilité et simplicité, et il a été rapidement adopté par de nombreux utilisateurs. De nos jours, XML est largement utilisé pour transmettre des données entre programmes. Comme HTML, il peut être décrit comme un langage "conteneur".

XHTML

Depuis janvier 2000, toutes les recommandations au W3C sont basées sur XML plutôt que sur SGML, l'acronyme XHTML (Extensible HyperText Markup Language - Extensible HyperText Markup Language) a été proposé. Les spécifications du langage exigeaient que les documents XHTML soient formatés en tant que documents XML, ce qui permet d'utiliser XHTML pour des documents plus clairs et plus précis à l'aide de balises HTML.

L'une des différences les plus notables entre HTML et XHTML est la règle selon laquelle toutes les balises doivent être fermées : les balises vides, par exemple<Br/> doivent tous deux être fermés par une balise de fin standard ou une entrée spéciale :<Br/> (l'espace avant le "/" dans la balise de fermeture est facultatif, mais souvent utilisé car il est utilisé par certains navigateurs pré-XML, également par les analyseurs SGML). Les autres attributs des balises doivent être entre guillemets. Enfin, toutes les balises et tous les noms d'attributs doivent être écrits en minuscules pour être lus correctement ; HTML est insensible à la casse.

Autres développements basés sur XML

De nombreux développements basés sur XML sont maintenant utilisés, tels que RDF (Resource Description Framework), XFORMS, DocBook, SOAP et OWL (Ontology Web Language).

Particularités

Une caractéristique commune à tous les langages de balisage est qu'ils mélangent le texte du document avec des instructions de balisage dans un flux de données ou un fichier. Ce n'est pas nécessaire, il est possible d'isoler le balisage du texte à l'aide de pointeurs, d'étiquettes, d'identificateurs ou d'autres méthodes de coordination. Ce "balisage séparé" est typique de la représentation interne des programmes qui fonctionnent avec des documents de balisage. Cependant, le balisage intégré ou "interligne" est plus accepté ailleurs. Par exemple, voici un petit morceau de texte balisé avec HTML :

Anatidés

La famille Anatidés comprend les canards, les oies et les cygnes, mais ne pas les hurleurs étroitement liés.

Code d'instruction de balisage (appelé balises) entouré de crochets angulaires<как здесь>. Le texte entre ces instructions est le texte du document. Codes h1, p et em- des exemples de balisage structurel, ils décrivent la position, le but ou le sens du texte qu'ils contiennent.

Plus précisément, h1 signifie "ceci est un titre de premier niveau", p signifie "ceci est un paragraphe", et em signifie "c'est le mot ou la phrase souligné". L'interprète peut appliquer ces règles ou styles pour afficher différentes parties du texte en utilisant différentes polices de caractères, tailles de police, indentation, couleur ou autres styles selon les besoins. Une balise telle que h1 peut, par exemple, être représentée en gros caractères gras, ou dans un document avec du texte à espacement fixe (comme une machine à écrire) peut être soulignée ou ne pas changer d'apparence du tout.

Pour le contraste, taguez je en HTML, un exemple de balisage visuel ; il est généralement utilisé pour identifier des caractéristiques spécifiques du texte (utilisez une police en italique dans ce bloc) sans explication.

La TEI (Tex Encoding Initiative) a publié des documents d'orientation complets spécifiant comment encoder du texte au profit de l'humanité et des sociétés scientifiques. Ces manuels ont été utilisés pour coder des documents historiques, des travaux spécifiques d'érudits, des périodiques, etc.

Utilisations alternatives

Alors que l'idée d'utiliser des langages de balisage avec des documents texte se développait, elle augmentait l'utilisation des langages de balisage dans d'autres domaines, suggérant qu'ils soient utilisés pour représenter divers types d'informations, y compris des listes de lecture, des graphiques vectoriels, des services Web. , Les interfaces des utilisateurs. La plupart de ces applications sont basées sur XML car il s'agit d'un langage hautement structuré et extensible.

L'utilisation du langage XHTML montre également qu'il peut être combiné avec différents langages de balisage du même profil, comme XHTML+SMIL ou XHTML+MathML+SVG.

(Standard Generalized Markup Language), présenté dans la norme ISO 8879. Ce langage est accepté comme langage principal pour la conception de la documentation technique, y compris les manuels techniques électroniques interactifs pour les produits créés dans les technologies CALS.

SGML définit la structure des documents comme une séquence d'objets de données. Les objets de données représentant des parties d'un document peuvent être stockés dans différents fichiers. La norme SGML établit de tels ensembles de symboles et de règles de représentation des informations qui permettent à divers systèmes de reconnaître et d'identifier correctement ces informations. Ces ensembles sont décrits dans une partie séparée du document, appelée DTD (Document Type Definition), qui est transmise avec le document SGML principal. La DTD spécifie la correspondance entre les caractères et leurs codes de caractères, les longueurs maximales des identificateurs utilisés, la manière dont les délimiteurs de balises sont représentés, d'autres conventions possibles, la syntaxe de la DTD, ainsi que le type et la version du document. Par conséquent, SGML peut être qualifié de métalangage pour une famille de langages de balisage spécifiques. En particulier, les langages de balisage XML et HTML peuvent être considérés comme des sous-ensembles de SGML.

La description technique sous forme de document SGML comprend :

  • le fichier principal avec le manuel technique balisé avec des balises SGML ;
  • description des entités, si le document appartient à un groupe dans lequel les mêmes entités sont utilisées et leur notoriété est implicite ;
  • dictionnaire pour expliquer les balises SGML ;

Cependant, SGML est difficile à apprendre et à utiliser. Par conséquent, pour une large utilisation du balisage dans les documents présentés dans les technologies WWW, en 1991, basé sur SGML, un HTML simplifié (HyperText Markup Language) a été développé, et en 1996, XML (eXtensible Markup Language), qui devient, en combinaison avec HTML est le langage principal pour représenter des documents dans diverses applications.

Le langage HTML a été développé dans le but d'utiliser largement le balisage dans les documents présentés dans les technologies WWW.

Une description HTML est un texte ASCII et une séquence de commandes (codes de contrôle) qui y sont incluses, également appelées descripteurs ou balises. Ce texte est appelé un document HTML, ou une page HTML, ou, après avoir été placé sur un serveur Web, une page Web. Les balises sont placées aux bons endroits dans le texte source, elles définissent les polices, la césure, l'apparence des images graphiques, les liens, etc. Lors de l'utilisation d'éditeurs WWW, l'insertion de commandes se fait simplement en appuyant sur les touches appropriées.

XML, comme HTML, est considéré comme un sous-ensemble de SGML. Actuellement, le langage XML prétend être le principal langage de représentation de documents dans les technologies de l'information ; il peut être considéré comme un métalangage qui sert de base à la création de langages de balisage privés dans diverses applications. Dans le même temps, XML est plus pratique que SGML, ce qui est assuré par l'élimination de certaines fonctionnalités mineures de SGML dans XML. Les descriptions en XML sont plus faciles à comprendre, adaptées pour une utilisation dans les navigateurs modernes tout en conservant les fonctionnalités de base de SGML.

Pour des applications spécifiques, leurs propres variantes de XML sont créées, appelées dictionnaires XML ou applications XML. Ainsi, pour la description de textes avec des symboles mathématiques spécifiques, une application XML OSD (Open Software Description) a été développée. Pour CALS, la variante PDX (Product Definition eXchange) de l'échange de données est intéressante. Dictionnaires connus pour la chimie (CML - Chemical Markup Language), la biologie (BSML - Bioinformatic Sequence Markup Language), etc.

Lire aussi :