Le balisage structurel d'un document Web est fourni à l'aide de . Découvrez ce qu'est le « langage de balisage » dans d'autres dictionnaires. Langage de balisage HTML

Langages de balisage

Le langage de balisage (texte) dans la terminologie informatique est un ensemble de symboles ou de séquences insérés dans un texte pour transmettre des informations sur sa sortie ou sa structure. Appartient à la classe des langages informatiques. Un document texte écrit à l'aide d'un langage de balisage contient non seulement le texte lui-même (sous forme de séquence de mots et de signes de ponctuation), mais également des informations supplémentaires sur diverses parties de celui-ci - par exemple, une indication des titres, des surlignages, des listes, etc. plus cas difficiles Le langage de balisage vous permet d'insérer des éléments interactifs et du contenu provenant d'autres documents dans un document.

Il convient de noter que le langage de balisage est incomplet de Turing et n’est généralement pas considéré comme un langage de programmation, bien qu’il le soit à proprement parler.

HTML (de l'anglais) Langage Signalétique Hyper Text-- « langage de balisage hypertexte ») - développé par le scientifique britannique Tim Berners-Lee vers 1986-1991 au Centre européen de recherche nucléaire à Genève (Suisse). HTML a été créé comme langage d'échange de documentation scientifique et technique, adapté à l'usage de personnes non spécialisées dans le domaine de la mise en page. HTML a réussi à gérer la complexité de SGML en définissant un petit ensemble d'éléments structurels et sémantiques appelés descripteurs. Les descripteurs sont aussi souvent appelés « balises ». En utilisant HTML, vous pouvez facilement créer un document relativement simple mais magnifiquement conçu. En plus de simplifier la structure du document, le support hypertexte a été ajouté au HTML. Des capacités multimédia ont été ajoutées plus tard.

Initialement, le langage HTML a été conçu et créé comme un moyen de structurer et de formater des documents sans les lier à des outils de reproduction (affichage). Idéalement, le texte avec balisage HTML aurait dû être reproduit sans distorsions stylistiques et structurelles sur des équipements dotés d'équipements techniques différents (écran couleur d'un ordinateur moderne, écran monochrome d'un organisateur, écran de taille limitée d'un téléphone ou d'un appareil mobile et programmes de voix). lecture de textes). Cependant, l’utilisation moderne du HTML est très loin de son objectif initial. Par exemple, balisez

, utilisé plusieurs fois pour formater la page, est destiné à créer les tableaux les plus courants dans les documents. Au fil des années, l'idée centrale de l'indépendance de la plate-forme HTML a été sacrifiée au profit des besoins multimédias et graphiques modernes.

XML eX tenduM arkupL langue-- langage de balisage extensible ; prononcé [ ex-em-eml]) est un langage de balisage recommandé par le World Wide Web Consortium (W3C). La spécification XML décrit les documents XML et décrit partiellement le comportement des processeurs XML (programmes qui lisent les documents XML et donnent accès à leur contenu). XML a été conçu comme un langage avec une syntaxe formelle simple, pratique pour créer et traiter des documents par des programmes, et en même temps pratique pour les humains pour lire et créer des documents, en mettant l'accent sur une utilisation sur Internet. Le langage est dit extensible car il ne fixe pas le balisage utilisé dans les documents : le développeur est libre de créer du balisage en fonction des besoins d'un domaine particulier, limité uniquement par les règles syntaxiques du langage. La combinaison d'une syntaxe formelle simple, de la convivialité, de l'extensibilité, ainsi que du fait d'être basé sur des encodages Unicode pour représenter le contenu des documents a conduit à l'utilisation généralisée à la fois de XML lui-même et de nombreux langages spécialisés dérivés basés sur XML dans un large variété de logiciels.

XHTML EX tenduH ouit posteM arkupL langue-- Extensible Hypertext Markup Language) est une famille de langages de balisage de pages Web basés sur XML qui reproduisent et étendent les capacités de HTML 4. Les spécifications XHTML 1.0 et XHTML 1.1 sont des recommandations du World Wide Web Consortium, mais son développement est actuellement arrêté avec la recommandation d'utiliser HTML. Les nouvelles versions de XHTML ne sont pas publiées.

La principale différence entre XHTML et HTML réside dans la manière dont le document est traité. Les documents XHTML sont traités par leur propre module (analyseur) de la même manière que les documents XML. Lors de ce traitement, les erreurs commises par les développeurs ne sont pas corrigées.

XHTML est conforme à la spécification SGML car XML en est un sous-ensemble. HTML possède de nombreuses fonctionnalités dans le processus de traitement et a en fait cessé d'appartenir à la famille SGML, inscrite dans le projet de spécification HTML 5.

Le navigateur sélectionne un analyseur pour traiter le document en fonction de l'en-tête de type de contenu reçu du serveur :

· HTML - texte/html

· XHTML - application/xhtml+xml

· Pour une visualisation locale sur le client, la sélection est basée sur l'extension du fichier.

· Dans Internet Explorer jusqu'à la version 8, il n'existe pas d'analyseur pour traiter les documents XHTML.

WML (anglais) Langage de balisage sans fil-- "langage de balisage sans fil") est un langage de balisage de documents destiné à être utilisé dans les téléphones portables et autres appareils mobiles utilisant la norme WAP.

La structure ressemble à un HTML quelque peu simplifié, mais il existe également des différences clés, puisque WML s'adresse aux appareils qui n'ont pas les capacités des ordinateurs personnels (petit écran, tous les appareils ne peuvent pas afficher des graphiques, petite taille de mémoire, etc.) : tous les informations sont contenues en WML dans ce que l'on appelle les « decks » (eng. pont). Dec est le bloc minimum de données pouvant être transmis par le serveur. Les jeux contiennent des « cartes » ( carte) (chaque carte est limitée par des balises et ). Il devrait toujours y avoir au moins une carte dans un jeu, mais il peut y en avoir plusieurs. Dans le même temps, une seule carte est affichée sur l'écran de l'appareil à tout moment et l'utilisateur peut basculer entre elles en suivant les liens - ceci est fait pour réduire le nombre de demandes d'informations au serveur ; dans le même temps, la taille des pages WML ne doit pas dépasser 1 à 4 kilo-octets.

VML (anglais) Langage de balisage vectoriel-- langage de balisage vectoriel) développé par Microsoft pour décrire les graphiques vectoriels. VML a été introduit au W3C par Microsoft, Macromedia et d'autres en 1998. À peu près à la même époque, Adobe, Sun et plusieurs autres sociétés ont soumis des articles sur PGML. Ces deux langages sont ensuite devenus la base de SVG.

PGML (Precision Graphics Markup Language, vaguement traduit en russe - « langage de balisage graphique de précision ») est un langage de balisage basé sur XML utilisé pour décrire des graphiques vectoriels sur une page Web (diagrammes, éléments d'interface individuels) sous forme de texte au format XML utilise un modèle de construction d'image similaire à PDF et PostScript. Il a été soumis au consortium W3C par Adobe Systems, IBM, Netscape Communications et Sun Microsystems en 1998, mais n'a pas été accepté comme recommandé. Presque simultanément, Microsoft a soumis son projet VML pour examen, et un an plus tard, un langage SVG plus avancé a été développé, basé sur l'idée de deux technologies. SVG a été recommandé par le W3C et est devenu le principal format pour décrire des graphiques vectoriels sur une page Web.

SVG (de l'anglais. S calableV secteurg raphiques-- Scalable Vector Graphics) -- Le langage de balisage de graphiques vectoriels évolutifs, créé par le World Wide Web Consortium (W3C) et un sous-ensemble du langage de balisage extensible XML, est destiné à décrire des graphiques vectoriels bidimensionnels et des graphiques vectoriels/raster mixtes en XML. format. Prend en charge les graphiques interactifs fixes et animés - ou, en d'autres termes, déclaratifs et scripts. Ne prend pas en charge la description d'objets tridimensionnels. Il s'agit d'un standard ouvert qui est une recommandation du consortium W3C, l'organisation qui a développé des standards tels que HTML et XHTML. SVG est basé sur les langages de balisage VML et PGML. Développé depuis 1999.

XBRL eX tenduB affairesR. exportationL langue, allumé. Extensible Business Reporting Language est un standard ouvert pour la présentation électronique des états financiers. Le format XBRL est basé sur le langage de balisage extensible XML. XBRL utilise la syntaxe XML ainsi que des technologies liées à XML telles que l'espace de noms XML, XML Schema, XLink et XPath. L'un des objectifs de XBRL est de représenter et d'échanger des informations financières, telles que les états financiers des entreprises. La spécification du langage XBRL est développée et publiée par l'organisation internationale indépendante XBRL International, Inc.

Pour améliorer la perception visuelle du Web, la technologie CSS est devenue largement utilisée, ce qui vous permet de définir des styles de conception uniformes pour de nombreuses pages Web. Une autre innovation à laquelle il convient de prêter attention est le système de dénomination des ressources URN (anglais). Nom de la ressource uniforme).

Un concept populaire pour le développement du World Wide Web est la création d'un Web sémantique. Le Web sémantique est un complément au World Wide Web existant, conçu pour rendre les informations publiées sur le réseau plus compréhensibles pour les ordinateurs. Le Web sémantique est un concept de réseau dans lequel chaque ressource en langage humain recevrait une description qu'un ordinateur peut comprendre. Le Web sémantique ouvre l'accès à des informations clairement structurées pour toute application, quelle que soit la plateforme et quels que soient les langages de programmation. Les programmes seront capables de trouver eux-mêmes les ressources nécessaires, de traiter les informations, de classer les données, d'identifier les connexions logiques, de tirer des conclusions et même de prendre des décisions sur la base de ces conclusions. S’il est largement adopté et mis en œuvre judicieusement, le Web sémantique a le potentiel de déclencher une révolution sur Internet. Pour créer une description lisible par ordinateur d'une ressource, le Web sémantique utilise le format RDF (anglais). Cadre de description des ressources), qui est basé sur la syntaxe XML et utilise des URI pour identifier les ressources. Les nouveaux produits dans ce domaine sont RDFS (eng. Schéma RDF) et SPARQL (ing. Protocole et langage de requête RDF) un nouveau langage de requête pour un accès rapide aux données RDF.

Envoyez votre Bon travailà la base de connaissances simplement. Utilisez le formulaire ci-dessous

Les étudiants, étudiants diplômés, jeunes scientifiques qui utilisent la base de connaissances dans leurs études et leur travail vous en seront très reconnaissants.

Documents similaires

    Définition de la notion d'hypertexte. Principales parties d'un document SGML. L'histoire de la création du langage de balisage de document HTML standard. Différences entre la syntaxe XHTML et HTML. RSS est une famille de formats XML permettant de décrire les flux d'actualités. Utilisation du langage de balisage KML.

    présentation, ajouté le 15/02/2014

    Bases du langage de programmation de pages Web – HTML. Types d'informations qu'une page Web peut contenir : texte, graphiques, son, animation et vidéo. Boîte à outils pour créer des pages Web. Éditeurs HTML de base utilisés pour la conception Web.

    résumé, ajouté le 19/01/2011

    caractéristiques générales Langage Signalétique Hyper Text. Structure du document HTML. Aperçu des principales fonctionnalités du HTML. Éléments de conception de pages Web modernes. Analyse application pratique HTML (en utilisant l'exemple des programmes de formation).

    travail de cours, ajouté le 24/11/2012

    Balises et attributs de base du langage HTML. Créer un site Web composé de plusieurs pages interconnectées. Considération différentes significations attributs et balises sur les pages et autres documents. Formes d'écran des pages développées.

    travail de laboratoire, ajouté le 16/04/2014

    Qu'est-ce que le balisage. Le langage de balisage est un ensemble de conventions de formatage utilisées pour coder des blocs de texte. Possibilités de formats SGML, HTML, XML, historique de création, spécificités d'application, contrôle du placement des informations.

    résumé, ajouté le 22/03/2010

    Nouveau langage Balisage hypertexte XHTML. Validation des documents XHTML, détermination de leur type. Erreurs courantes dans le balisage XHTML. Conformité de l'agent utilisateur. Utiliser XHTML avec d'autres espaces de noms. Extension de la sémantique HTML.

    travail de cours, ajouté le 14/07/2009

    Étudier l'algorithme de descente récursive et le système de construction grammaticale à l'aide de l'analyseur lexical Lex. Écrire un programme d'interprétation de langage de balisage HTML. Vérification de la séquence de saisie pour l'exactitude de la saisie en tant que fonction générale du programme.

    test, ajouté le 25/12/2012

Nous avons libéré nouveau livre"Le marketing de contenu dans dans les réseaux sociaux: Comment entrer dans la tête de vos abonnés et les faire tomber amoureux de votre marque.

HTML est un langage de balisage hypertexte.

Le langage est utilisé pour organiser les pages Web. Faisons une analogie. Vous achetez un journal. Plusieurs articles y ont été publiés. Chaque article a un titre et contient des photographies. Et le texte est tapé dans plusieurs colonnes. C'est la structure d'une page de journal.

Tout se passe sur le site Web de la même manière. Pour créer la structure correcte de l'article - le contenu - vous devez utiliser un langage de balisage de texte.

A quoi sert le HTML ?

HTML est utilisé pour indiquer au navigateur comment afficher une page à l'écran.

La langue est omniprésente. Il s'agit d'un outil universel pour concevoir du contenu sur une page. Il peut être utilisé dans n'importe quel navigateur. Si vous écrivez du code dans un langage de programmation, vous devez connaître certaines fonctionnalités, opérateurs, types de données, etc.

HTML se compose d'un ensemble de balises - commandes et d'attributs - propriétés. Ils sont faciles à mémoriser et des documents de référence sont toujours disponibles.

Qu'est-ce que le code HTML

Le code indique au navigateur comment afficher la page. Il existe une structure qui doit toujours être respectée. Par exemple, n’ayant qu’un seul en-tête H1 sur une page, les informations principales sont placées dans des sections, etc.

Il existe trois instruments dans la langue.

Il existe deux types de balises : jumelées et simples.

Structure du code HTML sur la page

Nous avons dit que la structure de tout document HTML est toujours la même. Ci-dessous, nous listons les éléments requis.

  • ! - indique que le document utilise HTML.
  • ... - tout le code de la page est placé dans cette balise. Tout ce qui n'y est pas placé n'est pas reconnu par le navigateur et n'est pas affiché.
  • ... est une balise appariée qui contient des informations techniques, par exemple sur l'encodage du document.
  • ... est le titre de la page, il est placé à l'intérieur de la section d'en-tête. Chaque page doit avoir son propre nom unique.
  • ... sont des informations exclusives. Il connecte des styles individuels à la page - CSS, etc. Il n'est pas affiché à l'utilisateur.
  • ... - corps de la page. Toutes les informations de base sont contenues dans cette balise.
  • ...- des hyperliens.
  • - Images.
  • ... - vignette.
  • ...- italique.
  • Il peut y avoir un nombre illimité d’éléments à l’intérieur du corps.

    Par exemple, voici à quoi ressemble une partie du code de la page d’un de nos articles de blog.

    Plus vous utilisez souvent les balises, plus elles sont mémorisées rapidement. Vous pouvez toujours trouver un répertoire avec toutes les balises, attributs et leurs significations.

    Langages de balisage légers

    Les langages conçus pour une rédaction facile et rapide de texte dans un simple éditeur de texte sont appelés allégé(fr:Langage de balisage léger). Caractéristiques de ces langages :

    • Fonctions minimales.
    • Un petit ensemble de balises prises en charge.
    • Facile à apprendre.
    • Le texte source dans cette langue se lit avec la même facilité que le document fini.

    Ils sont utilisés lorsqu'une personne doit préparer du texte dans un éditeur de texte classique (blogs, forums, wikis), ou lorsqu'il est important qu'un utilisateur disposant d'un éditeur de texte régulier éditeur de texte pourrait également lire le texte. Voici quelques langages de balisage légers couramment utilisés :

    • Balisage wiki (voir Wikipédia : Comment éditer des articles)
    • Divers systèmes d'auto-documentation (par exemple, Javadoc).
    Histoire

    Le terme « balisage » vient de l’expression « balisage » ( marquage, marquage- Anglais) de la pratique éditoriale traditionnelle consistant à placer des notes conditionnelles spéciales dans les marges et dans le texte d'un manuscrit ou d'une épreuve avant de l'envoyer à l'impression. Ainsi, les « hommes du balisage » indiquaient la police, le style et la taille de la police pour chaque partie du texte. De nos jours, le balisage du texte est effectué par des éditeurs, des correcteurs, des graphistes - et, bien sûr, par les auteurs eux-mêmes.

    GenCode

    L'idée d'utiliser des langages de balisage dans le traitement de texte informatique a probablement été introduite pour la première fois par William Tunnicliffe. William W. Tunnicliffe) lors d'une conférence en 1967. Il a lui-même appelé sa proposition « codage universel » (eng. "codage générique"). Dans les années 1970, Tunnicliffe a dirigé le développement de la norme GenCode pour l'industrie de l'édition et est devenu plus tard le chef de l'un des comités de l'Organisation internationale de normalisation (ISO). Organisation internationale de normalisation), qui a créé SGML, le premier langage de balisage descriptif. Brian Reid (ur. Brian Reid) dans sa thèse, qu'il a soutenue en 1980 à l'Université Carnegie. L'université de Carnegie Mellon), dans le développement du concept proposé, a réalisé la mise en œuvre pratique du balisage descriptif.

    Cependant, de nos jours, le « père » des langages de balisage est généralement appelé le chercheur d'IBM Charles Goldfarb. Charles Goldfarb). Le concept de base lui est né en 1969, alors qu'il travaillait sur un système primitif de gestion de documents destiné aux cabinets d'avocats. La même année, il participe à la création du langage IBM GML, introduit pour la première fois en 1973.

    Certaines premières implémentations de langages de balisage informatique peuvent être trouvées dans les utilitaires de typographie UNIX tels que troff et nroff. Ils permettent d'insérer des commandes de formatage dans le texte d'un document pour le formater selon les exigences de l'éditeur.

    Disponibilité de logiciels de publication avec fonction WYSIWYG "Ce que vous voyez est ce que vous obtenez"- "ce que vous voyez est ce que vous obtenez") a remplacé la plupart de ces langages parmi les utilisateurs ordinaires, bien que les travaux d'édition sérieux utilisent toujours le balisage pour des structures de texte non visuelles spécifiques, et les éditeurs WYSIWYG enregistrent désormais le plus souvent les documents dans des formats basés sur langages de balisage .

    Texas

    Un autre standard de publication important est TeX, créé puis amélioré par Donald Knuth dans les années 70 et 80 du XXe siècle. TeX rassemble des fonctionnalités de formatage de texte et de description de polices de haute qualité, en particulier pour les livres de mathématiques de qualité professionnelle. Cela a obligé Knuth à passer beaucoup de temps à apprendre l'art de la composition. Cependant, TeX s'est dégradé, de sorte qu'il est désormais principalement utilisé dans monde scientifique, où est la norme de facto dans de nombreux disciplines scientifiques. En plus de Tech, il existe LaTeX, qui est un système de balisage descriptif largement utilisé basé sur TeX.

    Scribe, GML et SGML

    Le premier langage avec une distinction claire et distincte entre la structure et l'apparence du document fut Scribe, créé et décrit dans la thèse de doctorat de Brian Reid en 1980. Scribe était révolutionnaire dans le nombre de façons dont il pouvait être traité, notamment parce qu'il introduisait l'idée de styles, distincts du texte et de la grammaire eux-mêmes, et régissant l'utilisation d'éléments descriptifs. Scribe a influencé le développement de GML (plus tard SGML) et est également l'ancêtre direct de HTML et LaTeX.

    Au début des années 1980, l'idée selon laquelle le balisage devait se concentrer sur les aspects structurels d'un document et laisser la représentation externe du document à l'interprète a conduit à la création de SGML. Le langage a été développé par un comité dirigé par Goldfarb. Il a combiné des idées provenant de nombreuses sources, notamment du projet Tunnikoflick, GenCode. Sharon Adler, Anders Berglund et James A. Marke étaient également des membres clés du comité SGML.

    SGML a défini avec précision la syntaxe pour inclure le balisage dans le texte, et a également décrit séparément quelles balises sont autorisées et où (DTD - Document Type Definition). Cela a permis aux auteurs de créer et d'utiliser n'importe quel balisage de leur choix, en choisissant les balises à utiliser et en leur donnant des noms dans un langage normal. Ainsi, SGML doit être considéré comme un métalangage ; plusieurs langues spéciales les marques proviennent de lui. La fin des années 1980 a vu l'émergence de nouveaux langages de balisage basés sur SGML, tels que TEI et DocBook.

    En 1986, SGML a été publié en tant que norme internationale sous le numéro ISO 8879. SGML a été largement accepté et a été largement utilisé dans de très grands projets. Cependant, il s'est généralement avéré lourd et difficile à apprendre, avec pour effet secondaire de vouloir en faire trop et d'être trop flexible. Par exemple, SGML a créé des balises de fermeture (ou des balises d'ouverture, ou même les deux) pas toujours nécessaires car il pensait que ce balisage serait ajouté manuellement par le personnel de support du projet qui apprécierait les économies de frappe.

    HTML

    En 1991, l'utilisation de SGML était limitée aux programmes professionnels et aux bases de données, et les outils WYSIWYG (qui stockaient les documents dans des formats binaires propriétaires) étaient utilisés pour d'autres programmes de traitement de documents. La situation a changé lorsque Sir Tim Berners-Lee a entendu parler de SGML grâce à son collègue Anders Bergland. Anders Berglund) et d'autres collaborateurs du CERN, ont utilisé la syntaxe SGML pour créer du HTML. Le langage présentait des similitudes avec d'autres langages de balisage basés sur la syntaxe SGML, mais il était beaucoup plus facile de démarrer, même pour les développeurs qui ne l'avaient jamais fait auparavant. Steven DeRose a soutenu que l'utilisation du HTML balisage descriptif(et SGML en particulier) est un facteur majeur dans le développement du Web car il a été conçu pour la flexibilité et l'extensibilité (ainsi que d'autres facteurs dont la notion d'URL et la libre utilisation par les navigateurs). De nos jours, HTML est le langage de balisage le plus attrayant et le plus utilisé au monde.

    Cependant, le statut du HTML en tant que langage de balisage est contesté par certains informaticiens. Leur principal argument est que HTML restreint le placement des balises, exigeant que les deux balises soient imbriquées dans d'autres balises ou dans les balises principales du document. En conséquence, ces chercheurs considèrent le HTML comme un langage conteneur qui suit un modèle hiérarchique.

    XML

    XML (Extensible Markup Language) est un langage de méta-balisage largement utilisé de nos jours. XML a été développé par le World Wibe Web Consortium au sein d'un comité dirigé par Jon Bosak. L'objectif principal de XML est d'être plus simple que SGML et de se concentrer sur un problème spécifique : les documents sur Internet. XML est un méta-langage comme SGML, les utilisateurs sont autorisés à créer toutes les balises dont ils ont besoin (d'où "extensible"). L'essor du XML a été favorisé par le fait que chaque document XML pouvait être écrit de la même manière qu'un document SGML, et que les programmes et les utilisateurs utilisant SGML pouvaient migrer assez facilement vers XML.

    Cependant, XML a perdu de nombreuses fonctionnalités orientées vers l'humain de SGML qui le rendaient plus facile à utiliser (jusqu'à ce qu'il augmente la quantité de balisage et retrouve la lisibilité et l'éditabilité au même niveau). D'autres améliorations ont corrigé certains problèmes SGML au niveau international et ont permis d'analyser un document de manière hiérarchique même si aucune DTD n'était disponible.

    XML a été conçu principalement pour les environnements semi-structurés tels que les documents et les publications. Cependant, il a trouvé un juste milieu entre flexibilité et simplicité, et il a été rapidement adopté par de nombreux utilisateurs. XML est désormais largement utilisé pour transférer des données entre programmes. Comme HTML, il peut être caractérisé comme un langage « conteneur ».

    XHTML

    À partir de janvier 2000, toutes les recommandations du W3C étaient basées sur XML plutôt que sur SGML, et l'acronyme XHTML (Extensible HyperText Markup Languge) a été proposé. Les spécifications du langage exigeaient que les documents XHTML soient formatés comme des documents XML, ce qui permet d'utiliser XHTML pour des documents plus clairs et plus précis en utilisant des balises HTML.

    L'une des différences les plus remarquables entre HTML et XHTML est la règle selon laquelle toutes les balises doivent être fermées : les balises vides, par exemple, doivent toutes deux être fermées par une balise de fermeture standard ou une entrée spéciale : (l'espace avant le "/" dans le la balise de fermeture est facultative, mais souvent utilisée car certains navigateurs pré-XML et analyseurs SGML l'utilisent). Les autres attributs des balises doivent être entre guillemets. Enfin, toutes les balises et noms d’attributs doivent être écrits en minuscules pour être lus correctement ; HTML n'est pas sensible à la casse.

    Autres développements basés sur XML

    De nombreux développements basés sur XML sont désormais utilisés, tels que RDF (Resource Description Framework), XFORMS, DocBook, SOAP et OWL (Ontology Web Language).

    Particularités

    Une caractéristique commune à tous les langages de balisage est qu'ils mélangent le texte du document avec les instructions de balisage dans un flux de données ou un fichier. Cela n'est pas nécessaire ; il est possible d'isoler le balisage du texte à l'aide de pointeurs, d'étiquettes, d'identifiants ou d'autres techniques de coordination. Ce « balisage séparé » est typique de la représentation interne des programmes qui fonctionnent avec des documents balisés. Cependant, le balisage intégré ou « en ligne » est plus accepté ailleurs. Voici, par exemple, une petite partie du texte balisé en HTML :

    Anatidés

    La famille Anatidés comprend les canards, les oies et les cygnes, mais pas les hurleurs étroitement apparentés.

    Le code d’instruction de balisage (appelé balises) est placé entre crochets angulaires. Le texte entre ces instructions est le texte du document. Codes h1, p Et em- des exemples de balisage structurel, ils décrivent la position, le but ou le sens du texte qui y est inclus.

    Plus précisément, h1 signifie "ceci est un titre de premier niveau" p signifie « ceci est un paragraphe », et em signifie « ceci est le mot ou la phrase souligné ». Le programme d'interprétation peut appliquer ces règles ou styles pour afficher différentes parties du texte, en utilisant différentes polices de caractères, tailles de police, espacement, couleur ou autres styles selon les besoins. Une balise telle que h1 peut, par exemple, être présentée dans une grande police typographique en gras, ou dans un document avec du texte à espacement fixe (comme sur une machine à écrire), elle peut être soulignée ou ne pas changer du tout d'apparence.

    Pour le contraste, étiquetez je en HTML - un exemple de balisage visuel ; il est généralement utilisé pour identifier des caractéristiques spécifiques du texte (utilisez la police italique dans ce bloc) sans expliquer pourquoi.

    TEI (Tex Encoding Initiative) a publié des documents d'orientation complets pour guider l'encodage du texte au profit de l'humanité et des sociétés scientifiques. Ces manuels étaient utilisés pour encoder des documents historiques, des ouvrages spécifiques de scientifiques, des périodiques, etc.

    Utilisations alternatives

    Bien que l'idée d'utiliser des langages de balisage avec des documents texte ait évolué, elle a accru l'utilisation de langages de balisage dans d'autres domaines, suggérant qu'ils peuvent être utilisés pour représenter divers types d'informations, notamment des listes de lecture, des graphiques vectoriels, des contenus Web. services et interfaces utilisateur. La plupart de ces applications sont basées sur XML car il s'agit d'un langage bien structuré et extensible.

    L'utilisation de XHTML montre également qu'il peut être combiné avec différents langages de balisage du même profil, tels que XHTML+SMIL ou XHTML+MathML+SVG.

    (Standard Generalized Markup Language), présenté dans la norme ISO 8879. Ce langage est adopté comme langage principal pour la conception de la documentation technique, y compris les manuels techniques électroniques interactifs pour les produits créés à l'aide des technologies CALS.

    SGML définit la structure des documents comme une séquence d'objets de données. Les objets de données représentant des parties d'un document peuvent être stockés dans différents fichiers. La norme SGML établit un ensemble de symboles et de règles de représentation des informations qui permettent à différents systèmes de reconnaître et d'identifier correctement ces informations. Ces ensembles sont décrits dans une partie distincte du document appelée déclaration DTD.(Document Type Decfinition), qui est transmis avec le document SGML principal. La DTD précise la correspondance des caractères et leurs codes, les longueurs maximales des identifiants utilisés, la manière dont sont représentés les délimiteurs des balises, les autres conventions possibles, la syntaxe DTD, ainsi que le type et la version du document. Par conséquent, SGML peut être appelé métalangage pour une famille de langages de balisage spécifiques. En particulier, les langages de balisage XML peuvent être considérés comme des sous-ensembles de SGML. et HTML.

    La description technique sous forme de document SGML comprend :

    • fichier principal avec manuel technique, marqué de balises SGML ;
    • description des entités, si le document appartient à un groupe dans lequel les mêmes entités sont utilisées et leur connaissance est implicite ;
    • un dictionnaire pour expliquer les balises SGML ;

    Cependant, SGML est difficile à apprendre et à utiliser. Donc pour large application balisage dans les documents soumis au WWW-technologies, en 1991, un langage HTML simplifié a été développé basé sur SGML(HyperText Markup Language), et en 1996 le langage XML(eXtensible Markup Language), qui, en combinaison avec HTML, devient le langage principal de présentation de documents dans diverses applications.

    Le langage HTML a été développé pour l'utilisation généralisée du balisage dans les documents présentés dans les technologies du WWW.

    Une description HTML se compose de texte ASCII et d'une séquence de commandes (codes de contrôle) incluses, également appelées descripteurs ou balises. Ce texte est appelé un document HTML, ou une page HTML, ou lorsqu'il est publié sur un serveur Web, une page Web.. Les balises sont placées aux bons endroits dans le texte source ; elles déterminent les polices, les traits d’union et l’apparence. images graphiques, liens, etc. Lors de l'utilisation des éditeurs WWW, les commandes sont insérées en appuyant simplement sur les touches appropriées.

    XML, comme HTML, est considéré comme un sous-ensemble de SGML. Actuellement, le langage XML prétend être le principal langage de présentation de documents dans informatique, il peut être considéré comme un métalangage qui sert de base à la création de langages de balisage privés dans diverses applications. Dans le même temps, XML est plus pratique que SGML, ce qui est assuré par l'élimination de certaines fonctionnalités mineures de SGML dans XML. Les descriptions en XML sont plus faciles à comprendre et adaptées pour être utilisées dans les navigateurs modernes tout en conservant les fonctionnalités principales de SGML.

    Pour des applications spécifiques, leurs propres versions de XML sont créées, appelées dictionnaires XML ou applications XML. Ainsi, pour décrire des textes avec des symbolisme mathématique L'application XML OSD (Open Software Description) a été développée. L'option Product Definition eXchange (PDX) dédiée à l'échange de données est intéressante pour CALS. Il existe des dictionnaires bien connus pour la chimie (CML - Chemical Markup Language), la biologie (BSML - Bioinformatic Sequence Markup Language), etc.



    Lire aussi :