نشانه گذاری ساختاری یک سند وب با استفاده از آن ارائه می شود. ببینید "زبان نشانه گذاری" در فرهنگ های دیگر چیست. زبان نشانه گذاری HTML

زبان های نشانه گذاری

زبان نشانه گذاری (متن) در اصطلاحات کامپیوتری مجموعه ای از نمادها یا توالی هایی است که برای انتقال اطلاعات در مورد خروجی یا ساختار آن در متن وارد می شود. متعلق به کلاس زبان های کامپیوتر است. یک سند متنی که با استفاده از زبان نشانه گذاری نوشته شده است، نه تنها خود متن (به عنوان دنباله ای از کلمات و علائم نقطه گذاری)، بلکه اطلاعات اضافی در مورد بخش های مختلف آن را نیز در بر می گیرد - به عنوان مثال، نشانی از سرفصل ها، برجسته ها، لیست ها و غیره. بیشتر موارد دشوارزبان نشانه گذاری به شما امکان می دهد عناصر و محتوای تعاملی را از اسناد دیگر در یک سند وارد کنید.

لازم به ذکر است که زبان نشانه گذاری تورینگ ناقص است و به طور کلی به عنوان یک زبان برنامه نویسی در نظر گرفته نمی شود، اگرچه به طور دقیق اینطور است.

HTML (از انگلیسی) زبان نشانه گذاری HyperText-- "زبان نشانه گذاری فرامتن") - توسط دانشمند بریتانیایی تیم برنرز لی در حدود 1986-1991 در مرکز تحقیقات هسته ای اروپا در ژنو (سوئیس) ایجاد شد. HTML به عنوان یک زبان برای تبادل اسناد علمی و فنی، مناسب برای استفاده توسط افرادی که در زمینه چیدمان متخصص نیستند، ایجاد شده است. HTML با تعریف مجموعه کوچکی از عناصر ساختاری و معنایی به نام توصیفگر با موفقیت با پیچیدگی SGML مقابله کرد. توصیف کننده ها نیز اغلب "برچسب" نامیده می شوند. با استفاده از HTML به راحتی می توانید یک سند نسبتا ساده اما با طراحی زیبا ایجاد کنید. علاوه بر ساده سازی ساختار سند، پشتیبانی از فرامتن به HTML اضافه شده است. قابلیت های چند رسانه ای بعداً اضافه شد.

در ابتدا، زبان HTML به عنوان ابزاری برای ساختار و قالب بندی اسناد بدون پیوند آنها با ابزارهای بازتولید (نمایش) تصور و ایجاد شد. در حالت ایده‌آل، متن با نشانه‌گذاری HTML باید بدون تحریف‌های سبکی و ساختاری روی تجهیزاتی با تجهیزات فنی مختلف (صفحه رنگی یک رایانه مدرن، صفحه تک رنگ سازمان‌دهنده، صفحه نمایش با اندازه محدود تلفن همراه یا دستگاه، و برنامه‌های صوتی بازتولید شود. پخش متون). با این حال، استفاده مدرن از HTML بسیار دور از هدف اصلی خود است. مثلا تگ کنید

، چندین بار برای قالب بندی صفحه استفاده می شود، برای ایجاد رایج ترین جداول در اسناد در نظر گرفته شده است. در طول سال ها، ایده اصلی استقلال پلت فرم HTML به نفع نیازهای چند رسانه ای و گرافیکی مدرن قربانی شده است.

XML هایکس کشش پذیرم آرکوپL زبان-- زبان نشانه گذاری توسعه پذیر؛ تلفظ شده [ ex-em-eml]) یک زبان نشانه گذاری است که توسط کنسرسیوم وب جهانی (W3C) توصیه می شود. مشخصات XML اسناد XML را توصیف می کند و تا حدی رفتار پردازنده های XML (برنامه هایی که اسناد XML را می خوانند و دسترسی به محتوای آنها را فراهم می کنند) را توصیف می کند. XML به عنوان زبانی با نحو رسمی ساده، مناسب برای ایجاد و پردازش اسناد توسط برنامه‌ها، و در عین حال راحت برای انسان برای خواندن و ایجاد اسناد، با تأکید بر استفاده در اینترنت طراحی شده است. زبان توسعه پذیر نامیده می شود زیرا نشانه گذاری مورد استفاده در اسناد را اصلاح نمی کند: توسعه دهنده آزاد است که نشانه گذاری را مطابق با نیازهای یک دامنه خاص ایجاد کند که فقط توسط قوانین نحوی زبان محدود می شود. ترکیبی از یک نحو رسمی ساده، دوستی انسان، توسعه پذیری، و همچنین مبتنی بر رمزگذاری های یونیکد برای نمایش محتوای اسناد، منجر به استفاده گسترده از خود XML و بسیاری از زبان های تخصصی مشتق شده مبتنی بر XML در سطح گسترده ای شده است. انواع نرم افزار

XHTML Eایکس کشش پذیراچ yperتی داخلیم آرکوپL زبان-- Extensible Hypertext Markup Language) خانواده ای از زبان های نشانه گذاری صفحه وب مبتنی بر XML است که قابلیت های HTML 4 را تکرار و گسترش می دهد. مشخصات XHTML 1.0 و XHTML 1.1 توصیه های کنسرسیوم وب جهانی است، اما توسعه آن در حال حاضر با توصیه به استفاده از HTML متوقف شده است. نسخه های جدید XHTML منتشر نشده است.

تفاوت اصلی بین XHTML و HTML نحوه پردازش سند است. اسناد XHTML توسط ماژول خود (تجزیه کننده) به همان روشی که اسناد XML پردازش می شوند. در طول این پردازش، خطاهای ایجاد شده توسط توسعه دهندگان اصلاح نمی شود.

XHTML با مشخصات SGML مطابقت دارد زیرا XML زیرمجموعه ای از آن است. HTML دارای ویژگی های بسیاری در فرآیند پردازش است و در واقع دیگر به خانواده SGML تعلق ندارد که در پیش نویس مشخصات HTML 5 گنجانده شده است.

مرورگر یک تجزیه کننده را برای پردازش سند بر اساس هدر نوع محتوا از سرور انتخاب می کند:

· HTML - text/html

· XHTML - برنامه/xhtml+xml

· برای مشاهده محلی روی مشتری، انتخاب بر اساس پسوند فایل است.

· در اینترنت اکسپلورر تا نسخه 8، هیچ تجزیه کننده ای برای پردازش اسناد XHTML وجود ندارد.

WML (انگلیسی) زبان نشانه گذاری بی سیم- "زبان نشانه گذاری بی سیم") یک زبان نشانه گذاری سند برای استفاده در تلفن های همراه و سایر دستگاه های تلفن همراه با استفاده از استاندارد WAP است.

ساختار شبیه یک HTML تا حدودی ساده شده است، اما تفاوت‌های کلیدی نیز وجود دارد، زیرا WML برای دستگاه‌هایی است که قابلیت‌های رایانه‌های شخصی را ندارند (صفحه نمایش کوچک، همه دستگاه‌ها نمی‌توانند گرافیک، اندازه حافظه کوچک و غیره را نمایش دهند): همه اطلاعات در WML در به اصطلاح "عرشه" (eng. عرشه). دسامبر حداقل بلوک داده ای است که می تواند توسط سرور منتقل شود. عرشه ها حاوی "کارت" هستند ( کارت) (هر نقشه با برچسب ها و ) محدود می شود. همیشه باید حداقل یک کارت در یک عرشه وجود داشته باشد، اما ممکن است چندین کارت وجود داشته باشد. در همان زمان، تنها یک کارت در هر زمان بر روی صفحه نمایش دستگاه نمایش داده می شود و کاربر می تواند با دنبال کردن پیوندها بین آنها جابجا شود - این برای کاهش تعداد درخواست ها برای اطلاعات به سرور انجام می شود. در عین حال، اندازه صفحات WML نباید بیش از 1-4 کیلوبایت باشد.

VML (انگلیسی) زبان نشانه گذاری برداری-- زبان نشانه گذاری برداری) که توسط مایکروسافت برای توصیف گرافیک های برداری توسعه یافته است. VML در سال 1998 توسط مایکروسافت، Macromedia و دیگران به W3C معرفی شد.در همان زمان، Adobe، Sun و چندین شرکت دیگر مقالاتی را در مورد PGML ارائه کردند. هر دوی این زبان ها بعداً مبنای SVG شدند.

PGML (زبان نشانه گذاری گرافیکی دقیق، به زبان روسی ترجمه شده است - "زبان نشانه گذاری گرافیکی دقیق") یک زبان نشانه گذاری مبتنی بر XML است که برای توصیف گرافیک های برداری در یک صفحه وب (نمودارها، عناصر رابط فردی) در قالب متن در قالب استفاده می شود. XML از یک مدل ساخت تصویر مشابه PDF و PostScript استفاده می کند. در سال 1998 توسط Adobe Systems، IBM، Netscape Communications و Sun Microsystems به کنسرسیوم W3C ارائه شد، اما به عنوان توصیه پذیرفته نشد. تقریباً همزمان، مایکروسافت پروژه VML خود را برای بررسی ارائه کرد و یک سال بعد یک زبان پیشرفته تر SVG بر اساس ایده دو فناوری توسعه یافت. SVG توسط W3C توصیه شده است و به فرمت اصلی برای توصیف گرافیک برداری در یک صفحه وب تبدیل شده است.

SVG (از انگلیسی. اس قابل تماسV اکتورجی رافیک- گرافیک برداری مقیاس پذیر) - زبان نشانه گذاری گرافیک برداری مقیاس پذیر، ایجاد شده توسط کنسرسیوم وب جهانی (W3C) و زیرمجموعه ای از زبان نشانه گذاری توسعه پذیر XML، برای توصیف گرافیک های برداری دو بعدی و ترکیبی بردار/راستر در XML در نظر گرفته شده است. قالب از گرافیک های تعاملی ثابت و متحرک پشتیبانی می کند - یا به عبارت دیگر، بیانی و اسکریپت. توصیف اشیاء سه بعدی را پشتیبانی نمی کند. این یک استاندارد باز است که توصیه کنسرسیوم W3C است، سازمانی که استانداردهایی مانند HTML و XHTML را توسعه داده است. SVG بر اساس زبان های نشانه گذاری VML و PGML است. از سال 1999 توسعه یافته است.

XBRL هایکس کشش پذیرب استفادهآر صادراتL زبان، روشن شد. زبان گزارشگری تجاری توسعه پذیر یک استاندارد باز برای ارائه صورت های مالی به صورت الکترونیکی است. قالب XBRL بر اساس زبان نشانه گذاری قابل توسعه XML است. XBRL از نحو XML و همچنین فناوری های مرتبط با XML مانند فضای نام XML، طرحواره XML، XLink و XPath استفاده می کند. یکی از اهداف XBRL ارائه و تبادل اطلاعات مالی مانند صورت های مالی شرکت است. مشخصات زبان XBRL توسط سازمان بین المللی مستقل XBRL International, Inc توسعه و منتشر شده است.

برای بهبود درک بصری وب، فناوری CSS به طور گسترده ای مورد استفاده قرار گرفته است که به شما امکان می دهد سبک های طراحی یکنواخت را برای بسیاری از صفحات وب تنظیم کنید. نوآوری دیگری که ارزش توجه دارد، سیستم نامگذاری منابع URN (انگلیسی) است. نام یکنواخت منبع).

یک مفهوم رایج برای توسعه شبکه جهانی وب، ایجاد یک وب معنایی است. وب معنایی یک افزونه برای وب جهانی موجود است که برای درک بیشتر اطلاعات ارسال شده در شبکه برای رایانه ها طراحی شده است. وب معنایی مفهومی از شبکه ای است که در آن هر منبعی به زبان انسانی با توصیفی ارائه می شود که یک کامپیوتر بتواند آن را درک کند. وب معنایی بدون در نظر گرفتن پلتفرم و بدون توجه به زبان های برنامه نویسی، دسترسی به اطلاعات کاملاً ساختار یافته را برای هر برنامه ای باز می کند. برنامه ها می توانند منابع لازم را پیدا کنند، اطلاعات را پردازش کنند، داده ها را طبقه بندی کنند، ارتباطات منطقی را شناسایی کنند، نتیجه گیری کنند و حتی بر اساس این نتیجه گیری ها تصمیم بگیرند. اگر وب معنایی به طور گسترده مورد پذیرش و پیاده سازی عاقلانه قرار گیرد، پتانسیل ایجاد یک انقلاب در اینترنت را دارد. برای ایجاد یک توصیف قابل خواندن توسط کامپیوتر از یک منبع، وب معنایی از قالب RDF (انگلیسی) استفاده می کند. چارچوب شرح منابع) که مبتنی بر نحو XML است و از URI برای شناسایی منابع استفاده می کند. محصولات جدید در این زمینه RDFS (eng. طرحواره RDF) و SPARQL (eng. پروتکل و زبان پرس و جو RDF) یک زبان پرس و جو جدید برای دسترسی سریع به داده های RDF.

مال خودتو بفرست کار خوببه پایگاه دانش به سادگی. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

اسناد مشابه

    تعریف مفهوم فرامتن. بخش های اصلی یک سند SGML تاریخچه ایجاد زبان نشانه گذاری سند استاندارد HTML. تفاوت بین سینتکس XHTML و HTML RSS خانواده ای از فرمت های XML برای توصیف فیدهای خبری است. استفاده از زبان نشانه گذاری KML

    ارائه، اضافه شده در 2014/02/15

    مبانی زبان برنامه نویسی صفحه وب - HTML. انواع اطلاعاتی که یک صفحه وب می تواند شامل شود: متن، گرافیک، صدا، انیمیشن و ویدئو. جعبه ابزار برای ایجاد صفحات وب ویرایشگرهای اصلی HTML که برای طراحی وب استفاده می شوند.

    چکیده، اضافه شده در 1390/01/19

    ویژگی های عمومیزبان نشانه گذاری فرامتن ساختار سند HTML مروری بر ویژگی های اصلی HTML. عناصر طراحی مدرن صفحات وب تحلیل و بررسی کاربرد عملی HTML (با استفاده از مثال برنامه های آموزشی).

    کار دوره، اضافه شده در 2012/11/24

    برچسب ها و ویژگی های اصلی زبان HTML. ایجاد یک وب سایت که باید از چندین صفحه به هم پیوسته تشکیل شده باشد. توجه معانی مختلفویژگی ها و برچسب ها در صفحات و اسناد دیگر. فرم های صفحه نمایش صفحات توسعه یافته

    کارهای آزمایشگاهی، اضافه شده در 1393/04/16

    نشانه گذاری چیست. زبان نشانه گذاری مجموعه ای از قراردادهای قالب بندی است که برای رمزگذاری بلوک های متن استفاده می شود. امکان فرمت های SGML، HTML، XML، تاریخچه ایجاد، ویژگی های کاربرد، کنترل بر قرار دادن اطلاعات.

    چکیده، اضافه شده در 2010/03/22

    زبان جدیدنشانه گذاری فرامتن XHTML. اعتبارسنجی اسناد XHTML، تعیین نوع آنها. اشتباهات رایج در نشانه گذاری XHTML انطباق عامل کاربر استفاده از XHTML با فضاهای نام دیگر. گسترش معنای HTML

    کار دوره، اضافه شده در 2009/07/14

    مطالعه الگوریتم نزول بازگشتی و سیستم ساخت گرامر با استفاده از تحلیلگر واژگانی Lex. نوشتن یک برنامه مفسر زبان نشانه گذاری HTML. بررسی توالی ورودی برای صحت ورودی به عنوان یک تابع کلی از برنامه.

    تست، اضافه شده در 2012/12/25

آزاد کردیم کتاب جدید"بازاریابی محتوا در در شبکه های اجتماعی: چگونه به ذهن مشترکین خود وارد شوید و آنها را عاشق برند خود کنید."

HTML یک زبان نشانه گذاری فرامتن است.

این زبان برای سازماندهی صفحات وب استفاده می شود. بیایید یک قیاس کنیم. شما در حال خرید روزنامه هستید. چندین مقاله در آن منتشر شد. هر مقاله دارای عنوان و حاوی عکس است. و متن در چندین ستون تایپ می شود. این ساختار یک صفحه روزنامه است.

همه چیز در وب سایت به همین ترتیب اتفاق می افتد. برای ایجاد ساختار صحیح مقاله - محتوا - باید از زبان نشانه گذاری متن استفاده کنید.

HTML برای چیست؟

HTML برای اینکه به مرورگر بگوید چگونه یک صفحه را روی صفحه نمایش دهد استفاده می شود.

زبان در همه جا وجود دارد. این یک ابزار جهانی برای طراحی محتوا در یک صفحه است. در هر مرورگری قابل استفاده است. اگر به زبان برنامه نویسی کد می نویسید، باید برخی از ویژگی ها، عملگرها، انواع داده ها و غیره را بشناسید.

HTML از مجموعه ای از برچسب ها - دستورات و ویژگی ها - خصوصیات تشکیل شده است. آنها به راحتی قابل یادآوری هستند و مواد مرجع همیشه در دسترس هستند.

کد HTML چیست؟

کد دستورالعملی است برای مرورگر که چگونه صفحه را نمایش دهد. ساختاری وجود دارد که همیشه باید رعایت شود. به عنوان مثال با داشتن تنها یک هدر H1 در یک صفحه، اطلاعات اصلی در بخش ها و غیره قرار می گیرد.

سه ساز در زبان وجود دارد.

دو نوع تگ وجود دارد - جفتی و تکی.

ساختار کد HTML در صفحه

گفتیم که ساختار هر سند html همیشه یکسان است. در زیر عناصر مورد نیاز را فهرست می کنیم.

  • ! - نشان می دهد که سند از HTML استفاده می کند.
  • ... - تمام کدهای صفحه در این تگ قرار می گیرد. هر چیزی که در آن قرار نمی گیرد توسط مرورگر شناسایی نمی شود و نمایش داده نمی شود.
  • ... یک تگ جفتی است که حاوی اطلاعات فنی، به عنوان مثال، در مورد رمزگذاری سند است.
  • ... عنوان صفحه است، داخل قسمت head قرار می گیرد. هر صفحه ای باید نام منحصر به فرد خود را داشته باشد.
  • ... اطلاعات اختصاصی است. استایل های فردی را به صفحه متصل می کند - css و غیره. به کاربر نمایش داده نمی شود.
  • ... - بدنه صفحه. تمام اطلاعات اولیه در این تگ موجود است.
  • ...- هایپرلینک ها
  • - تصاویر.
  • ... - بند انگشتی.
  • ...- ایتالیک
  • می تواند تعداد نامحدودی از عناصر در داخل بدن وجود داشته باشد.

    به عنوان مثال، بخشی از کد صفحه برای یکی از پست های وبلاگ ما به این شکل است.

    هر چه بیشتر از برچسب ها استفاده کنید، سریعتر به خاطر سپرده می شوند. شما همیشه می توانید یک دایرکتوری با تمام برچسب ها، ویژگی ها و معانی آنها پیدا کنید.

    زبان های نشانه گذاری سبک

    زبان هایی که برای نوشتن آسان و سریع متن در یک ویرایشگر متن ساده طراحی شده اند نامیده می شوند سبک شده(en:Lightweight markup language). ویژگی های چنین زبان هایی:

    • حداقل توابع
    • مجموعه کوچکی از برچسب های پشتیبانی شده
    • آسان برای یادگیری.
    • متن مبدأ در این زبان به همان راحتی سند تمام شده خوانده می شود.

    از آنها در جایی استفاده می شود که یک شخص مجبور است متنی را در یک ویرایشگر متن معمولی (وبلاگ ها، انجمن ها، ویکی ها) آماده کند، یا در جایی که مهم است که کاربر با یک ویرایشگر معمولی ویرایشگر متنهمچنین می تواند متن را بخواند. در اینجا چند زبان نشانه گذاری سبک که معمولاً استفاده می شود آورده شده است:

    • نشانه گذاری ویکی (به ویکی پدیا مراجعه کنید: نحوه ویرایش مقاله ها)
    • سیستم های اسناد خودکار مختلف (به عنوان مثال، Javadoc).
    داستان

    اصطلاح "نشانه گذاری" از عبارت "علامت گذاری" می آید ( علامت گذاری, علامت گذاری- انگلیسی) از رویه سنتی انتشارات قرار دادن یادداشت های مشروط خاص در حاشیه و در متن نسخه خطی یا اثبات قبل از ارسال آن برای چاپ. بنابراین، "مردان نشانه گذاری" نوع، سبک و اندازه فونت را برای هر قسمت از متن نشان می دهد. امروزه نشانه گذاری متن توسط ویراستاران، مصححان، طراحان گرافیک – و البته توسط خود نویسندگان انجام می شود.

    GenCode

    ایده استفاده از زبان های نشانه گذاری در پردازش کلمات کامپیوتری به احتمال زیاد اولین بار توسط ویلیام تونیکلیف مطرح شد. ویلیام دبلیو تونیکلیف) در کنفرانسی در سال 1967. او خود پیشنهاد خود را "کدگذاری جهانی" نامید (eng. "کدگذاری عمومی"). در دهه 1970، Tunnicliffe توسعه استاندارد GenCode را برای صنعت نشر رهبری کرد و بعداً رئیس یکی از کمیته های سازمان بین المللی استاندارد (ISO) شد. سازمان بین المللی استاندارد سازی) که SGML، اولین زبان نشانه گذاری توصیفی را ایجاد کرد. برایان رید (ur. برایان رید) در پایان نامه خود که در سال 1980 در دانشگاه کارنگی از آن دفاع کرد. دانشگاه کارنگی ملون، در توسعه مفهوم پیشنهادی، پیاده سازی عملی نشانه گذاری توصیفی را انجام داد.

    با این حال، امروزه «پدر» زبان‌های نشانه‌گذاری معمولاً چارلز گلدفارب، محقق IBM نامیده می‌شود. چارلز گلدفارب). مفهوم اصلی در سال 1969 برای او متولد شد، در حالی که روی یک سیستم مدیریت اسناد اولیه که برای شرکت های حقوقی در نظر گرفته شده بود کار می کرد. در همان سال او در ایجاد زبان IBM GML شرکت کرد که اولین بار در سال 1973 معرفی شد.

    برخی از پیاده سازی های اولیه زبان های نشانه گذاری رایانه را می توان در ابزارهای تایپوگرافی یونیکس مانند troff و nroff یافت. آنها به شما اجازه می دهند دستورات قالب بندی را در متن یک سند وارد کنید تا آن را مطابق با نیازهای ویرایشگر قالب بندی کنید.

    در دسترس بودن نرم افزار انتشار با عملکرد WYSIWYG "آنچه که می بینی همانست که بدست می آوری"- "آنچه می بینید همان چیزی است که به دست می آورید") جایگزین بسیاری از این زبان ها در بین کاربران عادی شده است، اگرچه کارهای جدی انتشاراتی هنوز از نشانه گذاری برای ساختارهای متنی غیر بصری خاص استفاده می کنند و ویرایشگران WYSIWYG اکنون اغلب اسناد را در قالب های مبتنی بر ذخیره می کنند. زبان های نشانه گذاری

    TeX

    یکی دیگر از استانداردهای مهم انتشار، TeX است که توسط دونالد کنوت در دهه‌های 70 و 80 قرن بیستم ایجاد شد و متعاقباً بهبود یافت. TeX قابلیت های قالب بندی متن و توصیف فونت با کیفیت بالا را به خصوص برای کتاب های ریاضی با کیفیت حرفه ای گرد هم می آورد. این امر مستلزم آن بود که کنوت زمان زیادی را صرف یادگیری هنر حروفچینی کند. با این حال، TeX روندی نزولی را طی کرده است، به طوری که در حال حاضر در درجه اول استفاده می شود دنیای علمی، استاندارد واقعی در بسیاری از کجاست رشته های علمی. علاوه بر Tech، LaTeX وجود دارد که یک سیستم نشانه گذاری توصیفی پرکاربرد مبتنی بر TeX است.

    Scribe، GML و SGML

    اولین زبان با تمایز واضح و متمایز بین ساختار سند و ظاهر سند Scribe بود که در پایان نامه دکترای برایان رید در سال 1980 ایجاد و شرح داده شد. Scribe از نظر تعداد روش‌هایی که می‌توانست پردازش شود انقلابی بود، به ویژه به دلیل معرفی ایده سبک‌ها، جدا از متن و دستور زبان واقعی، و حاکم بر استفاده از عناصر توصیفی. Scribe بر توسعه GML (بعدها SGML) تأثیر گذاشت و همچنین جد مستقیم HTML و LaTeX است.

    در اوایل دهه 1980، این ایده که نشانه گذاری باید بر جنبه های ساختاری یک سند متمرکز شود و نمایش خارجی سند را به مترجم واگذار کند، منجر به ایجاد SGML شد. این زبان توسط کمیته ای به سرپرستی گلدفارب توسعه داده شد. او ایده های بسیاری از منابع، از جمله پروژه Tunnikoflick، GenCode را ترکیب کرد. شارون آدلر، آندرس برگلوند و جیمز آ. مارکه نیز اعضای کلیدی کمیته SGML بودند.

    SGML به طور دقیق نحوی را برای گنجاندن نشانه گذاری در متن تعریف کرد و همچنین به طور جداگانه توضیح داد که کدام برچسب ها و کجا مجاز هستند (DTD - تعریف نوع سند). این به نویسندگان این امکان را می‌دهد تا هر نشانه‌گذاری را که می‌خواهند ایجاد و استفاده کنند، تگ‌هایی را که می‌خواهند انتخاب کنند و نام‌هایی را به زبان معمولی به آن‌ها بدهند. بنابراین، SGML باید یک فرا زبان در نظر گرفته شود. چندگانه زبان های خاصنشانه ها از او سرچشمه گرفته است. اواخر دهه 1980 شاهد ظهور زبان‌های نشانه‌گذاری جدید مبتنی بر SGML، مانند TEI و DocBook بودیم.

    در سال 1986، SGML به عنوان یک استاندارد بین المللی با شماره ISO 8879 منتشر شد. SGML مقبولیت گسترده ای پیدا کرده است و به طور گسترده در پروژه های بسیار بزرگ مورد استفاده قرار گرفته است. با این حال، به طور کلی پیدا شد که یادگیری آن دست و پا گیر و دشوار است، با عارضه جانبی زبان این است که سعی می کند بیش از حد انجام دهد و بیش از حد انعطاف پذیر باشد. برای مثال، SGML همیشه تگ‌های بستن (یا تگ‌های باز، یا حتی هر دو) را ایجاد نمی‌کند، زیرا معتقد بود که این نشانه‌گذاری به صورت دستی توسط کارکنان پشتیبانی پروژه اضافه می‌شود که از صرفه‌جویی در فشار دادن کلید قدردانی می‌کنند.

    HTML

    تا سال 1991، استفاده از SGML به برنامه‌های تجاری و پایگاه‌های داده محدود شد و ابزارهای WYSIWYG (که اسناد را در قالب‌های باینری اختصاصی ذخیره می‌کرد) برای سایر برنامه‌های پردازش اسناد استفاده می‌شد. وقتی سر تیم برنرز لی از همکارش آندرس برگلند درباره SGML یاد گرفت، وضعیت تغییر کرد. آندرس برگلوند) و سایر همکاران در CERN، از نحو SGML برای ایجاد HTML استفاده کردند. این زبان شباهت‌هایی با سایر زبان‌های نشانه‌گذاری مبتنی بر نحو SGML داشت، اما شروع با آن بسیار آسان‌تر بود، حتی برای توسعه‌دهندگانی که قبلاً آن را انجام نداده بودند. استیون دروز استدلال کرد که HTML با استفاده از نشانه گذاری توصیفی(و SGML به طور خاص) یک عامل اصلی در توسعه وب است زیرا برای انعطاف پذیری و گسترش (و همچنین عوامل دیگر از جمله مفهوم URL ها و استفاده رایگان توسط مرورگرها) طراحی شده است. امروزه HTML جذاب ترین و پرکاربردترین زبان نشانه گذاری در جهان است.

    با این حال، وضعیت HTML به عنوان یک زبان نشانه گذاری توسط برخی از دانشمندان کامپیوتر مورد مناقشه است. استدلال اصلی آنها این است که HTML قرار دادن تگ ها را محدود می کند و لازم است هر دو تگ در تگ های دیگر یا درون تگ های اصلی سند تودرتو باشند. در نتیجه، این محققان HTML را یک زبان ظرفی می دانند که از یک مدل سلسله مراتبی پیروی می کند.

    XML

    XML (زبان نشانه گذاری توسعه پذیر) یک زبان نشانه گذاری متا است که امروزه به طور گسترده مورد استفاده قرار می گیرد. XML توسط کنسرسیوم World Wibe Web در کمیته ای به ریاست Jon Bosak توسعه داده شد. هدف اصلی XML ساده تر از SGML و تمرکز بر روی یک مشکل خاص - اسناد در اینترنت است. XML یک زبان فرا زبانی مانند SGML است، کاربران اجازه دارند هر برچسبی را که نیاز دارند ایجاد کنند (از این رو "قابل توسعه"). به ظهور XML کمک شد زیرا هر سند XML را می‌توان به روشی مشابه یک سند SGML نوشت و برنامه‌ها و کاربرانی که از SGML استفاده می‌کردند می‌توانستند به راحتی به XML مهاجرت کنند.

    با این حال، XML بسیاری از ویژگی‌های انسان محور SGML را که استفاده از آن را آسان‌تر می‌کرد، از دست داد (تا زمانی که میزان نشانه‌گذاری را افزایش داد و قابلیت خوانایی و ویرایش را در همان سطح به دست آورد). سایر پیشرفت‌ها برخی از مشکلات SGML را در سطح بین‌المللی تصحیح کردند و تجزیه یک سند را به صورت سلسله مراتبی حتی اگر DTD در دسترس نبود ممکن ساخت.

    XML در درجه اول برای محیط های نیمه ساختار یافته مانند اسناد و نشریات طراحی شده است. با این حال، بین انعطاف پذیری و سادگی، رسانه ای خوشحال کننده ایجاد کرد و به سرعت توسط بسیاری از کاربران پذیرفته شد. XML در حال حاضر به طور گسترده ای برای انتقال داده ها بین برنامه ها استفاده می شود. مانند HTML، می توان آن را به عنوان یک زبان "کانتینر" مشخص کرد.

    XHTML

    از ژانویه 2000، تمام توصیه های W3C بر اساس XML بود نه SGML، و مخفف XHTML (Extensible HyperText Markup Languge) پیشنهاد شد. مشخصات زبان ایجاب می کند که اسناد XHTML به صورت اسناد XML قالب بندی شوند، این به XHTML اجازه می دهد تا برای اسناد واضح تر و دقیق تر با استفاده از برچسب های HTML استفاده شود.

    یکی از قابل توجه ترین تفاوت های بین HTML و XHTML این قانون است که همه برچسب ها باید بسته شوند: به عنوان مثال، تگ های خالی باید هر دو با یک برچسب بسته شدن استاندارد یا یک ورودی خاص بسته شوند: (فاصله قبل از "/" در تگ بستن اختیاری است، اما اغلب استفاده می شود زیرا برخی از مرورگرهای پیش از XML و تجزیه کننده های SGML از آن استفاده می کنند. سایر ویژگی های برچسب ها باید در گیومه باشند. در نهایت، تمام برچسب ها و نام ویژگی ها باید با حروف کوچک نوشته شوند تا به درستی خوانده شوند. HTML به حروف بزرگ و کوچک حساس نیست.

    سایر پیشرفت های مبتنی بر XML

    بسیاری از پیشرفت‌های مبتنی بر XML در حال حاضر در حال استفاده هستند، مانند RDF (چارچوب توصیف منبع)، XFORMS، DocBook، SOAP و OWL (زبان وب هستی‌شناسی).

    ویژگی های خاص

    ویژگی مشترک همه زبان‌های نشانه‌گذاری این است که متن سند را با دستورالعمل‌های نشانه‌گذاری در یک جریان داده یا فایل ترکیب می‌کنند. این ضروری نیست، می توان نشانه گذاری را از متن با استفاده از نشانگرها، برچسب ها، شناسه ها یا سایر تکنیک های هماهنگی جدا کرد. این "نشانه گذاری جداگانه" برای نمایش داخلی برنامه هایی که با اسناد علامت گذاری شده کار می کنند، معمول است. با این حال، نشانه گذاری جاسازی شده یا "داخلی" در جاهای دیگر پذیرفته شده است. برای مثال، در اینجا قسمت کوچکی از متن با استفاده از HTML علامت گذاری شده است:

    آناتیدها

    خانواده آناتیدهاشامل اردک‌ها، غازها و قوها می‌شود، اما نه جیغ‌زنان نزدیک به هم.

    کد دستورالعمل نشانه گذاری (معروف به برچسب) در براکت های زاویه ای محصور شده است. متن بین این دستورالعمل ها متن سند است. کدها h1, پو ما- نمونه هایی از نشانه گذاری ساختاری، آنها موقعیت، هدف یا معنای متن موجود در آنها را توصیف می کنند.

    دقیقتر، h1به معنی "این یک عنوان سطح اول است" پبه معنی "این یک پاراگراف است" و مابه معنای "این کلمه یا عبارتی است که زیر آن خط کشیده شده است." برنامه تفسیر می تواند این قوانین یا سبک ها را برای نمایش قسمت های مختلف متن، با استفاده از حروف، اندازه فونت، فاصله، رنگ یا سبک های دیگر در صورت لزوم اعمال کند. برای مثال، برچسبی مانند h1 ممکن است با فونت تایپوگرافی بزرگ و پررنگ ارائه شود، یا در سندی با متن تک فاصله (مانند ماشین تحریر) زیر آن خط کشیده شود یا ظاهر آن اصلاً تغییر نکند.

    برای کنتراست، تگ کنید مندر HTML - نمونه ای از نشانه گذاری بصری. معمولاً برای شناسایی ویژگی های خاص متن (استفاده از حروف ایتالیک در این بلوک) بدون توضیح دلیل استفاده می شود.

    TEI (Tex Encoding Initiative) اسناد راهنمای جامعی را برای هدایت رمزگذاری متن به نفع بشریت و جوامع علمی منتشر کرده است. از این کتابچه ها برای رمزگذاری اسناد تاریخی، آثار خاص دانشمندان، نشریات ادواری و غیره استفاده می شد.

    کاربردهای جایگزین

    در حالی که ایده استفاده از زبان‌های نشانه‌گذاری با اسناد متنی تکامل یافته است، استفاده از زبان‌های نشانه‌گذاری را در مناطق دیگر افزایش داده است، که نشان می‌دهد می‌توان از آنها برای نمایش انواع مختلف اطلاعات، از جمله لیست‌های پخش، گرافیک برداری، وب استفاده کرد. خدمات و رابط های کاربری اکثر این برنامه ها مبتنی بر XML هستند زیرا یک زبان ساختار یافته و قابل توسعه است.

    استفاده از XHTML همچنین نشان می‌دهد که می‌توان آن را با زبان‌های نشانه‌گذاری مختلف از یک نمایه مانند XHTML+SMIL یا XHTML+MathML+SVG ترکیب کرد.

    (Standard Generalized Markup Language)، ارائه شده در استاندارد ISO 8879. این زبان به عنوان زبان اصلی برای طراحی مستندات فنی، از جمله کتابچه راهنمای فنی الکترونیکی تعاملی پذیرفته شده است.برای محصولات ایجاد شده با استفاده از فناوری CALS.

    SGML ساختار اسناد را به عنوان دنباله ای از اشیاء داده تعریف می کند. اشیاء داده‌ای که بخش‌هایی از یک سند را نشان می‌دهند می‌توانند در فایل‌های مختلف ذخیره شوند. استاندارد SGML مجموعه ای از نمادها و قوانین را برای نمایش اطلاعات ایجاد می کند که به سیستم های مختلف اجازه می دهد این اطلاعات را به درستی شناسایی و شناسایی کنند. این مجموعه ها در قسمت جداگانه ای از سند به نام اعلامیه DTD توضیح داده شده است(Document Type Decfinition) که همراه با سند اصلی SGML منتقل می شود. DTD مطابقت کاراکترها و کدهای آنها، حداکثر طول شناسه های مورد استفاده، نحوه نمایش جداکننده ها برای برچسب ها، سایر قراردادهای ممکن، نحو DTD، و نوع و نسخه سند را مشخص می کند. بنابراین، SGML را می توان یک فرازبان برای خانواده ای از زبان های نشانه گذاری خاص نامید. به طور خاص، زبان های نشانه گذاری XML را می توان زیر مجموعه های SGML در نظر گرفتو HTML.

    توضیحات فنی در قالب یک سند SGML شامل:

    • فایل اصلی با راهنمای فنی، با برچسب های SGML مشخص شده است.
    • شرح موجودیت هادر صورتی که سند متعلق به گروهی باشد که در آنها از همان موجودات استفاده شده و شهرت آنها دلالت دارد.
    • فرهنگ لغت برای توضیح برچسب های SGML.

    با این حال، یادگیری و استفاده از SGML دشوار است. بنابراین برای کاربرد گستردهنشانه گذاری در اسناد ارسال شده به WWW-technologies، در سال 1991، یک زبان HTML ساده بر اساس SGML توسعه یافت(زبان نشانه گذاری HyperText)، و در سال 1996 زبان XML(EXtensible Markup Language) که در ترکیب با HTML به زبان اصلی برای ارائه اسناد در برنامه های مختلف تبدیل می شود.

    زبان HTML برای استفاده گسترده از نشانه گذاری در اسناد ارائه شده در فناوری های WWW توسعه یافته است.

    توضیحات HTML شامل متن ASCII و دنباله ای از دستورات (کدهای کنترل) موجود در آن است که به آنها توصیفگر یا برچسب نیز می گویند. این متن یک سند HTML یا یک صفحه HTML نامیده می شود، یا زمانی که در یک وب سرور پست می شود، یک صفحه وب نامیده می شود.. برچسب ها در مکان های مناسب در متن منبع قرار می گیرند؛ آنها فونت ها، خط تیره و ظاهر را تعیین می کنند تصاویر گرافیکی، پیوندها و غیره هنگام استفاده از ویرایشگرهای WWW، دستورات به سادگی با فشار دادن کلیدهای مربوطه وارد می شوند.

    XML نیز مانند HTML زیرمجموعه ای از SGML در نظر گرفته می شود. در حال حاضر، زبان XML ادعا می کند که زبان اصلی برای ارائه اسناد است فناوری اطلاعات، می توان آن را به عنوان یک فرازبان در نظر گرفت که به عنوان پایه ای برای ایجاد زبان های نشانه گذاری خصوصی در برنامه های مختلف عمل می کند. در عین حال، XML راحت‌تر از SGML است که با حذف برخی از ویژگی‌های جزئی SGML در XML تضمین می‌شود. توضیحات در XML برای استفاده در مرورگرهای مدرن آسان‌تر استضمن حفظ ویژگی های اصلی SGML.

    برای برنامه های خاص، نسخه های خود از XML ایجاد می شود که به آنها فرهنگ لغت XML یا برنامه های کاربردی XML می گویند. بنابراین، برای توصیف متون با خاص نمادگرایی ریاضیبرنامه XML OSD (شرح نرم افزار باز) توسعه یافته است. مورد علاقه CALS گزینه Product Definition eXchange (PDX) است که به تبادل داده اختصاص داده شده است. فرهنگ لغت هایی برای شیمی (CML - Chemical Markup Language)، زیست شناسی (BSML - Bioinformatic Sequence Markup Language) و غیره وجود دارد.



    همچنین بخوانید: