زبان نشانه گذاری (متن) در اصطلاحات کامپیوتری مجموعه ای از نمادها یا توالی هایی است که برای انتقال اطلاعات در مورد خروجی یا ساختار آن در متن وارد می شود. متعلق به کلاس زبان های کامپیوتر است. یک سند متنی که با استفاده از زبان نشانه گذاری نوشته شده است، نه تنها خود متن (به عنوان دنباله ای از کلمات و علائم نقطه گذاری)، بلکه اطلاعات اضافی در مورد بخش های مختلف آن را نیز در بر می گیرد - به عنوان مثال، نشانی از سرفصل ها، برجسته ها، لیست ها و غیره. بیشتر موارد دشوارزبان نشانه گذاری به شما امکان می دهد عناصر و محتوای تعاملی را از اسناد دیگر در یک سند وارد کنید.
لازم به ذکر است که زبان نشانه گذاری تورینگ ناقص است و به طور کلی به عنوان یک زبان برنامه نویسی در نظر گرفته نمی شود، اگرچه به طور دقیق اینطور است.
در ابتدا، زبان HTML به عنوان ابزاری برای ساختار و قالب بندی اسناد بدون پیوند آنها با ابزارهای بازتولید (نمایش) تصور و ایجاد شد. در حالت ایدهآل، متن با نشانهگذاری HTML باید بدون تحریفهای سبکی و ساختاری روی تجهیزاتی با تجهیزات فنی مختلف (صفحه رنگی یک رایانه مدرن، صفحه تک رنگ سازماندهنده، صفحه نمایش با اندازه محدود تلفن همراه یا دستگاه، و برنامههای صوتی بازتولید شود. پخش متون). با این حال، استفاده مدرن از HTML بسیار دور از هدف اصلی خود است. مثلا تگ کنید
، چندین بار برای قالب بندی صفحه استفاده می شود، برای ایجاد رایج ترین جداول در اسناد در نظر گرفته شده است. در طول سال ها، ایده اصلی استقلال پلت فرم HTML به نفع نیازهای چند رسانه ای و گرافیکی مدرن قربانی شده است.
XML هایکس
کشش پذیرم
آرکوپL
زبان-- زبان نشانه گذاری توسعه پذیر؛ تلفظ شده [ ex-em-eml]) یک زبان نشانه گذاری است که توسط کنسرسیوم وب جهانی (W3C) توصیه می شود. مشخصات XML اسناد XML را توصیف می کند و تا حدی رفتار پردازنده های XML (برنامه هایی که اسناد XML را می خوانند و دسترسی به محتوای آنها را فراهم می کنند) را توصیف می کند. XML به عنوان زبانی با نحو رسمی ساده، مناسب برای ایجاد و پردازش اسناد توسط برنامهها، و در عین حال راحت برای انسان برای خواندن و ایجاد اسناد، با تأکید بر استفاده در اینترنت طراحی شده است. زبان توسعه پذیر نامیده می شود زیرا نشانه گذاری مورد استفاده در اسناد را اصلاح نمی کند: توسعه دهنده آزاد است که نشانه گذاری را مطابق با نیازهای یک دامنه خاص ایجاد کند که فقط توسط قوانین نحوی زبان محدود می شود. ترکیبی از یک نحو رسمی ساده، دوستی انسان، توسعه پذیری، و همچنین مبتنی بر رمزگذاری های یونیکد برای نمایش محتوای اسناد، منجر به استفاده گسترده از خود XML و بسیاری از زبان های تخصصی مشتق شده مبتنی بر XML در سطح گسترده ای شده است. انواع نرم افزار
XHTML Eایکس
کشش پذیراچ
yperتی
داخلیم
آرکوپL
زبان-- Extensible Hypertext Markup Language) خانواده ای از زبان های نشانه گذاری صفحه وب مبتنی بر XML است که قابلیت های HTML 4 را تکرار و گسترش می دهد. مشخصات XHTML 1.0 و XHTML 1.1 توصیه های کنسرسیوم وب جهانی است، اما توسعه آن در حال حاضر با توصیه به استفاده از HTML متوقف شده است. نسخه های جدید XHTML منتشر نشده است.
تفاوت اصلی بین XHTML و HTML نحوه پردازش سند است. اسناد XHTML توسط ماژول خود (تجزیه کننده) به همان روشی که اسناد XML پردازش می شوند. در طول این پردازش، خطاهای ایجاد شده توسط توسعه دهندگان اصلاح نمی شود.
XHTML با مشخصات SGML مطابقت دارد زیرا XML زیرمجموعه ای از آن است. HTML دارای ویژگی های بسیاری در فرآیند پردازش است و در واقع دیگر به خانواده SGML تعلق ندارد که در پیش نویس مشخصات HTML 5 گنجانده شده است.
مرورگر یک تجزیه کننده را برای پردازش سند بر اساس هدر نوع محتوا از سرور انتخاب می کند:
· HTML - text/html
· XHTML - برنامه/xhtml+xml
· برای مشاهده محلی روی مشتری، انتخاب بر اساس پسوند فایل است.
· در اینترنت اکسپلورر تا نسخه 8، هیچ تجزیه کننده ای برای پردازش اسناد XHTML وجود ندارد.
WML (انگلیسی) زبان نشانه گذاری بی سیم- "زبان نشانه گذاری بی سیم") یک زبان نشانه گذاری سند برای استفاده در تلفن های همراه و سایر دستگاه های تلفن همراه با استفاده از استاندارد WAP است.
ساختار شبیه یک HTML تا حدودی ساده شده است، اما تفاوتهای کلیدی نیز وجود دارد، زیرا WML برای دستگاههایی است که قابلیتهای رایانههای شخصی را ندارند (صفحه نمایش کوچک، همه دستگاهها نمیتوانند گرافیک، اندازه حافظه کوچک و غیره را نمایش دهند): همه اطلاعات در WML در به اصطلاح "عرشه" (eng. عرشه). دسامبر حداقل بلوک داده ای است که می تواند توسط سرور منتقل شود. عرشه ها حاوی "کارت" هستند ( کارت) (هر نقشه با برچسب ها و ) محدود می شود. همیشه باید حداقل یک کارت در یک عرشه وجود داشته باشد، اما ممکن است چندین کارت وجود داشته باشد. در همان زمان، تنها یک کارت در هر زمان بر روی صفحه نمایش دستگاه نمایش داده می شود و کاربر می تواند با دنبال کردن پیوندها بین آنها جابجا شود - این برای کاهش تعداد درخواست ها برای اطلاعات به سرور انجام می شود. در عین حال، اندازه صفحات WML نباید بیش از 1-4 کیلوبایت باشد.
VML (انگلیسی) زبان نشانه گذاری برداری-- زبان نشانه گذاری برداری) که توسط مایکروسافت برای توصیف گرافیک های برداری توسعه یافته است. VML در سال 1998 توسط مایکروسافت، Macromedia و دیگران به W3C معرفی شد.در همان زمان، Adobe، Sun و چندین شرکت دیگر مقالاتی را در مورد PGML ارائه کردند. هر دوی این زبان ها بعداً مبنای SVG شدند.
PGML (زبان نشانه گذاری گرافیکی دقیق، به زبان روسی ترجمه شده است - "زبان نشانه گذاری گرافیکی دقیق") یک زبان نشانه گذاری مبتنی بر XML است که برای توصیف گرافیک های برداری در یک صفحه وب (نمودارها، عناصر رابط فردی) در قالب متن در قالب استفاده می شود. XML از یک مدل ساخت تصویر مشابه PDF و PostScript استفاده می کند. در سال 1998 توسط Adobe Systems، IBM، Netscape Communications و Sun Microsystems به کنسرسیوم W3C ارائه شد، اما به عنوان توصیه پذیرفته نشد. تقریباً همزمان، مایکروسافت پروژه VML خود را برای بررسی ارائه کرد و یک سال بعد یک زبان پیشرفته تر SVG بر اساس ایده دو فناوری توسعه یافت. SVG توسط W3C توصیه شده است و به فرمت اصلی برای توصیف گرافیک برداری در یک صفحه وب تبدیل شده است.
SVG (از انگلیسی. اس
قابل تماسV
اکتورجی
رافیک- گرافیک برداری مقیاس پذیر) - زبان نشانه گذاری گرافیک برداری مقیاس پذیر، ایجاد شده توسط کنسرسیوم وب جهانی (W3C) و زیرمجموعه ای از زبان نشانه گذاری توسعه پذیر XML، برای توصیف گرافیک های برداری دو بعدی و ترکیبی بردار/راستر در XML در نظر گرفته شده است. قالب از گرافیک های تعاملی ثابت و متحرک پشتیبانی می کند - یا به عبارت دیگر، بیانی و اسکریپت. توصیف اشیاء سه بعدی را پشتیبانی نمی کند. این یک استاندارد باز است که توصیه کنسرسیوم W3C است، سازمانی که استانداردهایی مانند HTML و XHTML را توسعه داده است. SVG بر اساس زبان های نشانه گذاری VML و PGML است. از سال 1999 توسعه یافته است.
XBRL هایکس
کشش پذیرب
استفادهآر
صادراتL
زبان، روشن شد. زبان گزارشگری تجاری توسعه پذیر یک استاندارد باز برای ارائه صورت های مالی به صورت الکترونیکی است. قالب XBRL بر اساس زبان نشانه گذاری قابل توسعه XML است. XBRL از نحو XML و همچنین فناوری های مرتبط با XML مانند فضای نام XML، طرحواره XML، XLink و XPath استفاده می کند. یکی از اهداف XBRL ارائه و تبادل اطلاعات مالی مانند صورت های مالی شرکت است. مشخصات زبان XBRL توسط سازمان بین المللی مستقل XBRL International, Inc توسعه و منتشر شده است.
برای بهبود درک بصری وب، فناوری CSS به طور گسترده ای مورد استفاده قرار گرفته است که به شما امکان می دهد سبک های طراحی یکنواخت را برای بسیاری از صفحات وب تنظیم کنید. نوآوری دیگری که ارزش توجه دارد، سیستم نامگذاری منابع URN (انگلیسی) است. نام یکنواخت منبع).
یک مفهوم رایج برای توسعه شبکه جهانی وب، ایجاد یک وب معنایی است. وب معنایی یک افزونه برای وب جهانی موجود است که برای درک بیشتر اطلاعات ارسال شده در شبکه برای رایانه ها طراحی شده است. وب معنایی مفهومی از شبکه ای است که در آن هر منبعی به زبان انسانی با توصیفی ارائه می شود که یک کامپیوتر بتواند آن را درک کند. وب معنایی بدون در نظر گرفتن پلتفرم و بدون توجه به زبان های برنامه نویسی، دسترسی به اطلاعات کاملاً ساختار یافته را برای هر برنامه ای باز می کند. برنامه ها می توانند منابع لازم را پیدا کنند، اطلاعات را پردازش کنند، داده ها را طبقه بندی کنند، ارتباطات منطقی را شناسایی کنند، نتیجه گیری کنند و حتی بر اساس این نتیجه گیری ها تصمیم بگیرند. اگر وب معنایی به طور گسترده مورد پذیرش و پیاده سازی عاقلانه قرار گیرد، پتانسیل ایجاد یک انقلاب در اینترنت را دارد. برای ایجاد یک توصیف قابل خواندن توسط کامپیوتر از یک منبع، وب معنایی از قالب RDF (انگلیسی) استفاده می کند. چارچوب شرح منابع) که مبتنی بر نحو XML است و از URI برای شناسایی منابع استفاده می کند. محصولات جدید در این زمینه RDFS (eng. طرحواره RDF) و SPARQL (eng. پروتکل و زبان پرس و جو RDF) یک زبان پرس و جو جدید برای دسترسی سریع به داده های RDF.
مال خودتو بفرست کار خوببه پایگاه دانش به سادگی. از فرم زیر استفاده کنید دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.
اسناد مشابه
تعریف مفهوم فرامتن. بخش های اصلی یک سند SGML تاریخچه ایجاد زبان نشانه گذاری سند استاندارد HTML. تفاوت بین سینتکس XHTML و HTML RSS خانواده ای از فرمت های XML برای توصیف فیدهای خبری است. استفاده از زبان نشانه گذاری KML
ارائه، اضافه شده در 2014/02/15
مبانی زبان برنامه نویسی صفحه وب - HTML. انواع اطلاعاتی که یک صفحه وب می تواند شامل شود: متن، گرافیک، صدا، انیمیشن و ویدئو. جعبه ابزار برای ایجاد صفحات وب ویرایشگرهای اصلی HTML که برای طراحی وب استفاده می شوند.
چکیده، اضافه شده در 1390/01/19
ویژگی های عمومیزبان نشانه گذاری فرامتن ساختار سند HTML مروری بر ویژگی های اصلی HTML. عناصر طراحی مدرن صفحات وب تحلیل و بررسی کاربرد عملی HTML (با استفاده از مثال برنامه های آموزشی).
کار دوره، اضافه شده در 2012/11/24
برچسب ها و ویژگی های اصلی زبان HTML. ایجاد یک وب سایت که باید از چندین صفحه به هم پیوسته تشکیل شده باشد. توجه معانی مختلفویژگی ها و برچسب ها در صفحات و اسناد دیگر. فرم های صفحه نمایش صفحات توسعه یافته
کارهای آزمایشگاهی، اضافه شده در 1393/04/16
نشانه گذاری چیست. زبان نشانه گذاری مجموعه ای از قراردادهای قالب بندی است که برای رمزگذاری بلوک های متن استفاده می شود. امکان فرمت های SGML، HTML، XML، تاریخچه ایجاد، ویژگی های کاربرد، کنترل بر قرار دادن اطلاعات.
چکیده، اضافه شده در 2010/03/22
زبان جدیدنشانه گذاری فرامتن XHTML. اعتبارسنجی اسناد XHTML، تعیین نوع آنها. اشتباهات رایج در نشانه گذاری XHTML انطباق عامل کاربر استفاده از XHTML با فضاهای نام دیگر. گسترش معنای HTML
کار دوره، اضافه شده در 2009/07/14
مطالعه الگوریتم نزول بازگشتی و سیستم ساخت گرامر با استفاده از تحلیلگر واژگانی Lex. نوشتن یک برنامه مفسر زبان نشانه گذاری HTML. بررسی توالی ورودی برای صحت ورودی به عنوان یک تابع کلی از برنامه.
تست، اضافه شده در 2012/12/25
آزاد کردیم کتاب جدید"بازاریابی محتوا در در شبکه های اجتماعی: چگونه به ذهن مشترکین خود وارد شوید و آنها را عاشق برند خود کنید."
![](https://i2.wp.com/semantica.in/wp-content/uploads/2017/11/html-2.jpg)
HTML یک زبان نشانه گذاری فرامتن است.
این زبان برای سازماندهی صفحات وب استفاده می شود. بیایید یک قیاس کنیم. شما در حال خرید روزنامه هستید. چندین مقاله در آن منتشر شد. هر مقاله دارای عنوان و حاوی عکس است. و متن در چندین ستون تایپ می شود. این ساختار یک صفحه روزنامه است.
همه چیز در وب سایت به همین ترتیب اتفاق می افتد. برای ایجاد ساختار صحیح مقاله - محتوا - باید از زبان نشانه گذاری متن استفاده کنید.
HTML برای چیست؟ HTML برای اینکه به مرورگر بگوید چگونه یک صفحه را روی صفحه نمایش دهد استفاده می شود.
زبان در همه جا وجود دارد. این یک ابزار جهانی برای طراحی محتوا در یک صفحه است. در هر مرورگری قابل استفاده است. اگر به زبان برنامه نویسی کد می نویسید، باید برخی از ویژگی ها، عملگرها، انواع داده ها و غیره را بشناسید.
HTML از مجموعه ای از برچسب ها - دستورات و ویژگی ها - خصوصیات تشکیل شده است. آنها به راحتی قابل یادآوری هستند و مواد مرجع همیشه در دسترس هستند.
کد HTML چیست؟ کد دستورالعملی است برای مرورگر که چگونه صفحه را نمایش دهد. ساختاری وجود دارد که همیشه باید رعایت شود. به عنوان مثال با داشتن تنها یک هدر H1 در یک صفحه، اطلاعات اصلی در بخش ها و غیره قرار می گیرد.
![](https://i0.wp.com/semantica.in/wp-content/uploads/2018/02/5cf1e9aa64.png)
سه ساز در زبان وجود دارد.
- تگ یک فرمان است. مستقیماً به عمل اشاره می کند. مثلا،
- ویژگی های تگ افزودنی به دستورات هستند. آنها به شما این امکان را می دهند تا عملکرد موجود در تگ را سفارشی کنید. مثلا،
- مقدار ویژگی - دقیقاً توضیح می دهد که چگونه ویژگی باید اصلاح شود.
- - با بازگشت به این مثال، "site" مقدار ویژگی است.
![](https://i1.wp.com/semantica.in/wp-content/uploads/2018/02/f390e80ae3.png)
دو نوع تگ وجود دارد - جفتی و تکی.
ساختار کد HTML در صفحه گفتیم که ساختار هر سند html همیشه یکسان است. در زیر عناصر مورد نیاز را فهرست می کنیم.
! - نشان می دهد که سند از HTML استفاده می کند.
... - تمام کدهای صفحه در این تگ قرار می گیرد. هر چیزی که در آن قرار نمی گیرد توسط مرورگر شناسایی نمی شود و نمایش داده نمی شود.
... یک تگ جفتی است که حاوی اطلاعات فنی، به عنوان مثال، در مورد رمزگذاری سند است. ... عنوان صفحه است، داخل قسمت head قرار می گیرد. هر صفحه ای باید نام منحصر به فرد خود را داشته باشد.
... اطلاعات اختصاصی است. استایل های فردی را به صفحه متصل می کند - css و غیره. به کاربر نمایش داده نمی شود.
... - بدنه صفحه. تمام اطلاعات اولیه در این تگ موجود است. ...- هایپرلینک ها
- تصاویر.
... - بند انگشتی.
...- ایتالیک
می تواند تعداد نامحدودی از عناصر در داخل بدن وجود داشته باشد.
به عنوان مثال، بخشی از کد صفحه برای یکی از پست های وبلاگ ما به این شکل است.
![](https://i0.wp.com/semantica.in/wp-content/uploads/2018/02/f223f68769.jpg)
هر چه بیشتر از برچسب ها استفاده کنید، سریعتر به خاطر سپرده می شوند. شما همیشه می توانید یک دایرکتوری با تمام برچسب ها، ویژگی ها و معانی آنها پیدا کنید.
زبان های نشانه گذاری سبک زبان هایی که برای نوشتن آسان و سریع متن در یک ویرایشگر متن ساده طراحی شده اند نامیده می شوند سبک شده(en:Lightweight markup language). ویژگی های چنین زبان هایی:
- حداقل توابع
- مجموعه کوچکی از برچسب های پشتیبانی شده
- آسان برای یادگیری.
- متن مبدأ در این زبان به همان راحتی سند تمام شده خوانده می شود.
از آنها در جایی استفاده می شود که یک شخص مجبور است متنی را در یک ویرایشگر متن معمولی (وبلاگ ها، انجمن ها، ویکی ها) آماده کند، یا در جایی که مهم است که کاربر با یک ویرایشگر معمولی ویرایشگر متنهمچنین می تواند متن را بخواند. در اینجا چند زبان نشانه گذاری سبک که معمولاً استفاده می شود آورده شده است:
- نشانه گذاری ویکی (به ویکی پدیا مراجعه کنید: نحوه ویرایش مقاله ها)
- سیستم های اسناد خودکار مختلف (به عنوان مثال، Javadoc).
داستان اصطلاح "نشانه گذاری" از عبارت "علامت گذاری" می آید ( علامت گذاری, علامت گذاری- انگلیسی) از رویه سنتی انتشارات قرار دادن یادداشت های مشروط خاص در حاشیه و در متن نسخه خطی یا اثبات قبل از ارسال آن برای چاپ. بنابراین، "مردان نشانه گذاری" نوع، سبک و اندازه فونت را برای هر قسمت از متن نشان می دهد. امروزه نشانه گذاری متن توسط ویراستاران، مصححان، طراحان گرافیک – و البته توسط خود نویسندگان انجام می شود.
GenCode ایده استفاده از زبان های نشانه گذاری در پردازش کلمات کامپیوتری به احتمال زیاد اولین بار توسط ویلیام تونیکلیف مطرح شد. ویلیام دبلیو تونیکلیف) در کنفرانسی در سال 1967. او خود پیشنهاد خود را "کدگذاری جهانی" نامید (eng. "کدگذاری عمومی"). در دهه 1970، Tunnicliffe توسعه استاندارد GenCode را برای صنعت نشر رهبری کرد و بعداً رئیس یکی از کمیته های سازمان بین المللی استاندارد (ISO) شد. سازمان بین المللی استاندارد سازی) که SGML، اولین زبان نشانه گذاری توصیفی را ایجاد کرد. برایان رید (ur. برایان رید) در پایان نامه خود که در سال 1980 در دانشگاه کارنگی از آن دفاع کرد. دانشگاه کارنگی ملون، در توسعه مفهوم پیشنهادی، پیاده سازی عملی نشانه گذاری توصیفی را انجام داد.
با این حال، امروزه «پدر» زبانهای نشانهگذاری معمولاً چارلز گلدفارب، محقق IBM نامیده میشود. چارلز گلدفارب). مفهوم اصلی در سال 1969 برای او متولد شد، در حالی که روی یک سیستم مدیریت اسناد اولیه که برای شرکت های حقوقی در نظر گرفته شده بود کار می کرد. در همان سال او در ایجاد زبان IBM GML شرکت کرد که اولین بار در سال 1973 معرفی شد.
برخی از پیاده سازی های اولیه زبان های نشانه گذاری رایانه را می توان در ابزارهای تایپوگرافی یونیکس مانند troff و nroff یافت. آنها به شما اجازه می دهند دستورات قالب بندی را در متن یک سند وارد کنید تا آن را مطابق با نیازهای ویرایشگر قالب بندی کنید.
در دسترس بودن نرم افزار انتشار با عملکرد WYSIWYG "آنچه که می بینی همانست که بدست می آوری"- "آنچه می بینید همان چیزی است که به دست می آورید") جایگزین بسیاری از این زبان ها در بین کاربران عادی شده است، اگرچه کارهای جدی انتشاراتی هنوز از نشانه گذاری برای ساختارهای متنی غیر بصری خاص استفاده می کنند و ویرایشگران WYSIWYG اکنون اغلب اسناد را در قالب های مبتنی بر ذخیره می کنند. زبان های نشانه گذاری
TeX یکی دیگر از استانداردهای مهم انتشار، TeX است که توسط دونالد کنوت در دهههای 70 و 80 قرن بیستم ایجاد شد و متعاقباً بهبود یافت. TeX قابلیت های قالب بندی متن و توصیف فونت با کیفیت بالا را به خصوص برای کتاب های ریاضی با کیفیت حرفه ای گرد هم می آورد. این امر مستلزم آن بود که کنوت زمان زیادی را صرف یادگیری هنر حروفچینی کند. با این حال، TeX روندی نزولی را طی کرده است، به طوری که در حال حاضر در درجه اول استفاده می شود دنیای علمی، استاندارد واقعی در بسیاری از کجاست رشته های علمی. علاوه بر Tech، LaTeX وجود دارد که یک سیستم نشانه گذاری توصیفی پرکاربرد مبتنی بر TeX است.
Scribe، GML و SGML اولین زبان با تمایز واضح و متمایز بین ساختار سند و ظاهر سند Scribe بود که در پایان نامه دکترای برایان رید در سال 1980 ایجاد و شرح داده شد. Scribe از نظر تعداد روشهایی که میتوانست پردازش شود انقلابی بود، به ویژه به دلیل معرفی ایده سبکها، جدا از متن و دستور زبان واقعی، و حاکم بر استفاده از عناصر توصیفی. Scribe بر توسعه GML (بعدها SGML) تأثیر گذاشت و همچنین جد مستقیم HTML و LaTeX است.
در اوایل دهه 1980، این ایده که نشانه گذاری باید بر جنبه های ساختاری یک سند متمرکز شود و نمایش خارجی سند را به مترجم واگذار کند، منجر به ایجاد SGML شد. این زبان توسط کمیته ای به سرپرستی گلدفارب توسعه داده شد. او ایده های بسیاری از منابع، از جمله پروژه Tunnikoflick، GenCode را ترکیب کرد. شارون آدلر، آندرس برگلوند و جیمز آ. مارکه نیز اعضای کلیدی کمیته SGML بودند.
SGML به طور دقیق نحوی را برای گنجاندن نشانه گذاری در متن تعریف کرد و همچنین به طور جداگانه توضیح داد که کدام برچسب ها و کجا مجاز هستند (DTD - تعریف نوع سند). این به نویسندگان این امکان را میدهد تا هر نشانهگذاری را که میخواهند ایجاد و استفاده کنند، تگهایی را که میخواهند انتخاب کنند و نامهایی را به زبان معمولی به آنها بدهند. بنابراین، SGML باید یک فرا زبان در نظر گرفته شود. چندگانه زبان های خاصنشانه ها از او سرچشمه گرفته است. اواخر دهه 1980 شاهد ظهور زبانهای نشانهگذاری جدید مبتنی بر SGML، مانند TEI و DocBook بودیم.
در سال 1986، SGML به عنوان یک استاندارد بین المللی با شماره ISO 8879 منتشر شد. SGML مقبولیت گسترده ای پیدا کرده است و به طور گسترده در پروژه های بسیار بزرگ مورد استفاده قرار گرفته است. با این حال، به طور کلی پیدا شد که یادگیری آن دست و پا گیر و دشوار است، با عارضه جانبی زبان این است که سعی می کند بیش از حد انجام دهد و بیش از حد انعطاف پذیر باشد. برای مثال، SGML همیشه تگهای بستن (یا تگهای باز، یا حتی هر دو) را ایجاد نمیکند، زیرا معتقد بود که این نشانهگذاری به صورت دستی توسط کارکنان پشتیبانی پروژه اضافه میشود که از صرفهجویی در فشار دادن کلید قدردانی میکنند.
HTML تا سال 1991، استفاده از SGML به برنامههای تجاری و پایگاههای داده محدود شد و ابزارهای WYSIWYG (که اسناد را در قالبهای باینری اختصاصی ذخیره میکرد) برای سایر برنامههای پردازش اسناد استفاده میشد. وقتی سر تیم برنرز لی از همکارش آندرس برگلند درباره SGML یاد گرفت، وضعیت تغییر کرد. آندرس برگلوند) و سایر همکاران در CERN، از نحو SGML برای ایجاد HTML استفاده کردند. این زبان شباهتهایی با سایر زبانهای نشانهگذاری مبتنی بر نحو SGML داشت، اما شروع با آن بسیار آسانتر بود، حتی برای توسعهدهندگانی که قبلاً آن را انجام نداده بودند. استیون دروز استدلال کرد که HTML با استفاده از نشانه گذاری توصیفی(و SGML به طور خاص) یک عامل اصلی در توسعه وب است زیرا برای انعطاف پذیری و گسترش (و همچنین عوامل دیگر از جمله مفهوم URL ها و استفاده رایگان توسط مرورگرها) طراحی شده است. امروزه HTML جذاب ترین و پرکاربردترین زبان نشانه گذاری در جهان است.
با این حال، وضعیت HTML به عنوان یک زبان نشانه گذاری توسط برخی از دانشمندان کامپیوتر مورد مناقشه است. استدلال اصلی آنها این است که HTML قرار دادن تگ ها را محدود می کند و لازم است هر دو تگ در تگ های دیگر یا درون تگ های اصلی سند تودرتو باشند. در نتیجه، این محققان HTML را یک زبان ظرفی می دانند که از یک مدل سلسله مراتبی پیروی می کند.
XML XML (زبان نشانه گذاری توسعه پذیر) یک زبان نشانه گذاری متا است که امروزه به طور گسترده مورد استفاده قرار می گیرد. XML توسط کنسرسیوم World Wibe Web در کمیته ای به ریاست Jon Bosak توسعه داده شد. هدف اصلی XML ساده تر از SGML و تمرکز بر روی یک مشکل خاص - اسناد در اینترنت است. XML یک زبان فرا زبانی مانند SGML است، کاربران اجازه دارند هر برچسبی را که نیاز دارند ایجاد کنند (از این رو "قابل توسعه"). به ظهور XML کمک شد زیرا هر سند XML را میتوان به روشی مشابه یک سند SGML نوشت و برنامهها و کاربرانی که از SGML استفاده میکردند میتوانستند به راحتی به XML مهاجرت کنند.
با این حال، XML بسیاری از ویژگیهای انسان محور SGML را که استفاده از آن را آسانتر میکرد، از دست داد (تا زمانی که میزان نشانهگذاری را افزایش داد و قابلیت خوانایی و ویرایش را در همان سطح به دست آورد). سایر پیشرفتها برخی از مشکلات SGML را در سطح بینالمللی تصحیح کردند و تجزیه یک سند را به صورت سلسله مراتبی حتی اگر DTD در دسترس نبود ممکن ساخت.
XML در درجه اول برای محیط های نیمه ساختار یافته مانند اسناد و نشریات طراحی شده است. با این حال، بین انعطاف پذیری و سادگی، رسانه ای خوشحال کننده ایجاد کرد و به سرعت توسط بسیاری از کاربران پذیرفته شد. XML در حال حاضر به طور گسترده ای برای انتقال داده ها بین برنامه ها استفاده می شود. مانند HTML، می توان آن را به عنوان یک زبان "کانتینر" مشخص کرد.
XHTML از ژانویه 2000، تمام توصیه های W3C بر اساس XML بود نه SGML، و مخفف XHTML (Extensible HyperText Markup Languge) پیشنهاد شد. مشخصات زبان ایجاب می کند که اسناد XHTML به صورت اسناد XML قالب بندی شوند، این به XHTML اجازه می دهد تا برای اسناد واضح تر و دقیق تر با استفاده از برچسب های HTML استفاده شود.
یکی از قابل توجه ترین تفاوت های بین HTML و XHTML این قانون است که همه برچسب ها باید بسته شوند: به عنوان مثال، تگ های خالی باید هر دو با یک برچسب بسته شدن استاندارد یا یک ورودی خاص بسته شوند: (فاصله قبل از "/" در تگ بستن اختیاری است، اما اغلب استفاده می شود زیرا برخی از مرورگرهای پیش از XML و تجزیه کننده های SGML از آن استفاده می کنند. سایر ویژگی های برچسب ها باید در گیومه باشند. در نهایت، تمام برچسب ها و نام ویژگی ها باید با حروف کوچک نوشته شوند تا به درستی خوانده شوند. HTML به حروف بزرگ و کوچک حساس نیست.
سایر پیشرفت های مبتنی بر XML بسیاری از پیشرفتهای مبتنی بر XML در حال حاضر در حال استفاده هستند، مانند RDF (چارچوب توصیف منبع)، XFORMS، DocBook، SOAP و OWL (زبان وب هستیشناسی).
ویژگی های خاص ویژگی مشترک همه زبانهای نشانهگذاری این است که متن سند را با دستورالعملهای نشانهگذاری در یک جریان داده یا فایل ترکیب میکنند. این ضروری نیست، می توان نشانه گذاری را از متن با استفاده از نشانگرها، برچسب ها، شناسه ها یا سایر تکنیک های هماهنگی جدا کرد. این "نشانه گذاری جداگانه" برای نمایش داخلی برنامه هایی که با اسناد علامت گذاری شده کار می کنند، معمول است. با این حال، نشانه گذاری جاسازی شده یا "داخلی" در جاهای دیگر پذیرفته شده است. برای مثال، در اینجا قسمت کوچکی از متن با استفاده از HTML علامت گذاری شده است:
آناتیدها
خانواده آناتیدهاشامل اردکها، غازها و قوها میشود، اما نه جیغزنان نزدیک به هم.
کد دستورالعمل نشانه گذاری (معروف به برچسب) در براکت های زاویه ای محصور شده است. متن بین این دستورالعمل ها متن سند است. کدها h1, پو ما- نمونه هایی از نشانه گذاری ساختاری، آنها موقعیت، هدف یا معنای متن موجود در آنها را توصیف می کنند.
دقیقتر، h1به معنی "این یک عنوان سطح اول است" پبه معنی "این یک پاراگراف است" و مابه معنای "این کلمه یا عبارتی است که زیر آن خط کشیده شده است." برنامه تفسیر می تواند این قوانین یا سبک ها را برای نمایش قسمت های مختلف متن، با استفاده از حروف، اندازه فونت، فاصله، رنگ یا سبک های دیگر در صورت لزوم اعمال کند. برای مثال، برچسبی مانند h1 ممکن است با فونت تایپوگرافی بزرگ و پررنگ ارائه شود، یا در سندی با متن تک فاصله (مانند ماشین تحریر) زیر آن خط کشیده شود یا ظاهر آن اصلاً تغییر نکند.
برای کنتراست، تگ کنید مندر HTML - نمونه ای از نشانه گذاری بصری. معمولاً برای شناسایی ویژگی های خاص متن (استفاده از حروف ایتالیک در این بلوک) بدون توضیح دلیل استفاده می شود.
TEI (Tex Encoding Initiative) اسناد راهنمای جامعی را برای هدایت رمزگذاری متن به نفع بشریت و جوامع علمی منتشر کرده است. از این کتابچه ها برای رمزگذاری اسناد تاریخی، آثار خاص دانشمندان، نشریات ادواری و غیره استفاده می شد.
کاربردهای جایگزین در حالی که ایده استفاده از زبانهای نشانهگذاری با اسناد متنی تکامل یافته است، استفاده از زبانهای نشانهگذاری را در مناطق دیگر افزایش داده است، که نشان میدهد میتوان از آنها برای نمایش انواع مختلف اطلاعات، از جمله لیستهای پخش، گرافیک برداری، وب استفاده کرد. خدمات و رابط های کاربری اکثر این برنامه ها مبتنی بر XML هستند زیرا یک زبان ساختار یافته و قابل توسعه است.
استفاده از XHTML همچنین نشان میدهد که میتوان آن را با زبانهای نشانهگذاری مختلف از یک نمایه مانند XHTML+SMIL یا XHTML+MathML+SVG ترکیب کرد.
(Standard Generalized Markup Language)، ارائه شده در استاندارد ISO 8879. این زبان به عنوان زبان اصلی برای طراحی مستندات فنی، از جمله کتابچه راهنمای فنی الکترونیکی تعاملی پذیرفته شده است.برای محصولات ایجاد شده با استفاده از فناوری CALS.
SGML ساختار اسناد را به عنوان دنباله ای از اشیاء داده تعریف می کند. اشیاء دادهای که بخشهایی از یک سند را نشان میدهند میتوانند در فایلهای مختلف ذخیره شوند. استاندارد SGML مجموعه ای از نمادها و قوانین را برای نمایش اطلاعات ایجاد می کند که به سیستم های مختلف اجازه می دهد این اطلاعات را به درستی شناسایی و شناسایی کنند. این مجموعه ها در قسمت جداگانه ای از سند به نام اعلامیه DTD توضیح داده شده است(Document Type Decfinition) که همراه با سند اصلی SGML منتقل می شود. DTD مطابقت کاراکترها و کدهای آنها، حداکثر طول شناسه های مورد استفاده، نحوه نمایش جداکننده ها برای برچسب ها، سایر قراردادهای ممکن، نحو DTD، و نوع و نسخه سند را مشخص می کند. بنابراین، SGML را می توان یک فرازبان برای خانواده ای از زبان های نشانه گذاری خاص نامید. به طور خاص، زبان های نشانه گذاری XML را می توان زیر مجموعه های SGML در نظر گرفتو HTML.
توضیحات فنی در قالب یک سند SGML شامل:
- فایل اصلی با راهنمای فنی، با برچسب های SGML مشخص شده است.
- شرح موجودیت هادر صورتی که سند متعلق به گروهی باشد که در آنها از همان موجودات استفاده شده و شهرت آنها دلالت دارد.
- فرهنگ لغت برای توضیح برچسب های SGML.
با این حال، یادگیری و استفاده از SGML دشوار است. بنابراین برای کاربرد گستردهنشانه گذاری در اسناد ارسال شده به WWW-technologies، در سال 1991، یک زبان HTML ساده بر اساس SGML توسعه یافت(زبان نشانه گذاری HyperText)، و در سال 1996 زبان XML(EXtensible Markup Language) که در ترکیب با HTML به زبان اصلی برای ارائه اسناد در برنامه های مختلف تبدیل می شود.
زبان HTML برای استفاده گسترده از نشانه گذاری در اسناد ارائه شده در فناوری های WWW توسعه یافته است.
توضیحات HTML شامل متن ASCII و دنباله ای از دستورات (کدهای کنترل) موجود در آن است که به آنها توصیفگر یا برچسب نیز می گویند. این متن یک سند HTML یا یک صفحه HTML نامیده می شود، یا زمانی که در یک وب سرور پست می شود، یک صفحه وب نامیده می شود.. برچسب ها در مکان های مناسب در متن منبع قرار می گیرند؛ آنها فونت ها، خط تیره و ظاهر را تعیین می کنند تصاویر گرافیکی، پیوندها و غیره هنگام استفاده از ویرایشگرهای WWW، دستورات به سادگی با فشار دادن کلیدهای مربوطه وارد می شوند.
XML نیز مانند HTML زیرمجموعه ای از SGML در نظر گرفته می شود. در حال حاضر، زبان XML ادعا می کند که زبان اصلی برای ارائه اسناد است فناوری اطلاعات، می توان آن را به عنوان یک فرازبان در نظر گرفت که به عنوان پایه ای برای ایجاد زبان های نشانه گذاری خصوصی در برنامه های مختلف عمل می کند. در عین حال، XML راحتتر از SGML است که با حذف برخی از ویژگیهای جزئی SGML در XML تضمین میشود. توضیحات در XML برای استفاده در مرورگرهای مدرن آسانتر استضمن حفظ ویژگی های اصلی SGML.
برای برنامه های خاص، نسخه های خود از XML ایجاد می شود که به آنها فرهنگ لغت XML یا برنامه های کاربردی XML می گویند. بنابراین، برای توصیف متون با خاص نمادگرایی ریاضیبرنامه XML OSD (شرح نرم افزار باز) توسعه یافته است. مورد علاقه CALS گزینه Product Definition eXchange (PDX) است که به تبادل داده اختصاص داده شده است. فرهنگ لغت هایی برای شیمی (CML - Chemical Markup Language)، زیست شناسی (BSML - Bioinformatic Sequence Markup Language) و غیره وجود دارد.
همچنین بخوانید: