Značkovacie jazyky dokumentu značkovací jazyk. Čo je značkovací jazyk HTML Čo je kód HTML

Ľahké značkovacie jazyky

Jazyky určené na jednoduché a rýchle písanie textu v jednoduchom textovom editore sú tzv odľahčené(sk:Odľahčený značkovací jazyk). Vlastnosti takýchto jazykov:

  • Minimálne funkcie.
  • Malá skupina podporovaných značiek.
  • Ľahko sa učí.
  • Zdrojový text v tomto jazyku sa číta rovnako ľahko ako hotový dokument.

Používajú sa tam, kde si človek musí pripraviť text v bežnom textovom editore (blogy, fóra, wiki), alebo tam, kde je dôležité, aby text mohol čítať aj používateľ s bežným textovým editorom. Tu je niekoľko bežne používaných ľahkých značkovacích jazykov:

  • Označenie Wiki (pozri Wikipedia: Ako upravovať články)
  • Rôzne systémy automatickej dokumentácie (napríklad Javadoc).

Príbeh

Výraz „značenie“ pochádza z frázy „označenie“ ( značenie, značenie- angličtina) z tradičnej vydavateľskej praxe umiestňovania špeciálnych podmienených poznámok na okraje a do textu rukopisu alebo korektúry pred odoslaním do tlače. „Značkovací muži“ teda označovali typ písma, štýl a veľkosť písma pre každú časť textu. Textové značenie dnes robia redaktori, korektori, grafici – a, samozrejme, samotní autori.

GenCode

Myšlienku používania značkovacích jazykov v počítačovom spracovaní textu s najväčšou pravdepodobnosťou prvýkrát predstavil William Tunnicliffe. William W. Tunnicliffe ) na konferencii v roku 1967. Sám nazval svoj návrh „univerzálne kódovanie“ (angl. "generické kódovanie"). V 70. rokoch 20. storočia viedol Tunnicliffe vývoj štandardu GenCode pre vydavateľský priemysel a neskôr sa stal šéfom jedného z výborov Medzinárodnej organizácie pre normalizáciu (ISO). Medzinárodná organizácia pre štandardizáciu ), ktorý vytvoril SGML, prvý deskriptívny značkovací jazyk. Brian Reid (ur. Brian Reid ) vo svojej dizertačnej práci, ktorú obhájil v roku 1980 na Carnegie University. Univerzita Carnegie Mellon ), pri vývoji navrhovanej koncepcie, vykonala praktickú implementáciu deskriptívneho značenia.

V súčasnosti sa však „otec“ značkovacích jazykov zvyčajne nazýva výskumník IBM Charles Goldfarb. Charles Goldfarb ). Základný koncept sa mu zrodil v roku 1969 pri práci na primitívnom systéme správy dokumentov určenom pre advokátske kancelárie. V tom istom roku sa podieľal na vytvorení jazyka IBM GML, ktorý bol prvýkrát predstavený v roku 1973.

Niektoré skoré implementácie počítačových značkovacích jazykov možno nájsť v typografických nástrojoch UNIX, ako sú troff a nroff. Umožňujú vkladať príkazy na formátovanie do textu dokumentu, aby ste ho naformátovali podľa požiadaviek editora.

Dostupnosť publikačného softvéru s funkciou WYSIWYG "to, čo vidíte, je to, čo dostanete" - „to, čo vidíš, to dostaneš“) nahradilo väčšinu týchto jazykov medzi bežnými používateľmi, hoci seriózna publikačná práca stále používa značkovanie pre špecifické nevizuálne textové štruktúry a editory WYSIWYG teraz najčastejšie ukladajú dokumenty vo formátoch založených na značkovacie jazyky.

TeX

Ďalším dôležitým publikačným štandardom je TeX, ktorý vytvoril a následne zdokonalil Donald Knuth v 70. a 80. rokoch dvadsiateho storočia. TeX spája vysokokvalitné možnosti formátovania textu a popisu písiem, najmä pre matematické knihy profesionálnej kvality. To si vyžadovalo, aby Knuth strávil veľa času učením sa umeniu sadzby. TeX však išiel z kopca, takže sa dnes primárne používa vo vedeckom svete, kde je de facto štandardom v mnohých vedných disciplínach. Okrem Tech existuje LaTeX, čo je široko používaný popisný značkovací systém založený na TeXe.

Scribe, GML a SGML

Prvý jazyk s jasným a zreteľným rozdielom medzi štruktúrou dokumentu a vzhľadom dokumentu bol Scribe, ktorý bol vytvorený a opísaný v doktorandskej práci Briana Reida v roku 1980. Scribe bol revolučný v množstve spôsobov spracovania, v neposlednom rade preto, že zaviedol myšlienku štýlov, oddelených od skutočného textu a gramatiky, a riadiacich používanie popisných prvkov. Scribe ovplyvnil vývoj GML (neskôr SGML) a je tiež priamym predchodcom HTML a LaTeXu.

Na začiatku 80. rokov viedla myšlienka, že značkovanie by sa malo zamerať na štrukturálne aspekty dokumentu a ponechať vonkajšiu reprezentáciu dokumentu na interpreta, k vytvoreniu SGML. Jazyk bol vyvinutý výborom pod vedením Goldfarba. Skombinoval nápady z mnohých zdrojov, vrátane projektu Tunnikoflick, GenCode. Sharon Adler, Anders Berglund a James A. Marke boli tiež kľúčovými členmi výboru SGML.

SGML presne definovalo syntax pre zahrnutie značiek do textu a tiež samostatne popísalo, ktoré značky sú povolené a kde (DTD - Document Type Definition). To umožnilo autorom vytvárať a používať akékoľvek značky, ktoré chceli, vybrať značky, ktoré majú použiť, a dať im mená v normálnom jazyku. SGML by sa teda malo považovať za metajazyk; z toho sa vyvinulo viacero špeciálnych značkovacích jazykov. Koncom osemdesiatych rokov minulého storočia došlo k vzostupu nových značkovacích jazykov založených na SGML, ako sú TEI a DocBook.

V roku 1986 bol SGML publikovaný ako medzinárodná norma pod číslom ISO 8879. SGML našiel široké uplatnenie a bol široko používaný vo veľmi veľkých projektoch. Vo všeobecnosti sa však zistilo, že je ťažkopádny a ťažko sa učí, pričom vedľajším účinkom jazyka bolo, že sa snažil robiť priveľa a byť príliš flexibilný. Napríklad SGML vytvorilo nie vždy potrebné uzatváracie tagy (alebo otváracie tagy alebo dokonca oboje), pretože verilo, že toto označenie bude pridané manuálne pracovníkmi projektovej podpory, ktorí by ocenili úsporu stlačenia klávesov.

HTML

V roku 1991 bolo používanie SGML obmedzené na obchodné programy a databázy a nástroje WYSIWYG (ktoré ukladali dokumenty v proprietárnych binárnych formátoch) sa používali pre iné programy na spracovanie dokumentov. Situácia sa zmenila, keď sa Sir Tim Berners-Lee dozvedel o SGML od svojho kolegu Andersa Berglanda. Anders Berglund ) a ďalší spolupracovníci v CERN-e použili syntax SGML na vytvorenie HTML. Jazyk mal podobnosť s inými značkovacími jazykmi založenými na syntaxi SGML, ale začať s ním bolo oveľa jednoduchšie, dokonca aj pre vývojárov, ktorí to nikdy predtým nerobili. Steven DeRose tvrdil, že HTML používajúce popisné značenie (a najmä SGML) bolo hlavným faktorom vo vývoji webu, pretože bol navrhnutý s flexibilitou a rozšíriteľnosťou (ako aj s ďalšími faktormi vrátane koncepcie adries URL a bezplatného používania prehliadačmi). . V súčasnosti je HTML najatraktívnejším a najčastejšie používaným značkovacím jazykom na svete.

Niektorí počítačoví vedci však spochybňujú status HTML ako značkovacieho jazyka. Ich hlavným argumentom je, že HTML obmedzuje umiestňovanie značiek a vyžaduje, aby boli obe značky vnorené do iných značiek alebo do hlavných značiek dokumentu. V dôsledku toho títo vedci považujú HTML za kontajnerový jazyk, ktorý sa riadi hierarchickým modelom.

XML

XML (Extensible Markup Language) je v súčasnosti široko používaný meta značkovací jazyk. XML vyvinulo World Wibe Web Consortium vo výbore vedenom Jonom Bosakom. Hlavným účelom XML je byť jednoduchší ako SGML a zamerať sa na konkrétny problém – dokumenty na internete. XML je meta-jazyk ako SGML, používatelia môžu vytvárať ľubovoľné značky, ktoré potrebujú (preto „rozšíriteľné“). Vzostup XML pomohol, pretože každý dokument XML mohol byť napísaný rovnakým spôsobom ako dokument SGML a programy a používatelia používajúci SGML mohli pomerne ľahko migrovať na XML.

XML však stratilo mnoho funkcií SGML orientovaných na človeka, ktoré uľahčovali jeho používanie (kým nezväčšilo množstvo značiek a nezískalo znovu čitateľnosť a editovateľnosť na rovnakej úrovni). Ďalšie vylepšenia opravili niektoré problémy SGML na medzinárodnej úrovni a umožnili hierarchicky analyzovať dokument, aj keď nebolo k dispozícii žiadne DTD.

XML bol navrhnutý predovšetkým pre pološtruktúrované prostredia, ako sú dokumenty a publikácie. Bol však šťastným stredom medzi flexibilitou a jednoduchosťou a mnohí používatelia ho rýchlo prijali. XML sa v súčasnosti široko používa na prenos údajov medzi programami. Podobne ako HTML ho možno charakterizovať ako „kontajnerový“ jazyk.

XHTML

Počnúc januárom 2000 boli všetky odporúčania W3C založené skôr na XML ako na SGML a bola navrhnutá skratka XHTML (Extensible HyperText Markup Languge). Špecifikácie jazyka vyžadovali, aby dokumenty XHTML boli naformátované ako dokumenty XML, čo umožňuje použitie XHTML pre jasnejšie a presnejšie dokumenty pomocou značiek z HTML.

Jedným z najpozoruhodnejších rozdielov medzi HTML a XHTML je pravidlo, že všetky značky musia byť uzavreté: prázdne značky, napr.<br/>, obe musia byť uzavreté štandardnou uzatváracou značkou alebo špeciálnym záznamom:<br/> (medzera pred „/“ v záverečnej značke je voliteľná, ale často sa používa, pretože ju používajú niektoré prehliadače staršie ako XML a analyzátory SGML). Ostatné atribúty v značkách musia byť v úvodzovkách. Nakoniec, všetky značky a názvy atribútov musia byť napísané malými písmenami, aby sa správne čítali; HTML nerozlišuje veľké a malé písmená.

Ďalší vývoj založený na XML

V súčasnosti sa používa veľa vývojov založených na XML, ako napríklad RDF (Resource Description Framework), XFORMS, DocBook, SOAP a OWL (Ontology Web Language).

Zvláštnosti

Spoločným znakom všetkých značkovacích jazykov je, že v dátovom toku alebo súbore miešajú text dokumentu s pokynmi na značkovanie. Toto nie je potrebné, značky je možné oddeliť od textu pomocou ukazovateľov, štítkov, identifikátorov alebo iných koordinačných techník. Toto „oddelené označenie“ je typické pre internú reprezentáciu programov, ktoré pracujú s označenými dokumentmi. Vložené alebo „vložené“ označenie je však akceptované inde. Tu je napríklad malá časť textu označená pomocou HTML:

Anatidae

Rodina Anatidae zahŕňa kačice, husi a labute, ale nieúzko príbuzní krikľúni.

Kód inštrukcie na označovanie (známy ako značky) je uzavretý v lomených zátvorkách<как здесь>. Text medzi týmito pokynmi je textom dokumentu. Kódy h1, p A em- príklady štrukturálneho označenia, popisujú polohu, účel alebo význam textu v nich obsiahnutého.

Presnejšie, h1 znamená „toto je nadpis prvej úrovne“ p znamená „toto je odsek“ a em znamená „toto je podčiarknuté slovo alebo fráza“. Tlmočnícky program môže použiť tieto pravidlá alebo štýly na zobrazenie rôznych častí textu pomocou rôznych typov písma, veľkostí písma, medzier, farieb alebo iných štýlov podľa potreby. Značka, ako je h1, môže byť napríklad prezentovaná veľkým, tučným typografickým písmom alebo v dokumente s textom s jednotnou medzerou (ako na písacom stroji) môže byť podčiarknutá alebo nemusí vôbec meniť svoj vzhľad.

Pre kontrast, tag i v HTML - príklad vizuálneho označenia; zvyčajne sa používa na identifikáciu špecifických prvkov textu (v tomto bloku použite kurzívu) bez vysvetlenia prečo.

TEI (Tex Encoding Initiative) publikovala komplexné usmerňovacie dokumenty, ktoré usmerňujú kódovanie textu v prospech ľudstva a vedeckých spoločností. Tieto príručky slúžili na kódovanie historických dokumentov, konkrétnych prác vedcov, periodík a pod.

Alternatívne použitia

Zatiaľ čo sa myšlienka používania značkovacích jazykov s textovými dokumentmi vyvinula, zvýšila sa používanie značkovacích jazykov v iných oblastiach, čo naznačuje, že ich možno použiť na reprezentáciu rôznych typov informácií vrátane zoznamov skladieb, vektorovej grafiky, webu. služby a používateľské rozhrania. Väčšina týchto aplikácií je založená na XML, pretože ide o dobre štruktúrovaný a rozšíriteľný jazyk.

Použitie XHTML tiež ukazuje, že ho možno kombinovať s rôznymi značkovacími jazykmi rovnakého profilu, ako napríklad XHTML+SMIL alebo XHTML+MathML+SVG.

V roku 1969 traja výskumníci IBM vyvinuli GML, formátovací jazyk na publikovanie dokumentov. GML nie je len skratka pre Generalized Markup Language, ale aj iniciály jeho tvorcov – Charlesa Goldfarba, Edwarda Moshera a Raymonda Lauriera.

GML podporuje úpravu a formátovanie textu a umožňuje subsystémom na extrakciu informácií vymieňať si dokumenty. GML zároveň namiesto jednoduchej značkovacej schémy zavádza koncept formálne definovaných typov dokumentov obsahujúcich prísnu hierarchiu štruktúrovaných prvkov.

Základné komponenty GML boli implementované v sálových publikačných systémoch a samotný jazyk je v tomto odvetví veľmi populárny. GML používa IBM a viac ako 90% firemných dokumentov je vytvorených s jeho pomocou.

Rozšírením GML o pojmy, ako sú poznámky pod čiarou, spracovanie odkazov a paralelné typy dokumentov, vznikol štandardný zovšeobecnený značkovací jazyk. SGML sa začalo aktívne používať vo vydavateľskom biznise, navyše ho prijalo do používania americké vládne vydavateľstvo a v roku 1986 získalo štatút medzinárodného štandardu.

SGML však bolo málo známe až do roku 1990, kedy Tim Berners-Lee, tvorca World Wide Web, vytvoril Hypertext Markup Language, čo je podmnožina SGML. Čoskoro potom všetky typy dokumentov a údajov začali obsahovať značky v štýle a na začiatku a na konci každého textového prvku. Koncom 90-tych rokov sa objavil Extensible Markup Language (XML)... a svet IT sa nenávratne zmenil.

V skutočnosti sa zdá, že neprejde ani deň bez správ o vytvorení alebo popise nového značkovacieho jazyka. Computerworld totiž v sekcii Rýchla štúdia publikoval už 10 článkov popisujúcich rôzne značkovacie jazyky a potom už len tie najzákladnejšie. Vyhľadávanie Google pre značkovací jazyk poskytuje odkazy na viac ako 6 miliónov stránok. Nižšie je uvedený krátky „sprievodca“ moderným „priestorom značkovacích jazykov“. Samozrejme, nemá to byť komplexné, ale dáva predstavu o flexibilite a možnostiach konceptu a o tom, ako sa používajú. Väčšina z týchto jazykov sú rozšírenia XML alebo definície typov dokumentov špecifických pre doménu, hoci niektoré sú dosť zložité.

Jazyky

  • Jazyk vykonávania obchodných procesov (BPEL) je určený na vykonávanie série webových transakcií a/alebo popis rozhraní, ktoré sú potrebné na vykonávanie webových transakcií. Používa sa na modelovanie obchodných procesov pomocou špecifikácií transakcií a kompenzácií, dátových tokov, správ a plánovaných udalostí, obchodných pravidiel, bezpečnostných rolí a spracovania výnimiek.
  • Cell Markup Language (CellML) slúži na ukladanie a zdieľanie počítačových matematických modelov, čo umožňuje vedcom zdieľať modely, aj keď na ich tvorbu používajú iný softvér. Jazyk im tiež umožňuje opätovne použiť komponenty v jednom modeli pri vývoji iného, ​​čím sa proces urýchli. CellML obsahuje matematické a metadáta pomocou existujúcich jazykov, vrátane MathML. www.cellml.org
  • Chemical Markup Language (CML) je nový prístup k manažmentu molekulárnych informácií, ktorý využíva novo vyvinuté internetové nástroje ako XML a Java. Tento jazyk, vytvorený striktne na základe SGML, je schopný podporovať extrémne zložité informačné štruktúry a tým pôsobiť ako mechanizmus výmeny alebo archivačný nástroj. Ľahko sa spája s modernými databázovými architektúrami, najmä relačnými alebo objektovo orientovanými. Najdôležitejšie je, že už bolo vytvorené obrovské množstvo univerzálneho XML softvéru na jeho spracovanie a transformáciu. www.xml-cml.org
  • DARPA Agent Markup Language (XML) má obmedzené možnosti opisu vzťahov medzi objektmi. DAML rozširuje XML pomocou ontológií – dobre definovaných formálnych špecifikácií, ktoré opisujú, ako reprezentovať objekty, koncepty a iné prvky v konkrétnej doméne, ako aj vzťahy medzi nimi. www.daml.org/about.html
  • Dynamic Markup Language (DML) je jazyk založený na XML navrhnutý špeciálne pre objektovo orientované grafické štruktúry a vývoj používateľského rozhrania. Podobne ako HTML, aj tento jazyk obsahuje rozšírenia, ktoré podporujú výpočty, odovzdávanie argumentov a ukladanie premenných. www.rocklyte.com/dml
  • Značkovací jazyk adresárových služieb (DSML) definuje obsah a štruktúru adresára, udržiava ho v distribuovaných adresároch. DSML poskytuje vývojárom jednoduchý a pohodlný spôsob implementácie XML aplikácií na internete. Táto podpora je rozhodujúca pre aplikácie elektronického obchodu.
  • Značkovací jazyk finančných produktov (FPML) je štandardom pre výmenu obchodných informácií pri elektronickom obchodovaní a spracovaní derivátových finančných nástrojov. Stanovuje protokol na výmenu informácií a prácu s odvodenými a štruktúrovanými produktmi. www.fpml.org/index.html
  • Hypertext Markup Language (HTML), základ webu, je založený na verzii GML, ktorá sa predtým používala v CERN. Jeho hlavnou výhodou bolo, že po prvýkrát umožnil vytváranie jednoduchých hypertextových prepojení medzi dokumentmi. www.w3.org/MarkUp
  • Human Markup Language (HML) je projekt na vytvorenie platformy na modelovanie celého procesu ľudskej komunikácie, vrátane takých oblastí ako myslenie, emócie, správanie, mimika, pomocou grafického alebo textového znázornenia. www.humanmarkup.org
  • Materials Markup Language (MatML) bol navrhnutý na výmenu informácií o látkach. www.matml.org
  • Multimedia Retrieval Markup Language (MRML) zjednocuje prístup k softvérovým komponentom používaným na vyhľadávanie a správu multimediálnych informácií za účelom rozšírenia ich možností. www.mrml.net
  • Fyzický značkovací jazyk (PML) je jednoduchý, univerzálny jazyk na popis fyzických objektov a prostredí pre priemyselné, komerčné a spotrebiteľské aplikácie. PML je natoľko modulárny a flexibilný, že ho možno použiť na monitorovanie a riadenie fyzického prostredia. Aplikácie zahŕňajú monitorovanie skladu, automatizované transakcie, riadenie dodávateľského reťazca, riadenie strojov a komunikáciu medzi zariadeniami. http://web.mit.edu/mecheng/pml/index.htm
  • Security Assertion Markup Language (SAML) je obal na báze XML, ktorý sa používa na sprostredkovanie informácií o autentifikácii používateľov, právach a atribútoch. Umožňuje spoločnostiam komunikovať informácie týkajúce sa identity, atribútov a práv subjektu (zvyčajne človeka) iným subjektom, ako je partnerská spoločnosť alebo iná podniková aplikácia. www.oasis-open.org/committees/security/faq.php
  • Services Provisioning Markup Language (SPM) je shell, ktorý slúži na výmenu informácií o používateľoch, zdrojoch a poskytovaní služieb medzi aplikáciami a organizáciami.
  • Značkovací jazyk syntézy reči (SSML) Pomáha vytvárať umelú reč vo webovom softvéri a iných aplikáciách tým, že poskytuje štandardný spôsob ovládania charakteristík reči, ako je výslovnosť, sila, výška a rýchlosť reči na rôznych platformách. www.w3.org/TR/speech-synthesis
  • Značkovací jazyk používateľského rozhrania (UIML) umožňuje vytvárať používateľské rozhrania pre akékoľvek zariadenie, jazyk a operačný systém na zariadení. Popisuje vzhľad rozhrania, ako používateľ interaguje s rozhraním a ako rozhranie súvisí s aplikačnou logikou. www.uiml.org
  • Voice Extensible Markup Language (VoiceXML). Aplikácie poháňané hlasom sú čoraz populárnejšie a VoiceXML popisuje bežné funkcie na zabezpečenie prenosnosti medzi platformami. www.voicexml.org/
  • Wireless Markup Language (WML) opisuje obsah a formáty na prezentáciu údajov na zariadeniach s obmedzenou šírkou pásma, ako sú mobilné telefóny a pagery. Namiesto snahy sprostredkovať celý obsah webovej stránky, ktorý by sa dal vidieť na PC, WML prezentuje väčšinou textové informácie optimalizované pre mobilné zariadenia.
  • Extensible Access Control Markup Language (XACML) je schéma založená na XML, ktorá bola navrhnutá na vytváranie pravidiel a automatizáciu ich používania na riadenie prístupu k rôznym zariadeniam a aplikáciám v sieti.
  • Extensible Markup Language (XML) kombinuje škálovateľnosť SGML s jednoduchou a širokou podporou HTML. V podstate je to podmnožina SGML, je jednoduchšia a ľahšie implementovateľná a podporuje väčšinu funkcií SGML. XML bol schválený ako štandard World Wide Web Consortium v ​​roku 1998.

ML neznamená „značkovací jazyk“

Nie každý jazyk alebo skratka, ktorá končí na ML, je značkovací jazyk. Tu sú najvýraznejšie výnimky.

Symboly ML sa pôvodne používali ako skratka pre slovo „metalanguage“, teda všeobecný programovací jazyk určený pre veľké projekty. V súčasnosti sa používajú dva hlavné dialekty tohto jazyka. Toto je štandardný ML (SML; pozri www.dcs.ed.ac.uk/home/stg/NOTES), matematicky definovaná verzia jazyka formulovaná čiastočne vývojármi pôvodného jazyka a Objective Caml (OCaml; pozri http://caml.inria.fr/), odvodená verzia pôvodného ML, do ktorej sa pridávajú schopnosti podľa uváženia vývojára bez toho, aby boli definované v štandarde. Medzi ďalšie pozoruhodné dialekty patrí Extended ML (EML; pozri http://homepages.inf.ed.ac.uk/dts/eml) a Alice ML ( www.ps.uni-sb.de/alice).

ML a jeho varianty sú funkčné jazyky a nepodporujú zápis do pamäte. Sú náročné na programovanie, ale programy s nimi vytvorené sú oveľa vhodnejšie na formálnu analýzu a dôkaz správnosti.

  • Unified Modeling Language (UML) je štandardná notácia pre modelovanie objektov reálneho sveta ako súčasť vývoja metodológie objektovo orientovaného dizajnu. UML sa používa na modelovanie aplikačnej štruktúry, správania a architektúry, ako aj obchodných procesov a dátových štruktúr. Tento jazyk podporujú výrobcovia mnohých systémov počítačom podporovaného návrhu. UML bol vytvorený na základe metodík, ktoré popisujú aj procesy pri vývoji a používaní modelu. www.uml.org
  • YAML nie je značkovací jazyk (YAML) je medzinárodný projekt venovaný vytvoreniu jazyka pre sekvenčné usporiadanie dát, ktorý je na jednej strane zrozumiteľný pre ľudí a na druhej strane podporuje seriózne výpočtové schopnosti.

Niekedy môžete počuť o „programovaní“ webovej stránky, ale formátovanie textu v okne prehliadača v skutočnosti nie je programovanie. Ako naznačujú názvy formátovacích jazykov, patria medzi značkovacie jazyky. To znamená, že pozostávajú z rôznych znakov vložených do tela dokumentu, ktoré označujú, ako má súbor vyzerať pri tlači alebo zobrazení, alebo definujú jeho logickú štruktúru (ako sú odseky a zoznamy s odrážkami). Ak nepoužívate značkovací jazyk, zobrazené údaje sú nespracovaný text bez formátovania znakov alebo odsekov.
Značkovacie jazyky definujú vzhľad dokumentu pomocou kódov nazývaných tagy, ktoré majú nasledujúci tvar: . Prvý deskriptor označuje začiatočný bod formátovania a druhý (s lomkou) označuje koniec kódu. Ak vynecháte druhý deskriptor, až do konca dokumentu sa použije kódovanie špecifikované prvým deskriptorom.

Poznámka:
Značkovací jazyk je možné použiť na neštruktúrovaný text buď manuálne, pomocou textového editora (ako je Poznámkový blok) alebo pomocou grafického nástroja, ktorý pridáva kód pri vizuálnej úprave textu podľa vašich predstáv.
Pre začiatočníkov je jednoduchšia práca s grafickými nástrojmi, ktoré nie sú také presné ako textové editory.

Hypertext Markup Language (HTML)

HTML (HyperText Markup Language) je základom kódovania a „chrbticou“ väčšiny webových stránok. HTML vám umožňuje publikovať text a grafiku, obsah tabuliek a dokonca vytvárať zostavy založené na databáze na čítanie online. Je skvelý na organizovanie a formátovanie statických informácií akéhokoľvek typu, pretože vám umožňuje:

● nastaviť veľkosť textu a typ písma;
● formátovať text tučným písmom, kurzívou alebo podčiarknutím;
● nastaviť odkazy na iné stránky;
● vkladať obrázky;
● vytvárať názvy stránok;
● vytvárať tabuľky;
● vkladať metadáta potrebné na fungovanie vyhľadávačov.

Poznámka:
Metadáta sú skryté údaje, ktoré sa nezobrazujú na webovej stránke, ale môžu byť detekované vyhľadávacím nástrojom, ktorý vám umožní dostať sa na danú stránku.

Používajú sa tri typy deskriptorov HTML.

● Na formátovanie textu alebo jednotlivých znakov.
● Na formátovanie odsekov alebo iných veľkých textových blokov.
● Neviditeľné deskriptory, ktoré poskytujú ďalšie funkcie, ako sú metadáta, na vyhľadávanie.

Hlavnou výhodou HTML oproti iným značkovacím jazykom je jeho úžasná všestrannosť. Aktuálnu verziu HTML podporuje takmer každý prehliadač (samozrejme moderný s podporou grafiky). Toto nie je vždy pravda pre dynamický HTML (DHML), XML, Java a ActiveX. Ak chcete, aby boli vaše webové stránky dostupné pre všetky typy prehliadačov, odporúčame vám použiť HTML.

Dynamický HTML (DHML)

Dynamický HTML (DHML) je flexibilnejší ako HTML.
Namiesto zobrazenia statickej webovej stránky môžete použiť DHTML na vytvorenie webovej stránky, ktorú si používateľ môže prispôsobiť bez narušenia vzhľadu pôvodného dokumentu. Napríklad stránka vykreslená pomocou DHTML môže obsahovať rôzne prvky, ktorými sa môže používateľ pohybovať po stránke a meniť tak jej obsah (podľa svojich predstáv). Pri obnovovaní však obrázky na stránke zmiznú a stránka sa vráti do pôvodnej podoby.
DHTML podporuje nasledujúce funkcie, ktoré HTML nepodporuje:

● Dynamické štýly.
● Presné polohovanie.
● Dátová väzba.
● Dynamický obsah.

Nerozumiete, čo to je? Nebojte sa, nižšie sú vysvetlenia.

Aplikovanie štýlov na webové dokumenty. Dynamické štýly sú založené na princípoch kaskádových štýlov (CSS), kedy sa aplikujú na stránku ako celok namiesto manuálneho formátovania jednotlivých častí stránky.
Ak ste pracovali s modernými textovými procesormi, pravdepodobne poznáte šablóny štýlov, ktoré vám umožňujú automaticky formátovať bloky textu jedným alebo druhým spôsobom v závislosti od štýlu, ktorý im pridelíte. Formátovanie zahŕňa zmenu farby textu, písma, umiestnenia, viditeľnosti – vo všeobecnosti takmer všetkého, čo sa týka detailov textu. CSS (a DHTML) robí to isté, ale používa sa na spracovanie webových stránok namiesto textu.
Dynamické štýly implementované pomocou DHTML poskytujú funkcie, ktoré sa nenachádzajú v textových procesoroch. Napríklad pri vytváraní odkazov môžete označiť text tak, aby sa jeho farba automaticky zmenila, keď naň prejdete myšou, alebo sa zobrazí, keď prejdete myšou na určitú oblasť obrazovky.
Jedinou nevýhodou týchto štýlov je, že do väčšiny dokumentov musíte zahrnúť predlohy štýlov. Je to časovo náročná práca, najmä pre tých, ktorí nemajú skúsenosti so štýlmi alebo konverziou dokumentov.

Umiestnenie textu na správne miesto. Ďalšou výhodou DHML je jeho schopnosť presne určiť, kde má byť prvok na stránke umiestnený. Na označenie polohy objektu sa používajú horizontálne (x), vertikálne (y) a dokonca objemové (z) súradnice. (Určenie polohy objektu v trojrozmernom súradnicovom systéme umožňuje „prekrývať“ objekty.) Presné umiestnenie umožňuje umiestniť text okolo obrázka, ako aj presúvať objekty v okne prehliadača.

Poznámka:
HTML bez CSS neposkytuje presné umiestnenie objektov. V tomto prípade je umiestnenie prvkov určené prehliadačom.

Vkladanie údajov na stránku. Aby používatelia mali prístup k niektorým koncovým informáciám, ako sú tie, ktoré sú uložené v databáze, bežné stránky HTML musia byť prepojené so serverom, na ktorom sa nachádzajú pôvodné údaje, a musí sa vyžadovať povolenie na manipuláciu s týmito údajmi. DHTML vám umožňuje viazať údaje na konkrétnu stránku, čo vám umožňuje pracovať s naviazanými (presnejšie zviazanými) údajmi bez narušenia pôvodných údajov a dokonca bez interakcie so serverom, ktorý ich ukladá. Za týmto účelom sa na stránku vkladajú zdroje údajov (možno ich triediť a filtrovať rovnakým spôsobom ako obsah akejkoľvek databázy). To nielen znižuje zaťaženie servera, ale tiež umožňuje používateľom prezerať a manipulovať s údajmi bez toho, aby mali prístup k samotnému zdroju údajov.

Vytváranie dynamického obsahu. Šablóny štýlov umožňujú webovým vydavateľom jednoducho zmeniť vzhľad stránky alebo skupiny stránok.
Dynamický obsah umožňuje používateľovi webu zmeniť vzhľad (prezentáciu) stránky spustením skriptu na:

● vložiť alebo skryť prvky stránky;
● upraviť text;
● zmeniť štruktúru textu;
● presúvať údaje zo zdrojov typu back-end a zobrazovať ich na žiadosť používateľa.

Na rozdiel od HTML, ktoré umožňuje zmenu obsahu stránky len pred jej načítaním do prehliadača používateľa, DHTML môže akceptovať zmeny kedykoľvek.
Dynamický obsah môže poskytnúť vysokú úroveň interaktivity pri použití v spojení so skriptmi, ktoré umožňujú používateľom definovať položky, ktoré chcú zobraziť.

Poradenstvo:
Sekcia Riadenie schôdzí (vyššie) spomína mapu budovy vytvorenú z webových údajov, ktorá zobrazuje polohu konkrétnej kancelárie a portrét zamestnanca, ktorého sa používateľ snaží nájsť. Táto mapa je vytvorená pomocou nástrojov značkovacieho jazyka DHTML na vytváranie dynamického obsahu.

Extensible Markup Language (XML)

XML (Extensible Markup Language) nenahrádza HTML (aspoň sa zriedka vyskytuje na webových stránkach), ale podporuje ho, čo vám umožňuje mierne zvýšiť všestrannosť webových stránok.
Myšlienka je takáto: keď naformátujete stránku pomocou HTML, môžete zmeniť vzhľad textu pomocou značiek, ktoré ho naformátujú ako tučné písmo, kurzíva, podčiarknuté, odsek atď. Samotné deskriptory však nemajú prakticky nič spoločné s obsahom textu, ale len s jeho formátovaním. XML má deskriptory, ktoré riadia vzhľad textu. Pomocou nich môžete určiť, čo text znamená (mená, adresy, názvy produktov atď.).
Prečo je to potrebné? V prvom rade tieto metadáta umožňujú vyhľadávačom nájsť preddefinované prvky. Ak na webovej stránke vašej spoločnosti (vytvorenej pomocou HTML) vyhľadáte slovo „meno“ a pozriete sa na všetky mená v nej uvedené, výsledok vráti všetky výskyty slova „meno“, ale nie názvy samotné. Ak sa však pri vytváraní uzla použilo kódovanie XML, výsledok vráti akýkoľvek text, ktorý má deskriptor názvu "name". Po druhé, označené časti textu môžu byť užitočné, ak potrebujete použiť funkciu (napríklad farbu alebo jazyk) len na určité časti webového dokumentu. Povedzme napríklad, že interaktívny dokument je poviedka v španielčine s anglickým prekladom. Potom namiesto prepínania dokumentu z podpory španielčiny na podporu angličtiny môžete tieto časti príbehu definovať pomocou deskriptorov a aplikovať pravidlá španielskeho jazyka len na tieto časti, pričom preklady ponechajú v angličtine.
Používanie XML v podstate výrazne zjednodušuje návrh webovej stránky, najmä ak je potrebné určité časti stránky vytvoriť ako izolované prvky.

Interakcia
Certifikácia Wi-Fi je zárukou toho, že sieťové adaptéry a prístupové body od rôznych výrobcov budú spolu bez problémov fungovať, no existuje niekoľko funkcií a...

Termíny začínajúce na V
Virtual Machines - virtuálne stroje. Softvér, ktorý simuluje činnosť fyzického zariadenia. Vo Windows 98 sa používa na "oklamanie" programu do...

Čo robia ovládače sieťových kariet?
Ovládače sieťových kariet (sieťové ovládače) sú zodpovedné za správu všetkej externej komunikácie počítača vrátane prístupu na internet Pre každý použitý model sieťovej karty musíte nainštalovať...

Vydali sme novú knihu Marketing obsahu sociálnych médií: Ako sa dostať do hláv svojich nasledovníkov a prinútiť ich, aby sa zamilovali do vašej značky.

HTML je hypertextový značkovací jazyk.

Jazyk sa používa na organizáciu webových stránok. Urobme analógiu. Kupujete noviny. Vyšlo v ňom viacero článkov. Každý článok má názov a obsahuje fotografie. A text je napísaný v niekoľkých stĺpcoch. Toto je štruktúra novinovej stránky.

Na webe sa všetko deje rovnakým spôsobom. Na vytvorenie správnej štruktúry článku – obsahu – je potrebné použiť textový značkovací jazyk.

Na čo slúži HTML?

HTML sa používa na to, aby prehliadač povedal, ako má zobraziť stránku na obrazovke.

Jazyk je všadeprítomný. Ide o univerzálny nástroj na navrhovanie obsahu na stránke. Dá sa použiť v akomkoľvek prehliadači. Ak píšete kód v programovacom jazyku, musíte poznať niektoré funkcie, operátory, dátové typy atď.

HTML pozostáva zo sady značiek – príkazov a atribútov – vlastností. Sú ľahko zapamätateľné a referenčné materiály sú vždy k dispozícii.

Čo je HTML kód

Kód je pokyn pre prehliadač, ako má stránku zobraziť. Existuje štruktúra, ktorú treba vždy dodržiavať. Napríklad, ak je na stránke iba jedna hlavička H1, hlavné informácie sú umiestnené v sekciách atď.

V jazyku sú tri nástroje.

Existujú dva typy značiek – párové a jednoduché.

  • - párový štítok, otváranie a zatváranie. Pôsobia na text umiestnený medzi nimi.
  • Jedna značka ovplyvňuje text, ktorý nasleduje po nej pred ďalšou značkou.

Štruktúra HTML kódu na stránke

Povedali sme, že štruktúra akéhokoľvek html dokumentu je vždy rovnaká. Nižšie uvádzame zoznam požadovaných prvkov.

  1. !- označuje, že dokument používa HTML.
  2. ...- celý kód stránky je umiestnený v tejto značke. Čokoľvek, čo v ňom nie je umiestnené, prehliadač nerozpozná a nezobrazí sa.
  3. ...- párová značka, ktorá obsahuje technické informácie, napríklad o kódovaní dokumentu.
    1. ...- toto je názov stránky, je umiestnený v hlavičke. Každá stránka musí mať svoj vlastný jedinečný názov.
    2. - ide o chránené informácie. Prepája jednotlivé štýly so stránkou – css a pod.. Používateľovi sa nezobrazuje.
  4. ...- telo stránky. Všetky základné informácie sú obsiahnuté v tomto tagu.
    1. ...- hypertextové odkazy.
    2. - Snímky.
    3. ...- miniatúra.
    4. ...- kurzíva.

Vo vnútri tela môže byť neobmedzený počet prvkov.

Takto napríklad vyzerá časť kódu stránky jedného z našich blogových príspevkov.

Čím častejšie značky používate, tým rýchlejšie si ich zapamätáte. Vždy môžete nájsť adresár so všetkými značkami, atribútmi a ich významom.

Značkovací jazyk dokumentu je súbor špeciálnych inštrukcií, nazývaných tagy, navrhnutých na vytvorenie štruktúry v dokumentoch a definovanie vzťahov medzi rôznymi prvkami tejto štruktúry. Jazykové značky alebo kontrolné značky, ako sa niekedy nazývajú, sú v takýchto dokumentoch odlíšené od hlavného obsahu dokumentu a slúžia ako inštrukcie pre program, ktorý zobrazuje obsah dokumentu na strane klienta. Najstaršie systémy používali symboly „<” и “>“, v ktorej boli umiestnené názvy inštrukcií a ich parametre. Teraz je tento spôsob označovania značiek štandardný.

Použitie hypertextového členenia textového dokumentu v moderných informačných systémoch je do značnej miery spôsobené tým, že hypertext umožňuje vytvoriť mechanizmus na nelineárne prezeranie informácií. V takýchto systémoch sa údaje neprezentujú ako súvislý prúd textových informácií, ale ako súbor vzájomne prepojených komponentov, v ktorých sa naviguje pomocou hypertextových odkazov.

Najpopulárnejší hypertextový značkovací jazyk súčasnosti, HTML, bol vytvorený špeciálne na organizovanie informácií distribuovaných na internete a je jednou z kľúčových komponentov technológie WWW. S využitím modelu hypertextového dokumentu sa spôsob prezentácie rôznych informačných zdrojov v sieti stal prehľadnejším a používatelia získali pohodlný mechanizmus na vyhľadávanie a prezeranie potrebných informácií.

HTML je zjednodušená verzia SGML (Standard Generalized Markup Language), ktorá bola schválená organizáciou ISO ako štandard už v 80. rokoch. Tento jazyk je určený na vytváranie ďalších značkovacích jazykov, definuje platnú sadu značiek, ich atribúty a vnútornú štruktúru dokumentu. Kontrola správneho používania deskriptorov sa vykonáva pomocou špeciálneho súboru pravidiel nazývaných popisy DTD, ktoré používa klientsky program pri analýze dokumentu. Pre každú triedu dokumentov je definovaný vlastný súbor pravidiel, ktoré popisujú gramatiku zodpovedajúceho značkovacieho jazyka. Pomocou SGML môžete opísať štruktúrované údaje, organizovať informácie obsiahnuté v dokumentoch a prezentovať tieto informácie v nejakom štandardizovanom formáte. Ale kvôli určitej zložitosti sa SGML používal hlavne na opis syntaxe iných jazykov (najznámejší z nich je HTML) a len málo aplikácií pracovalo priamo s dokumentmi SGML.

Oveľa jednoduchšie a pohodlnejšie ako SGML vám jazyk HTML umožňuje určiť dizajn prvkov dokumentu a má určitú obmedzenú sadu pokynov - značiek, pomocou ktorých sa vykonáva proces označovania. Inštrukcie HTML sú primárne určené na riadenie procesu zobrazovania obsahu dokumentu na obrazovke klientskeho programu a tým určujú spôsob prezentácie dokumentu, nie však jeho štruktúru. Prvok hypertextovej databázy, popísaný pomocou HTML, je textový súbor, ktorý možno jednoducho prenášať po sieti pomocou protokolu HTTP. Táto funkcia, ako aj skutočnosť, že HTML je otvorený štandard a veľké množstvo používateľov má možnosť využiť možnosti tohto jazyka na navrhovanie svojich dokumentov, určite ovplyvnili rast popularity HTML a urobili z neho dnes hlavný mechanizmus prezentácie informácií na webe.

Moderné aplikácie však vyžadujú nielen jazyk na prezentáciu údajov na obrazovke klienta, ale aj mechanizmus, ktorý umožňuje určiť štruktúru dokumentu a popísať prvky, ktoré obsahuje. HTML má jednoduchú sadu príkazov a celkom úspešne sa vyrovná s úlohou opísať textové informácie a zobraziť ich na obrazovke zobrazovacieho programu - prehliadača. Samotné zobrazené údaje však nijako nesúvisia so značkami, ktoré sa používajú na formátovanie, takže programy na analýzu nemajú možnosť použiť značky HTML na nájdenie fragmentov dokumentu, ktoré potrebujeme. Tie. keď ste sa stretli napríklad s takýmto popisom

ruža

divák bude vedieť, akú farbu má zobraziť text obsiahnutý v značkách a pravdepodobne ho zobrazí správne, ale je úplne ľahostajné, kde v dokumente sa tento tag nachádza, v akých ďalších tagoch ​​je aktuálny fragment uzavretý, či fragmenty v ňom vnorené existujú alebo či sú vzťahy medzi objektmi vytvorené správne. Táto „ľahostajnosť“ k štruktúre dokumentu vedie k tomu, že vyhľadávanie alebo analyzovanie informácií v ňom sa nebude líšiť od práce so súvislým textovým súborom, ktorý nie je rozdelený na prvky. A to, ako viete, nie je najefektívnejší spôsob práce s informáciami.

Ďalšou významnou nevýhodou HTML je obmedzená sada jeho značiek. Pravidlá DTD pre HTML definujú pevnú množinu deskriptorov a preto vývojár nemá možnosť zadávať svoje vlastné, špeciálne značky. Aj keď sa z času na čas objavia nové jazykové rozšírenia, dlhá cesta k ich štandardizácii, sprevádzaná neustálymi nezhodami medzi hlavnými výrobcami prehliadačov, takmer znemožňuje rýchle prispôsobenie jazyka a jeho použitie na zobrazovanie špecializovaných informácií (napríklad multimediálnych, matematických , chemické vzorce atď.).

Aby sme zhrnuli všetko, čo bolo povedané, možno tvrdiť, že HTML dnes úplne nespĺňa požiadavky kladené modernými vývojármi na jazyky tohto druhu. A nahradil ho nový hypertextový značkovací jazyk, výkonný, flexibilný a zároveň pohodlný jazyk XML.

XML (Extensible Markup Language) je značkovací jazyk, ktorý popisuje celú triedu dátových objektov nazývaných dokumenty XML. Tento jazyk sa používa ako prostriedok na popis gramatiky iných jazykov a kontrolu správnosti dokumentov. Tie. Samotný XML neobsahuje žiadne značkovacie značky, jednoducho definuje poradie, v ktorom sú vytvorené. Ak si teda napríklad myslíme, že by sme značku mali použiť na označenie prvku ruže v dokumente ; potom nám XML umožňuje voľne používať značku, ktorú definujeme, a do dokumentu môžeme zahrnúť fragmenty, ako sú tieto:

ruža

Sada štítkov sa dá ľahko rozšíriť. Ak, predpokladajme, chceme tiež naznačiť, že popis kvetu by mal zmysluplne ísť do popisu skleníka, v ktorom kvitne, potom jednoducho nastavíme nové značky a zvolíme poradie, v akom sa objavia:

ruža

Proces vytvárania dokumentu XML je veľmi jednoduchý a vyžaduje len základné znalosti HTML a pochopenie úloh, ktoré je potrebné vykonať pomocou XML ako značkovacieho jazyka. To dáva vývojárom jedinečnú schopnosť definovať vlastné príkazy, ktoré im umožňujú najefektívnejšie definovať údaje obsiahnuté v dokumente. Autor dokumentu vytvára jeho štruktúru, vytvára potrebné spojenia medzi prvkami pomocou príkazov, ktoré spĺňajú jeho požiadavky, a dosahuje typ označenia, ktorý potrebuje na vykonávanie operácií prezerania, vyhľadávania a analýzy dokumentu.

Ďalšou zjavnou výhodou XML je možnosť použiť ho ako univerzálny dopytovací jazyk pre informačné úložiská. Dnes W3C uvažuje o pracovnej verzii štandardu XML-QL (alebo XQL), ktorý môže byť v budúcnosti vážnou konkurenciou SQL. Okrem toho môžu dokumenty XML fungovať ako jedinečný spôsob ukladania údajov, ktorý zahŕňa prostriedky na analýzu informácií a ich prezentáciu na strane klienta. V tejto oblasti je jednou z perspektívnych oblastí integrácia technológií Java a XML, čo umožňuje využiť silu oboch technológií pri budovaní strojovo nezávislých aplikácií využívajúcich aj univerzálny dátový formát na výmenu informácií.

XML tiež umožňuje kontrolovať správnosť údajov uložených v dokumentoch, kontrolovať hierarchické vzťahy v rámci dokumentu a stanoviť jednotný štandard pre štruktúru dokumentov, ktorých obsahom môžu byť rôzne údaje. To znamená, že ho možno použiť pri budovaní komplexných informačných systémov, v ktorých je veľmi dôležitá otázka výmeny informácií medzi rôznymi aplikáciami bežiacimi v rovnakom systéme. Vytvorením štruktúry mechanizmu výmeny informácií na samom začiatku práce na projekte sa manažér môže v budúcnosti ušetriť od mnohých problémov spojených s nekompatibilitou dátových formátov používaných rôznymi komponentmi systému.

Jednou z výhod XML je aj to, že programy, ktoré spracovávajú dokumenty XML, nie sú zložité a už sa objavili všetky druhy softvérových produktov určených na prácu s dokumentmi XML a sú voľne šírené. XML je podporovaný v IE5. Bolo oznámené, že bude podporovaný v nasledujúcich verziách aplikácií Netscape Communicator, Oracle DBMS, DB-2 a MS-Office. To všetko dáva dôvod predpokladať, že s najväčšou pravdepodobnosťou sa v blízkej budúcnosti XML stane hlavným jazykom výmeny informácií pre informačné systémy, čím nahradí HTML. Známe špecializované značkovacie jazyky ako SMIL, CDF, MathML, XSL už boli vytvorené na báze XML a zoznam pracovných návrhov nových jazykov, ktoré W3C zvažuje, neustále rastie.

Jazyk XSLT sa používa na spracovanie dokumentov, vykonávanie zmien a potrebných doplnkov značenia. Môže sa použiť na konverziu kódu XML na formátovaný kód HTML, ktorý je ľahko čitateľný pre ľudí. Môžete tiež previesť dokument XML na obyčajný text alebo iný reštrukturalizovaný dokument XML, alebo dokonca na dokument JavaScript. Jazyk XSLT poskytuje prístup k obsahu XML dokumentov a používa sa aj na vytváranie nových dokumentov na ich základe. Z vyššie uvedených dôvodov sa oplatí študovať jazyk XSL.

Najbežnejším procesom je konvertovať dokumenty XML na dokumenty HTML a toto je operácia, ktorú pokrývajú príklady v tejto kapitole.

Na vykonanie transformácie XSLT sa používajú dva dokumenty: konvertovaný dokument a šablóna štýlov, ktorá definuje samotnú transformáciu. V tomto prípade hovoríme o XML dokumentoch.