Syntax PHP. Základy HTML - syntax jazyka, značky (tagy) Kompletný zoznam prvkov HTML

Syntax HTML

V tomto článku sa pozrieme na syntax HTML a ako správne napísať HTML kód.

Štruktúra HTML dokumentu

Pri písaní HTML kódu v poznámkovom bloku je vhodné držať sa jedného štýlu. Obrys štandardného HTML dokumentu vyzerá takto:

Názov stránky <title> </head> <body> <h1>Názov článku</h1> <p>Článok odsek</p> </body> </html> </p><p>Každý HTML dokument musí začínať riadkom<!DOCTYPE html>, to znamená, že kód v dokumente bude napísaný v HTML. Potom prichádza na rad samotný HTML kód <html> </html> .</p> <p>Medzi značkami <html> </html> sú dva hlavné bloky, prvý blok je <span>hlavička HTML dokumentu</span>, ktorá začína a končí značkami <head> </head>, druhý blok je <span>telo HTML dokumentu</span>, ktorá začína a končí značkami <body> </body> .</p> <p>AT <span>hlavička HTML dokumentu</span> obsahuje rôzne informácie o službe, ktoré používateľ nevidí (okrem značky title), obsahuje nasledujúce značky: <br> <title> - názov stránky HTML,
- meta tagy, obsahujú servisné informácie o stránke,
- značka odkazujúca na externé súbory, ako napríklad .css , .ico atď.,
- značky môžu obsahovať kód JavaScript alebo odkazovať na externý súbor .js

AT telo HTML dokumentu zvyčajne obsahuje hlavné informácie, ktoré vidíme na stránke, môžu tam byť nasledujúce značky:

- názov článku, prvá úroveň,
- obraz,
- odsek,
- odkaz,
- stôl,
— formulár na zadávanie údajov,
atď.

Pravidlá pre písanie HTML kódu

Pozrime sa na niektoré pravidlá písania HTML kódu. Tieto pravidlá sú potrebné, aby bolo neskôr vhodné pochopiť vlastný kód.

  • Blokové štítky, ktoré sú vo vnútri iných štítkov, by mali byť umiestnené o jeden riadok nižšie a o jednu medzeru (podľa potreby tabulátor) napravo od štítku, v ktorom sú umiestnené. Napríklad nadpis h1 a odsek p sú umiestnené týmto spôsobom vzhľadom na značku body v osnove dokumentu HTML na začiatku tohto článku.
  • Uzatváracie a otváracie značky toho istého prvku môžu byť buď na rovnakej úrovni, ako napríklad značky , alebo sa koncová značka môže objaviť na konci textu, ako sú koncové značky prvkov title , h1 a p.
  • Prvky, ktoré sú navzájom ekvivalentné, môžu byť tiež umiestnené na rovnakej úrovni; v schéme dokumentu HTML, ktorá sa nachádza vyššie, sú hlava a telo, h1 a p navzájom ekvivalentné.
  • V skutočnosti je možné všetok kód HTML napísať na jeden riadok a prehliadač bude stále správne zobrazovať stránku HTML. Pravidlá syntaxe jazyka HTML, kde sa značky musia písať pod sebou a naľavo, existujú len preto, aby v budúcnosti bolo pre správcu webu pohodlnejšie vytvárať a upravovať kód stránky HTML.

Tu je niekoľko ďalších bodov, ktoré je potrebné zvážiť pri vytváraní kódu:

  1. Bez ohľadu na to, koľko miest vložíte textový editor, prehliadač ich zobrazí ako jeden priestor.
  2. Prehliadač nerozpozná zlomy riadkov a tabulátory v textovom editore.
  3. Ak potrebujete zlomiť riadok, ktorý by mal byť viditeľný na stránke HTML, použite značku
    .
  4. Ak potrebujete tabulátor (napríklad na vytvorenie „červenej“ čiary), ktorá musí byť viditeľná na stránke HTML, použite buď niekoľko špeciálnych znakov s nezalomiteľnou medzerou, alebo vlastnosť CSS zarážka textu.

Alexander Kičatov

Ako fungujú PHP skripty

Iste poznáte princíp fungovania rádiom riadených áut. Stlačte dopredu - auto sa pohne, stlačte vľavo - auto zmení smer kolies.

PHP funguje úplne rovnako. Príkazy píšete jeden za druhým a PHP ich vykonáva postupne.

Čo je PHP skript

PHP skript je obyčajný textový súbor s príponou .php. Presne to isté ako html a css.

Ale je tu jeden dôležitý rozdiel:

Skripty sa spúšťajú iba prostredníctvom http požiadaviek v prehliadači. To znamená, že ak chcete spustiť skript script.php, musíte do panela s adresou prehliadača napísať site.ru/script.php

Ak skript nefunguje, skontrolujte aktuálnu adresu URL. Ak existuje niečo také file:///D:/openserver/domains/site.ru/script.php- to znamená, že sa snažíte neprechádzať na stránku webu, ale v prehliadači otvoriť samotný súbor PHP. nie je to správne.

Webové servery sú najčastejšie nakonfigurované tak, že keď vstúpite na hlavnú stránku (napríklad site.ru ), automaticky sa spustí súbor index.php alebo index.html umiestnený v koreňovom adresári stránky.

Vytvorte súbor s názvom index.php v koreňovom priečinku stránky a otvorte ho vo svojom textovom editore. Ak existuje súbor index.html, musí sa odstrániť.

Ak ešte nemáte textový editor, odporúčam ľahký a bezplatný Notepad++, je oveľa pohodlnejší ako poznámkový blok zabudovaný vo Windowse.

Nezabudnite dodržiavať kódovanie skriptov. Kódovanie musí byť buď UTF-8 bez kusovníka(ak je k dispozícii vo vašom editore), alebo len UTF-8.

Tlač čísel a reťazcov v PHP

Príkazy PHP sa píšu medzi značky, napríklad:

Príkaz echo je zodpovedný za zobrazovanie informácií na obrazovke. Za operátorom nasleduje hodnota, ktorá sa má zobraziť.

Ak chcete zobraziť text, musí byť uzavretý v jednoduchých alebo dvojitých úvodzovkách:

Príkazy v PHP sú oddelené bodkočiarkou. Kvôli čitateľnosti je každý príkaz zvyčajne napísaný na novom riadku:

Výsledok v prehliadači:

Toto je PHP kód.

Výstup HTML kódu v PHP

HTML kód je možné kombinovať s PHP príkazmi:

HTML kód možno nahradiť aj reťazcom PHP:

Napoleon"; ?>

Výsledok v prehliadači:

Slon Napoleon

PHP kód a HTML tagy môžeme kombinovať akýmkoľvek spôsobom:

Riadok 2" ?>

Funkcie v PHP

Funkcia je príkaz, ktorý vykonáva nejakú akciu, ako sú výpočty, správa súborov atď.

Definovanie funkcie je jednoduché – za názvom má zátvorky:

Funkcia phpinfo() zobrazuje informácie s aktuálnymi nastaveniami PHP.

Niektoré funkcie očakávajú, že im bude odovzdaná hodnota. Napríklad funkcia zaokrúhľovania ceil() očakáva číslo, ktoré zaokrúhli:

Funkcia ceil() prevezme hodnotu 91,5, ktorú sme odovzdali, spracuje ju (zaokrúhli na 92) a vráti výsledok. A príkaz echo vezme hodnotu vrátenú funkciou a zobrazí ju na obrazovke. Výsledkom tohto skriptu bude 92 .

Potreba uzatváracej značky v PHP

Ak po príkazoch PHP nie je žiadny HTML alebo iný výstup na obrazovku, potom môžeme vynechať koncovú značku ?>:

Skratka syntaxe otvorenej značky v PHP

Namiesto

Okrem toho môžeme štítok nahradiť

Použitie značky

Toto nesúvisí so značkou.

Internet je celosvetová sieť, ktorá spája počítačové siete po celom svete na základe spoločných štandardných dohôd (protokolov) o spôsobe výmeny informácií a jednotného adresného systému.

K dnešnému dňu si internet získal bezprecedentnú popularitu. Podľa odborníkov internet spája viac ako 100 miliónov počítačov. Viac ako 300 miliónov ľudí využíva internetové služby v 170 krajinách sveta.

Z funkčného hľadiska je internet:

ü lacné vysokorýchlostné komunikačné prostriedky medzi účastníkmi na celom svete;

ü bezkonkurenčné úložisko informácií v akejkoľvek oblasti vedomostí;

ü nové perspektívne prostredie pre aktivity.

Vplyv internetu siaha nielen do technologickej oblasti počítačových komunikácií, ale má aj sociálne zameranie a preniká do celej spoločnosti ako operačný prostriedok získavania vedomostí, čoraz viac sa rozširuje elektronický obchod.

Najbežnejšia a najobľúbenejšia je dnes taká internetová služba ako WWW (World Wide Web - World Wide Web). Informácie na WWW sú prezentované vo forme takzvaných hypertextových (alebo všeobecnejšie hypermediálnych) dokumentov, ktoré môžu obsahovať formátovaný text, grafiku, audio a video fragmenty.Hlavným znakom hypertextových dokumentov je prítomnosť aktívnych zón, ktoré sú citlivé na kliknutia myšou Aktívne časti textu môžu byť , celé obrázky a ich časti, kliknutie na aktívnu zónu spôsobí načítanie (cieľového) dokumentu priradeného k tejto zóne.

Ak sa chcete naučiť uverejňovať materiály na internete, musíte sa najprv zoznámiť s jazykom hypertextových značiek. HTML (H yper T ext M arkup L uhol)

Základy jazyka HTML

Značkovací jazyk HTML pre hypertextové dokumenty je súbor príkazov nazývaných tagy (z angl tag). HTML tagy nachádzajúce sa v texte dokumentu interpretuje prehliadač pri zobrazení dokumentu.

Prezeranie HTML dokumentov sa vykonáva pomocou programov- prehliadačov(z angličtiny prehliadač), ktoré vykresľujú dokument podľa značiek HTML a poskytujú navigáciu pomocou hypertextových odkazov. Najbežnejšie prehliadačeMicrosoftinternetprieskumník Microsoft Corporation a NetscapeNavigátor od spoločnosti Netscape Communications Corporation.

Keďže dokument HTML je textový súbor, možno ho pripraviť v jednoduchom textovom editore, akým je napríklad poznámkový blok ( Poznámkový blok), ale je to veľmi náročné na prácu. Častejšie sa používajú špecializované editory určené špeciálne na prípravu HTML dokumentov, ktoré umožňujú vkladať tagy pomocou tlačidiel na paneli nástrojov alebo príkazov menu a nastavovať atribúty tagov v dialógových oknách, napr. Macromedia dreamweaver, Microsoftpredná strana,domovskej stránke atď.

HTML dokument je možné získať konverziou do formátu HTML, napríklad z formátu dokumentu balíka Microsoft Office. Treba si uvedomiť, že pri takejto transformácii je zdrojový text HTML dokumentu extrémne nadbytočný a je potrebné ho opraviť, oveľa efektívnejšie je použiť špeciálne HTML editory.

Syntax značiek HTML

HTML tag je napísaný v lomených zátvorkách (znaky) a pozostáva z názvu, za ktorým môže nasledovať zoznam atribútov (voliteľné pre väčšinu tagov). Názvy a atribúty sú anglické slová a skratky.

Značky možno podmienečne rozdeliť do dvoch skupín:

Spárovanétagy (nazývané aj kontajnerov) majú dve zložky: otváranie (počiatočné) a zatváranie (konečné); uzatvárací komponent má rovnaký názov, ale keď je napísaný, pred názvom je lomka (symbol / ). Medzi otvárací a zatvárací komponent je možné umiestniť text dokumentu a iné značky. Fragment dokumentu nachádzajúci sa medzi otváracím a uzatváracím prvkom kontajnerovej značky naformátuje prehliadač podľa významu značky. Napríklad text umiestnený medzi značkami a, sa zobrazí tučným písmom (názov značky – z angl tučný). Spárované značky môžu byť vnorené do seba, ale nesmú sa prekrývať.

Nespárovanétagy (nazývané aj autonómny) nemajú konečnú zložku. Pri ich interpretácii sa do zobrazeného dokumentu vloží jeden alebo druhý objekt. Napríklad tag , ktorý sa vyskytuje v tele dokumentu HTML, spôsobí vloženie grafického obrázka zo súboru pict.gif.

Atribúty v zozname sú od seba oddelené jednou alebo viacerými medzerami, tabulátormi alebo novými riadkami; poradie, v ktorom sú atribúty zapísané, nie je dôležité. Prevažná väčšina atribútov sa používa v pároch. názov atribútu = hodnota atribútu. Ak je hodnota atribútu viac ako jedno slovo alebo jedno číslo, musí byť uzavretá v jednoduchých alebo dvojitých úvodzovkách. V komponentoch uzatváracej značky nie sú špecifikované atribúty.


Tu je príklad značky s atribútmi:

Názov značky Názov atribútu

Hodnota atribútu

Názov atribútu

Hodnota atribútu

Ahoj !

Keď prehliadač narazí na takúto značku v dokumente HTML, interpretuje ju tak, že zobrazí text za značkou so znakmi zväčšenými v porovnaní so základnou veľkosťou (SIZE=+2) a červenou (COLOR=RED); toto formátovanie textu sa použije, kým sa nenájde koncová značka.

Veľkosť písmen v položkách značiek a atribútov nie je dôležitá.

Štruktúra HTML dokumentu

Dokument HTML je uzavretý v značkách a. Medzi týmito značkami sú dve časti: hlavička (medzi značkami a) a časť tela dokumentu (medzi značkami a). .Časť tela dokumentu obsahuje zamýšľaný hlavný text na zobrazenie v prehliadači, formátovanie značiek, umiestnenie obrázkov, tabuliek, hypertextových odkazov atď.

HTML - kód najjednoduchšieho dokumentu vhodného na umiestnenie na internete vyzerá takto:

< TITLE > Naša prvá stranaTITLE >

Najjednoduchší HTML dokument

Tento kód je možné zadať do textového editora Poznámkový blok a uložiť ako súbor s príponou . htm alebo. html - v tomto prípade sa dokument predvolene otvorí v prehliadači nainštalovanom na vašom počítači. Prehliadač zobrazí tento dokument tak, že vo svojom okne zobrazí reťazec „Najjednoduchší dokument HTML“, ktorý sa nachádza v časti tela dokumentu. Fráza „Naša prvá stránka“ sa zobrazí v záhlaví prehliadača.

Sekcia HEAD

Sekcia hlavičky zvyčajne obsahuje značky, ktoré sú pre používateľa neviditeľné, no napriek tomu môžu aktívne ovplyvniť vzhľad dokumentu.

Tag

Účel

Určuje názov celého dokumentu. Názov sa zvyčajne zobrazuje v záhlaví okna prehliadača. Tento prvok je povinný pre akýkoľvek HTML dokument a môže byť zadaný maximálne raz.

Určuje základnú adresu aktuálneho dokumentu (URL), ktorá bude východiskovým bodom pre výpočet relatívnych adries v rámci dokumentu. Prvok nemá koncovú značku. Musí byť prítomný aspoň jeden z argumentov:

HREF- určuje základnú adresu (URL) aktuálneho dokumentu.

CIEĽ- definuje názov rámca, ktorý sa bude štandardne používať v hypertextových odkazoch. To môže byť užitočné, ak chcete otvoriť všetky odkazy v dokumente v inom rámci.

< STYLE TYPE= "text/css">

Slúži na vloženie kaskádových štýlov (CSS - Cascade Style Sheet) do dokumentu. TYPE je povinný atribút, ktorého hodnota je zvyčajne " text/css".

< МЕТА …>

Prvok META sa používa na technický popis dokumentu. Pomocou tohto prvku sa do názvu dokumentu vnesú ďalšie užitočné informácie, ktoré používateľ nevidí, no niekedy sú jednoducho nevyhnutné pre správne indexovanie vašej stránky robotmi vyhľadávacích nástrojov. Prvok nemá koncovú značku.

NAME – určuje názov meta príspevku. Existuje mnoho preddefinovaných mien, niektoré z nich môžete vidieť v príklade nižšie.

OBSAH - Priradí hodnotu meta príspevku zadanú v parametri NAME.

Sekcia BODY

Táto sekcia obsahuje hlavný obsah webovej stránky – text dokumentu, obrázky, tabuľky atď. Prvok BODY sa musí v dokumente objaviť maximálne raz a môže obsahovať nasledujúce atribúty:

Syntax atribútu

Účel

MARGINHEIGHT= číslo

Určuje šírku (v pixeloch) horného a spodného okraja dokumentu. Funguje iba v prehliadačoch Netscape

TOPMARGIN= číslo

Určuje šírku (v pixeloch) horného a spodného okraja dokumentu. Funguje iba v prehliadačoch Internet Explorer

MARGINWIDTH= číslo

Určuje šírku (v pixeloch) ľavého a pravého okraja dokumentu. Funguje iba v prehliadačoch Netscape

ĽAVÝ OKRAJ= číslo

Určuje šírku (v pixeloch) ľavého a pravého okraja dokumentu. Funguje iba v prehliadačoch Internet Explorer

POZADIE= URL

Určuje obrázok, ktorý vyplní pozadie (tapetu). Hodnota je uvedená v absolútnej alebo relatívnej adrese obrázka (pozri časť Umiestnenie výkresov)

BGCOLOR= farba

Určuje farbu pozadia dokumentu.

Microsoftinternetprieskumníkpodporuje 16 štandardných názvov farieb ( aqua , čierna , modrá , fuchsiová , šedá , zelená , limetková , gaštanová , námornícka , olivová , fialová , červená , strieborná , modrozelená , žltá , biela )

Ďalším spôsobom je použitie farebného kódu vo forme šesťmiestneho hexadecimálneho čísla, ktoré určuje intenzitu červenej (prvé dve číslice), zelenej (ďalšie dve číslice) a modrej (posledné dve číslice) zložky. Intenzita každej zložky v šestnástkovej sústave sa pohybuje od 00 do FF. Pri zadávaní farby ako hodnoty atribútu nejakého tagu sa pred hexadecimálne číslo umiestni znak #.

Napríklad vstup COLOR="#0000FF “ znamená modrá

Napriek základnej možnosti nastavenia miliónov farieb je potrebné mať na pamäti, že prehliadače zobrazujú iba 256 farieb a každý prehliadač má svoju vlastnú farebnú paletu. V tejto palete prehliadač vyberie farbu, ktorá je najbližšie k zadanej

TEXT= farba

Určuje farbu textu v dokumente

LINK= farba

Určuje farbu hypertextových odkazov v dokumente

ALINK= farba

Určuje farbu zvýraznenia pre hypertextové odkazy po kliknutí.

VLINK

Určuje farbu hypertextových odkazov na už zobrazené dokumenty

Formátovanie textu

Formátovanie znakov

Všetky značky formátovania znakov majú otvárací aj uzatvárací komponent a pôsobia na text medzi nimi.

Hlavná značka je ... FONT>, ktorý sa musí použiť s jedným alebo viacerými atribútmi, ktoré menia veľkosť písma, farbu a typ písma:

Syntax atribútu

Účel

VEĽKOSŤ = význam

Veľkosť sa zadáva buď vo forme absolútnej hodnoty (číslo od 1 do 7) alebo relatívne k hlavnej veľkosti písma (v tvare +n alebo -n).

FARBA= farba

Farba

TVÁR= zoznam fontov

Typy písma na zobrazovanie textu; názvy sú uvedené v poradí podľa preferencie oddelené čiarkami, napr.FACE="Verdana,Helvetica,arial,Bez-Serif"

Môžete tiež určiť jedno z písiem, ale majte na pamäti, že toto písmo nemusí byť nainštalované na počítači používateľa a „exotické“ písma nebudú prehliadačom zobrazené

Okrem toho sa značky používajú na zmenu štýlu znakov:

. .. (z angl. bold) − tučný typ;

.. . (z angličtiny italic) - kurzíva;

... (z angličtiny TeleType) − jednopriestorové písmo;

... (z angličtiny u podčiarknuté) − podčiarknuté;

... S > (z angličtinys trojkolka) - prečiarknutý;

... (z angličtiny s ub skript) − dolný index;

... (z angličtiny súp erscript) je horný index.

Text medzi značkami

a (z angličtiny pre naformátovaný) sa zobrazí tak, ako bol predtým naformátovaný, vrátane všetkých medzier a zlomov riadkov.

Formátovanie odsekov

Text sa zobrazuje v okne prehliadača slovo po slove, po dosiahnutí pravého okraja okna sa ďalšie slovo automaticky zalomí do nového riadku. Aj keď bolo v kóde stránky zadaných niekoľko medzier alebo bol text napísaný na nový riadok, tieto akcie sa pri prezeraní v prehliadači nezobrazia. Preto na zobrazenie série po sebe nasledujúcich medzier alebo niekoľkých prázdnych riadkov v texte musíte použiť rôzne značky.

Tag
(z angličtiny b reakciu) preruší tok textu a vloží nový riadok bez vytvorenia nového odseku. Viacero po sebe idúcich značiek
sa interpretujú ako niekoľko prázdnych riadkov. Riadkovanie je jednoduché. Značka nemá uzatváraciu zložku ani atribúty.

Tag(z angličtiny p aragraf) začína odsek; nový odsek je od predchádzajúceho oddelený dvojitým riadkovaním. Odsek nemôže byť prázdny, teda niekoľko po sebe idúcich značiek

sa interpretujú ako jedna (na rozdiel od značky
).Uzáverový komponent

voliteľné, pretože predchádzajúci odsek končí tam, kde začína nový. Značka má voliteľný atribút ALIGN, ktorý označuje typ zarovnania odseku, ktorý môže nadobúdať hodnoty LEFT, CENTER, RIGHT a OPRVODNITE s uvedením zarovnania doľava, na stred, doprava a do bloku. Text v značkách bude tiež vycentrovaný.

...

Ak je uzatváracia zložka

vynechaný, potom sa zadaný typ zarovnania zachová až do ďalšej značky, ktorá špecifikuje zarovnanie, alebo do konca dokumentu.

HTML vám umožňuje formátovať odseky ako číslované zoznamy alebo zoznamy s odrážkami. Textový fragment, ktorým je zoznam, je uzavretý v značkách:

objednaný (číslovaný) zoznam (z angličtiny o objednal l ist)

neusporiadaný (označený) zoznam (z anglického u objednané l ist)

Každý prvok zoradeného alebo neusporiadaného zoznamu je uzavretý v značkách ... (z anglického l ist i tému). Pri zobrazovaní textu bude každý prvok zoznamu umiestnený na novom riadku označenom číslom alebo značkou. Okrem toho môže mať zoznam názov, ktorý je určený značkou (z angl l ist h hlavička). Záverečné štítky a sú voliteľné.

číslovaný zoznam

odrážkový zoznam

Prvok kódu

< O L>

hlavička

Prvý prvok

Druhý prvok

Tretí prvok

< U L>

hlavička

Prvý prvok

Druhý prvok

Tretí prvok

L>

Zobraziť v prehliadači

hlavička

1. Prvý prvok

2. Druhý prvok

3. Tretí prvok

hlavička

· Prvý prvok

· Druhý prvok

· Tretí prvok

Viacúrovňový zoznam možno usporiadať kombináciou číslovaných zoznamov a zoznamov s odrážkami.

Značka má voliteľné atribúty:

Syntax atribútu

Účel

TYP= formát

formát číslovania môže mať hodnoty:

arabské číslice (predvolené)

veľké písmená

malými písmenami

veľké rímske číslice

malé rímske číslice

START = hodnota

prvé číslo v zozname (predvolené 1)

Značka má voliteľný atribút

Syntax atribútu

Účel

TYP= formát

formát značky môže byť:

disk

disk (predvolené)

Kruh

kruh

Námestie

Námestie

Odseky môžu byť usporiadané aj ako nadpisy úrovní (od n = 1 až n =6), na tento účel značky formulára n > ...n >. Nadpis prvej úrovne je zobrazený najväčším písmom.

značky

, ... ,

môže mať atribút zarovnania ALIGN s hodnotami LEFT, RIGHT a CENTER.

Umiestnenie výkresov

Obrázky, ktoré prehliadač zobrazuje pri prezeraní webovej stránky, sú uložené v samostatných súboroch daného formátu gif , jpg (jpeg ) alebo png a v kóde stránky sa vytvorí odkaz na požadovaný súbor. Na to slúži nepárový tag, ktorý má jeden povinný a množstvo voliteľných atribútov.

Požadovaný atribút:

SRC= url

Adresa grafického súboru (relatívna alebo absolútna)

ALT= text

Alternatívny text zobrazený v režime prehliadača bez načítania obrázkov (musí byť uzavretý v úvodzovkách)

HRANICIA= význam

Hrúbka okrajového rámca v pixeloch, 0 znamená bez okraja (predvolené)

BORDERCOLOR= farba

Nastaví farbu rámčeka

VÝŠKA= význam

Výška obrázka v pixeloch (predvolene originál) alebo ako percento výšky okna prehliadača

ŠÍRKA = význam

Šírka obrázka v pixeloch (predvolene originál) alebo ako percento šírky okna prehliadača

HSPACE= význam

Voľné miesto naľavo a napravo od obrázka v pixeloch

VSPACE= význam

Voľné miesto nad a pod obrázkom v pixeloch

ZAROVNAŤ= význam

Horizontálne zarovnanie obrázka.

Ak sú uvedené hodnotyĽavá alebo pravá , obrázok bude zarovnaný vodorovne primerane, nastavenie týchto hodnôt zaistí, že sa text bude obtekať okolo obrázka

Pozrime sa bližšie na absolútne a relatívne spôsoby adresovania súboru.

Adresovanie v absolútnej forme používa sa pri odkazovaní na zdroje umiestnené na iných serveroch. Univerzálna adresa, ktorá určuje umiestnenie informačného zdroja, sa nazýva URL(Uniform Resource Locator – jednotná adresa zdroja). Adresa URL pozostáva z dvoch častí oddelených dvojbodkou. Prvá časť označuje typ sieťového protokolu, ktorý závisí od typu zdroja. Napríklad, ak sa zdroj nachádza na WWW serveri, ide o protokol http.Druhá časť obsahuje názov počítača (servera) v systéme názvov domén a (ak je to potrebné) názov cesty k súboru. Pri písaní názvu cesty sú názvy adresárov oddelené lomkou (znak / ), v názvoch súborov a adresárov rozlišovať medzi veľkými a malými písmenami, medzery nie sú povolené. Tu sú príklady adries URL:

http://www. vshu. kirov.ru/site/images/picture 1.jpg

http://195.21.123.13:8110

ftp://everything.com/soft/prog.zip

mailto: Táto e-mailová adresa je chránená pred spamovacími robotmi. Ak ju chcete vidieť, musíte mať povolený JavaScript.

Posledná adresa URL smerujúca na protokol poslať poštou a e-mailová adresa, neodkazuje na žiadny informačný zdroj; je to jediný typ adresy URL, ktorý nemá za dvojbodkou dve lomky.

Adresovanie obrázkov v absolútnej podobe sa pri tvorbe webu prakticky nepoužíva.

Relatívne adresovanie používa sa pri odkazovaní na zdroje umiestnené na rovnakom serveri. Pri zápise cesty k súboru sú názvy adresárov oddelené lomkou (znak / ), prechod cez adresáre súborového systému o úroveň vyššie je označený dvomi bodkami (symboly .. ). Aby to bolo jasnejšie, predstavte si počítač napríklad s nasledujúcou adresárovou štruktúrou obsahujúcou súbory HTML:

SHAPE\* MERGEFORMAT

moja stránka

Pa ges

snímky

Strana1.htm

Strana2.htm

Obr.1.jpg

Obr.2.jpg

Index.htm

Obrázok.jpg

V tomto prípade sú napríklad možné takéto možnosti zápisu značky img:

ü < IMG SRC = Picture . jpg >(obrázok Obrázok .jpg nachádza na stránke index. htm)

ü < IMG SRC = Images / Pict 1. jpg >(obrázok obr. 1.jpg nachádza na stránke index. htm)

ü < IMG SRC =../ Picture . jpg >(obrázok Obrázok .jpg nachádza na stránke Strana 1.htm)

ü < IMG SRC =../ Images / Pict 1. jpg >(obrázok obr. 1.jpg nachádza na stránke Strana 1.htm)

Formálne je síce vyžadovaný iba atribút SRC, v praxi je však potrebné zadať aj alternatívny text (atribút ALT), keďže veľa ľudí pracuje s prehliadačom v režime bez načítania obrázkov.

Výška a šírka oblasti, v ktorej sa obrázok zobrazuje, sa určuje pomocou atribútov šírky a výšky v pixeloch alebo ako percento veľkosti obrazovky. Keď je nastavený jeden z týchto atribútov, mierka výkresu sa upraví tak, aby sa jeho výška alebo šírka zhodovala so zadaným. Druhá veľkosť sa nastaví automaticky vo vhodnom pomere. Použitie iba jedného z atribútov zmení oba rozmery výkresu.
Ak explicitne nastavíte oba atribúty, potom sa mierka obrázka upraví pozdĺž dvoch osí v súlade so zadanými rozmermi. Atribúty výška a šírka nemenia čas načítania obrázka, ale iba jeho vzhľad (veľkosť) na obrazovke.

Hypertextové odkazy

Hypertextový odkaz je objekt (text, obrázok, fragment obrázka), ktorý sa po kliknutí presunie do nového dokumentu alebo fragmentu dokumentu. Sú to hypertextové odkazy, ktoré vám umožňujú organizovať prechody medzi akýmikoľvek dokumentmi zverejnenými na internete.

Textové hypertextové odkazy

Prepojenie medzi dokumentmi HTML a fragmentmi dokumentov je organizované pomocou značky ... (z angličtiny anchor - kotva).

Značka sa používa na vytvorenie prepojenia na iný dokument, ako aj na prepojenie na fragment dokumentu.

Požadovaný atribút:

HREF= url

Adresa cieľového dokumentu (môže byť prezentovaná v absolútnej a relatívnej forme)

Hlavné voliteľné atribúty:

NAME=" názov"

Značky medzi< A > a A > fragment dokumentu ako možný referenčný objekt. Ako hodnotu, ktorú potrebujete latinčina napíšte ľubovoľné ukazovacie slovo jedinečné pre dokument. Napríklad tag Sekcia 1 vytvorí takzvaný štítok (záložku) na prechod do sekcie 1 . V tomto prípade sa môžete odkazovať na označenú oblasť jednoduchým zadaním jej názvu za názvom dokumentu (pred názvom značky je znak #).

takže, < AHREF="index.html#časť 1"> K časti 1A >vás pošle na "časť 1" súboru Index .html a
< AHREF="#časť 2"> K časti 2A > - do sekcie „časť“. 2" aktuálneho dokumentu za predpokladu, že dokument má zodpovedajúce označenie

TARGET=" názov"

Názov rámca (rámčeka) alebo okna pre výstup cieľového dokumentu.

Tento atribút sa používa iba v spojení s parametrom HREF. Hodnota musí byť buď názov jedného z existujúcich rámcov, alebo jeden z nasledujúcich rezervovaných názvov:

_ja- označuje, že dokument definovaný v parametri HREF sa má zobraziť v aktuálnom rámci;
_rodič- označuje, že dokument sa má zobraziť v nadradenom rámci aktuálneho rámca (zaberá celé okno prehliadača);

_blank- určuje, že dokument sa má zobraziť v novom okne

TITLE="(!LANG: text!}"

Zobrazí popis pri umiestnení kurzora myši na hypertextový odkaz

Text a obrázky umiestnené medzi značkami sa stanú aktívnou oblasťou dokumentu citlivou na kliknutie myšou, ktoré spôsobí načítanie cieľového dokumentu. Text hypertextového odkazu je zvýraznený podčiarknutím a farbami špecifikovanými ako hodnota atribútov LINK, ODKAZ, V Značka LINK (alebo predvolená farba).

Hypertextové odkazy na obrázky

Na vytvorenie hypertextového odkazu z celého obrázka sa používa aj značka. ... ., len namiesto textu (alebo spolu s textom) medzi < A > a A >umiestnená značka< img ...> so všetkými relevantnými atribútmi.

Napríklad , .

Hyperlinková mapa

Značka vám umožňuje urobiť z textového fragmentu alebo obrázka aktívnu zónu úplne; za účelom rôzne fragmenty rovnakého obrázka boli odkazované na rôzne cieľové dokumenty, budete musieť použiť značku, ktorá implementuje obrázkovú mapu.

Jediný povinný atribút pre kontajnerovú značku je NÁZOV, ktorého hodnotou bude názov (napr. NAME=" moja mapa", ktorý by sa mal použiť pri popise atribútu USEMAP Značka IMG popisujúca obrázok, ktorý má slúžiť ako mapa (zároveň # − USEMAP="# moja mapa")

Vo vnútri kontajnera musí mať každá oblasť obrázka citlivá na myš zodpovedajúcu značku s nasledujúcimi atribútmi:

Syntax atribútu

Účel

COORDS= zoznam

Čiarkami oddelený zoznam súradníc aktívnej zóny (závisí od typu zadaného tvaru zóny)

HREF= url

TVAR= formulár

Definuje tvar aktívnej zóny. Možné hodnoty pre tento atribút:

kruh(kruh - nastavený súradnicami stredu a polomeru v pixeloch);

rect(obdĺžnik - nastavený súradnicami ľavého horného a pravého dolného rohu);

poly(polygón - daný súradnicami jeho vrcholov)

Vo všetkých prípadoch sa súradnice počítajú od ľavého horného rohu obrázka v pixeloch, os X smeruje doprava, os Y - dole.

NOREF

niekedy je potrebné uviesť, že daná zóna (určená atribútom SHAPE a súradnicami COORDS) nie je aktívna, nereaguje na kliknutie myšou

tabuľky

Tabuľky v dokumentoch HTML sa nepoužívajú ani tak na usporiadanie údajov v orámovaných bunkách, ale na vzájomné umiestnenie častí textu a obrázkov.

Tabuľky v HTML postavené rad za radom. Všetky tabuľkové údaje sú uzavreté v značkách

; popis každého riadku buniek (riadkov) je uzavretý v značkách ... ; obsah každej bunky je uzavretý v značkách ... (bežné bunky) príp H > ...h>(nadpisy) .

Ak teda chcete opísať napríklad tabuľku dvoch riadkov, z ktorých každý obsahuje dve bunky, budete musieť vytvoriť nasledujúcu konštrukciu:

Bunky tabuľky môžu obsahovať text, obrázky, vnorené tabuľky atď. Bunky tabuľky by nemali zostať prázdne; ak má bunka vyzerať ako prázdna, vložte do nej nezalomiteľnú medzeru.

Text umiestnený v bunkách tabuľky v predvolenom nastavení automaticky umiestňuje prehliadač; text sa zobrazuje slovo po slove; keď sa dosiahne pravý okraj bunky, ďalšie slovo sa prenesie na nový riadok.

Bunky tabuľky môžu zahŕňať viacero riadkov alebo stĺpcov; pri popise takýchto buniek sa používajú atribúty ROWSPAN (bunka, ktorej značka obsahuje tento atribút, je „natiahnutá“ o zadaný počet riadkov) a COLSPAN (bunka je „natiahnutá“ o niekoľko stĺpcov ). Tu je príklad usporiadania tabuľky so zlúčenými bunkami:

< TR >

< TD ROWSPAN=2> 1-1 td >

Značky, ktoré popisujú tabuľky, majú množstvo voliteľných atribútov.

Atribúty značky nastavujú parametre tabuľky ako celku:

Syntax atribútu

Účel

ALIGN = hodnota

Zarovnanie vzhľadom na tok textu; možné hodnoty sú vľavo, vpravo a na stred

POZADIE= url

Obrázok na pozadí pre celý stôl

BGCOLOR= farba

Farba pozadia

BORDERCOLOR= farba

farba okraja

BORDERCOLORDAK = farba

Zafarbí pravý a spodný okraj hlavného rámca a ľavý a horný okraj každej bunky určenou farbou.

BORDERCOLORLIGHT= farba

Vyfarbí ľavý a horný okraj hlavného rámca a pravý a spodný okraj každej bunky.

CELLPADDING = hodnota

Vzdialenosť od okrajov bunky k jej obsahu v pixeloch

CELLSPACING = hodnota

Vzdialenosť medzi bunkami v pixeloch

HSPACE= význam

Voľné miesto naľavo a napravo od tabuľky v pixeloch

VSPACE= význam

Voľné miesto nad a pod tabuľkou v pixeloch

ŠÍRKA = význam

Šírka tabuľky (uvedená v pixeloch alebo ako percento aktuálnej šírky okna prehliadača)

Atribúty tagu definujú parametre daného riadku (v prípade konfliktov sú atribúty nastavené v tagu zrušené).Zarovnanie obsahu bunky; možné hodnoty sú vľavo, vpravo a na stred

POZADIE= url

Obrázok na pozadí buniek daného riadku tabuľky

BGCOLOR= farba

Farba pozadia buniek v tomto riadku

HRANICIA= význam

Hrúbka okraja okolo buniek tohto riadku; BORDER=0 znamená neviditeľný okraj

VALIGN= význam

Vertikálne zarovnanie obsahu bunky; možné hodnoty sú hore, na stred a dole

Atribúty tagov nastavujú parametre danej bunky (v prípade konfliktov sú atribúty nastavené v tagoch ​​a zrušené).

Syntax atribútu

Účel

ZAROVNAŤ= význam

Zarovnanie obsahu bunky; možné hodnoty sú vľavo, vpravo a v strede

POZADIE= ur l

Obrázok na pozadí bunky tabuľky

BGCOLOR= farba

Farba pozadia bunky

HRANICIA= význam

Hrúbka okraja okolo bunky

VALIGN= význam

Vertikálne zarovnanie obsahu bunky; možné hodnoty sú hore, na stred a dole

ŠÍRKA = význam

Šírka bunky v pixeloch alebo ako percento šírky tabuľky

ROWSPAN= význam

Určuje počet riadkov rozložených bunkou

COLSPAN= význam

Určuje počet stĺpcov rozložených bunkou

Pri práci s tabuľkami si treba uvedomiť, že zadanú hodnotu atribútu WIDTH prehliadač v mnohých prípadoch iba „berie do úvahy“. Dané proporcie sa málokedy dodržia presne, prehliadač sa snaží tabuľku zobraziť čo najlepšie (v jeho chápaní).

Ticker

Použitie bežiacej čiary na webovej stránke ju robí dynamickejšou a umožňuje vám vytvoriť efekt pohybu objektu. Ticker sa vytvorí pomocou značky< MARKÍZA> … MARKÍZA>.

Medzi< MARKÍZA> a MARKÍZA> môže obsahovať časti textu a obrázky. Text je možné naformátovať pomocou vhodných značiek a obrázok je možné vložiť pomocou .

Syntax atribútu

Účel

BGCOLOR=farba

Farba pozadia. Ak je nastavené pozadie, prehliadač nakreslí na obrazovku farebný pruh, po ktorom sa pohybuje text alebo obrázok.

VÝŠKA=význam

Výška lišty pozadia. Hodnota je určená v pixeloch alebo ako percento výšky okna prehliadača.

Napríklad, ak zadáte atribút HEIGHT=25%, potom lišta bude zaberať štvrtinu výšky okna

ŠÍRKA =význam

Šírka panela ukazovateľa uvedená v pixeloch alebo ako percento šírky okna prehliadača

DIRECTION=význam

Smer pohybu čiary:vľavo - vľavo (predvolené),správny - doprava,hore - hore,dole − dole

SPRÁVANIE=význam

Atribút riadi správanie sa tickeru:

rolovať (predvolené) - po dosiahnutí okraja okna čiara opustí zorné pole a potom sa objaví z opačnej strany;

šmykľavka - čiara sa objaví spoza okraja okna, dosiahne opačnú stranu a zastaví sa;

striedať − čiara sa pohybuje doprava alebo doľava, „odráža sa“ od okrajov okna a mení smer pohybu

HSPACE = posun v pixeloch

Posuňte posúvač vodorovne doprava

VSPACE = vy spolt av pixeloch

Vytvorenie prázdneho priestoru nad a pod pásom

LOOP=význam

Počet prechodov riadkov cez obrazovku

SCROOLAMOUNT= význam

Počet pixelov, ktoré čiara prejde v každom kroku. Predvolený režim zodpovedá približne 10px/krok. Tento atribút vám umožňuje ovládať rýchlosť pohybu linky.

SCROLLDELAY=význam

Určuje časový interval (v milisekundách) medzi krokmi, pomocou tohto atribútu sa môže čiara pohybovať trhavo

TRUESPED

Nastavenie tohto príznaku (atribút bez hodnoty) použije zadanú hodnotu SCROLLDELAY. Ak príznak nie je nastavený na SCROLLDELAY<= 59 будет округлено до 60

Horizontálna čiara

Vodorovná čiara je nastavená značkou R> a nevyžaduje uzatváraciu značku. V predvolenom nastavení je čiara nakreslená po celej šírke stránky a vyzerá asi takto:

Určuje dĺžku riadku v pixeloch alebo percento šírky okna prehliadača

VEĽKOSŤ= význam

Určuje šírku čiary v pixeloch

ZAROVNAŤ= význam

Určuje zarovnanie vodorovnej čiary. Parameter môže nadobúdať nasledujúce hodnoty:

vľavo - na ľavom okraji,

správny - na pravom okraji,

stred - vycentrované (štandardne používané)

NOSHADE

Určuje, ako sa čiara vyplní ako plná. Parameter je príznak a nevyžaduje hodnotu. Bez tohto parametra sa čiara zobrazí v objeme

FARBA= farba

Určuje farbu čiary (platí len preinternetprieskumník)

Dátum vytvorenia: 2012-03-04 00:50:20
Posledná úprava: 25.10.2012 07:15:35

Moderný život je takmer nemožné si predstaviť bez internetu. Čo by sme robili bez všetkých druhov Odnoklassniki, Vkontakte a LiveJournals? Je dokonca strašidelné predstaviť si, aký by bol náš život ochudobnený, keby ON náhle zmizol! Ako by sme žili bez vtipných obrázkov, hlúpych videí, megabajtov afrického spamu? Nie, priatelia, odmietam žiť v takom hroznom svete!

čo je to internet? (internet)

Internet sú všetky počítače (výpočtové zariadenia) na svete vzájomne prepojené.

Synonymum pre pojem internet – web. Slovo web je pauzovací papier z anglického web (web). A web je zase súčasťou konceptu World Wide Web (World Wide Web). Veľkú časť internetu zaberajú všetky druhy stránok.

Čo sú stránky (stránky)

Stránka je množstvo textových súborov vo formáte html. Tie. sú to obyčajné súbory, ktoré sú uložené na nejakom počítači.

A tu sa dostávame k našej téme: aký je to formát - HTML a prečo je to potrebné?

Čo je HTML?

HTML (HyperText Markup Language - Hypertext Markup Language) je taký špeciálny jazyk. Ale treba hneď poznamenať, že nejde o programovací jazyk. Je to textový značkovací jazyk.

HTML čerpá svoju históriu zo špeciálnych programov na označovanie novinových článkov. Tieto programy vám umožnili určiť, ako usporiadať text na stránke, kde budú obrázky. HTML vám umožňuje urobiť to isté, len na obrazovke digitálneho zariadenia (počítača, telefónu ...).

Ak otvoríte akýkoľvek textový súbor v poznámkovom bloku, uvidíte iba nudný text. HTML na druhej strane umožňuje premeniť takýto nudný text na zaujímavejší: niekde pridať obrázok, niekde rozložiť text na bloky.

Ďalšou charakteristickou črtou HTML je hypertext. Hypertext sú odkazy. Tie. ide o možnosť špeciálneho označenia textu a kliknutie na tento text povedie k prechodu na inú stránku. Tie. hypertext (odkazy) vám umožňuje prepojiť rôzne stránky (súbory, pretože každá stránka na internete je súbor).

Použitie HTML - syntax značkovacieho jazyka

HTML text pozostáva zo značiek, ktoré obsahujú informácie.

Štítok má dve časti: úvodný štítok a koncový štítok. Otvárací aj uzatvárací tag obsahuje názov tagu. Ale v záverečnej sa pred meno dáva lomka / - rozlišovať medzi zatváraním a otváraním. Tu je niekoľko príkladov:

Obsah značky

Obsah značky
Obsah značky
Obsah značky

Slovo tag je preložené ako - štítok, štítok. Tie. tag sa akoby pripája k obsahu – označuje ho.

Každá značka má svoj vlastný význam. Aký význam majú značky, ktoré sme videli vyššie? p - odsek. odkaz. div - blok. span - kus textu. Na význam týchto značiek sa pozrieme v budúcich lekciách.

Jednotlivé značky

Niektoré značky nemajú uzatvárací pár. To znamená, že takéto značky nemajú žiadny obsah. Napríklad značka br preruší riadok:

obyčajný text,
Napríklad
ktorý ukazuje medzeru
linky.

Tam, kde sa nachádza značka br, prehliadač preruší riadok. Výsledkom je, že koncový používateľ vyššie uvedenej vety vyzerá takto:

obyčajný text,
Napríklad
ktorý ukazuje medzeru
linky.

Existujú aj značky, ktoré nemajú uzatvárací pár: hr (horizontálny pruh) a img (obrázok).

Hierarchia značiek

Značky môžu byť vnorené do seba.

Ešte jeden odstavec.

Div obsahuje dva odseky a prvý odsek obsahuje odkaz.

Pri vytváraní hierarchie značiek je hlavnou vecou to, že sa neprekrývajú:

Takto sa to nedá!!!

Tu sa musí najskôr uzavrieť značka p, potom div.

Atribúty značky

Atribúty vám umožňujú zadať ďalšie informácie. Atribúty sa píšu s medzerou za názvom úvodného textu:

<тег атрибут1="Значение атрибута" атрибут2="Значение атрибута" атрибут3="Значение атрибута">Obsah značky

Takto to bude vyzerať na hotovej stránke:

Ďalším príkladom atribútu je src na img. Tento atribút vám umožňuje určiť cestu k obrázku, ktorý sa má načítať:

Hodnoty atribútov môžu byť napísané v dvojitých aj jednoduchých úvodzovkách:

Obe možnosti sú správne.

To je vo všeobecnosti všetko. Teraz sme pripravení začať vytvárať HTML dokumenty.

Prúd bodov kódu Unicode, vrátane vstupu do kroku mnemonizácie, bude používateľský agent spočiatku vnímať ako prúd bajtov (zvyčajne prichádzajúci cez sieť alebo z lokálneho systému súborov). Bajty kódujú skutočné znaky podľa konkrétneho kódovanie znakov A, ktorý používateľský agent používa na dekódovanie bajtov na znaky.

Pre dokumenty XML musia tento algoritmus použiť agenti používateľov na určenie kódovania znakov daného špecifikáciou XML. Táto časť sa nevzťahuje na dokumenty XML.

8.2.2.1 Analýza so známym kódovaním znakov

Keď analyzátor HTML pracuje na bajtovom prúde vstupu, ktorý má určité známe kódovanie, potom kódovanie znakov je toto kódovanie a − istý.

8.2.2.2 Definícia kódovania znakov

V niektorých prípadoch nemusí byť praktické jednoznačne určiť kódovanie pred analýzou dokumentu. Z tohto dôvodu táto špecifikácia poskytuje dvojkrokový mechanizmus s voliteľným predbežným skenovaním. Implementácie môžu, ako je popísané nižšie, použiť algoritmus zjednodušenej analýzy na všetky dostupné bajty pred analýzou dokumentu. Potom sa spustí skutočný syntaktický analyzátor s použitím predbežného kódovania prevzatého z tejto predbežnej analýzy a iných metadát mimo pásma. Ak počas načítavania dokumentu používateľský agent narazí na deklaráciu kódovania znakov, ktorá je v konflikte s týmito informáciami, potom možno znova zavolať syntaktický analyzátor, aby analyzoval dokument so skutočným kódovaním.

Agenti používateľov musia použiť nasledujúci algoritmus, nazývaný algoritmus snímania kódovania, na určenie kódovania znakov, ktoré sa má použiť pri dekódovaní dokumentu v prvom kroku. Tento algoritmus berie ako vstup akékoľvek mimopásmové metadáta dostupné pre užívateľský agent (napríklad metaúdaje typu obsahu dokumentu) a všetky doteraz dostupné bajty a vracia kódovanie znakov a , ktoré predbežne alebo istý.

    Ak používateľ explicitne povie používateľskému agentovi, aby prepísal kódovanie znakov dokumentu konkrétnym kódovaním, voliteľne vráťte toto kódovanie pomocou istý

    Používateľskí agenti si zvyčajne pamätajú takúto požiadavku používateľa medzi reláciami a niekedy to aplikujú aj na dokumenty v prvkoch iframe.

    Užívateľský agent môže mať viac dostupných zdrojových bajtov buď v tomto kroku alebo v neskoršom kroku v tomto algoritme. Používateľský agent môže napríklad očakávať 500 ms alebo 1 024 bajtov, podľa toho, čo nastane skôr. Vo všeobecnosti príprava zdroja na určenie kódovania zlepšuje výkon, pretože znižuje potrebu zahodiť dátové štruktúry použité pri analýze po nájdení informácií o kódovaní. Ak však používateľskému agentovi trvá získanie údajov na určenie kódovania príliš dlho, čas strávený čakaním môže prevážiť akýkoľvek zisk z prípravy.

    Požiadavky na zhodu pre deklaráciu kódovania znakov obmedzujú, aby sa zobrazovala iba v rámci prvých 1024 bajtov. Používateľským agentom sa preto odporúča, aby použili algoritmus predbežného skenovania (ďalší) podľa pokynov uvedených v týchto krokoch na prvých 1024 bajtoch, ale nezastavili sa tam.

    Pre každý riadok nasledujúcej tabuľky, počnúc prvým a smerom nadol, ak je k dispozícii viac bajtov ako v prvom stĺpci a prvé bajty súboru sa zhodujú s tými v prvom stĺpci, potom vráťte kódovanie z bunky v druhý stĺpec toho istého riadku s − istý a zrušte tieto kroky:

    hexadecimálnych bajtov Kódovanie
    FE FF Big-endian UTF-16
    FF FE Little-endian UTF-16
    EF BB BF UTF-8

    Tento krok hľadá značky Unicode Byte Order Marks (BOM).

    Skutočnosť, že tento krok prichádza pred nasledujúcim krokom, ktorý rešpektuje hlavičku HTTP Content-Type, je zámerným porušením špecifikácie HTTP z dôvodu želania byť čo najviac kompatibilný so starým obsahom.

    Ak transportná vrstva špecifikuje kódovanie znakov a je podporované, vráťte toto kódovanie s − istý a zrušte tieto kroky.

    Kódovanie UTF-8 má dobre definovaný bitový vzor. Dokumenty obsahujúce bajty väčšie ako 0x7F, ktoré zodpovedajú vzoru UTF-8, budú veľmi pravdepodobne UTF-8, zatiaľ čo dokumenty s bajtovými sekvenciami, ktoré sa s ním nezhodujú, veľmi pravdepodobne nie. Používateľským agentom sa preto odporúča, aby hľadali toto spoločné kódovanie.

    V opačnom prípade vráťte predvolené kódovanie znakov definované implementáciou alebo používateľom s − predbežne.

    V riadených prostrediach alebo v prostrediach, kde môže byť kódovanie dokumentov povinné (napríklad pre užívateľských agentov určených špeciálne na použitie v nových sieťach), sa odporúča úplné kódovanie UTF-8.

    V iných prostrediach predvolené kódovanie zvyčajne závisí od miestneho nastavenia používateľa (aproximácia jazykov, a teda často aj kódovania stránok, ktoré používateľ s veľkou pravdepodobnosťou navštívi). Nasledujúca tabuľka odporúča predvolené nastavenia na základe miestneho nastavenia používateľa kvôli kompatibilite so starším obsahom. Miestne nastavenia sú identifikované značkami jazyka BCP 47.

    miestny jazyk Odporúčané predvolené kódovanie
    ar arabčina windows-1256
    ba Bashkir okná-1251
    byť bieloruský okná-1251
    bg bulharčina okná-1251
    cs český windows-1250
    el grécky ISO-8859-7
    et estónsky windows-1257
    fa perzský windows-1256
    on hebrejčina okná-1255
    hr chorvátsky windows-1250
    hu maďarský ISO-8859-2
    ja japončina Shift_JIS
    kk kazašský okná-1251
    ko kórejský euc-kr
    ku kurdský windows-1254
    ky kirgizský okná-1251
    lt litovský windows-1257
    lv lotyšský windows-1257
    mk macedónsky okná-1251
    pl poľský ISO-8859-2
    en ruský okná-1251
    sah jakutský okná-1251
    sk slovenský windows-1250
    sl slovensky ISO-8859-2
    sr srbský okná-1251
    tg tadžický okná-1251
    th thajčina Windows-874
    tr turecký windows-1254
    tt tatársky okná-1251
    UK Ukrajinčina okná-1251
    vi Vietnamci windows-1258
    zh-CN čínština (Čínska ľudová republika) GB18030
    zh-TW čínština (Taiwan) Veľký5
    Všetky ostatné miestne nastavenia okná-1252

    Obsah tejto tabuľky je odvodený od predvolených nastavení Windows, Chrome a Firefox.

sekvencia bajtov začínajúca bajtom 0x3C (ASCII<), опционно – байта 0x2F (ASCII /) и, наконец, байта в диапазоне 0x41-0x5A или 0x61-0x7A (ASCII-буква) sekvencia bajtov začínajúca: 0x3C 0x21 (ASCII "Posuňte ukazovateľ polohy tak, aby ukazoval na prvý bajt 0x3E (ASCII >), ktorý nasleduje po nájdenom byte 0x3C.

Akýkoľvek iný bajt

S týmto bajtom nič nerobte.

  • ďalší bajt: Posuňte pozíciu tak, aby ukazovala na ďalší bajt vo vstupnom toku bajtov a posuňte sa o krok späť slučka.
  • Podpora pre kódovanie založené na EBCDIC sa zvlášť neodporúča. Toto kódovanie sa zriedka používa pre verejný webový obsah. Dôrazne sa neodporúča ani podpora UTF-32. Toto kódovanie sa používa zriedka a často nesprávne implementované.

    Táto špecifikácia sa nepokúša podporovať kódovanie založené na EBCDIC a UTF-32 vo svojich algoritmoch; podpora a použitie týchto kódovaní môže preto spôsobiť nepredvídateľné správanie v implementáciách tejto špecifikácie.

    8.2.2.4 Určenie kódovania počas analýzy

    Keď syntaktický analyzátor vyžaduje, aby užívateľský agent zmenil kódovanie, užívateľský agent musí vykonať nasledujúce kroky. To sa môže stať, ak , o ktorom sme hovorili vyššie, zlyhá pri hľadaní kódovania znakov alebo ak nájde kódovanie znakov, ktoré nebolo skutočným kódovaním súboru.

    8.2.2.5 Predspracovanie vstupného toku

    Vstupný tok pozostáva zo znakov, ktoré sú doň vložené ako dekódované, alebo z rôznych API, ktoré priamo manipulujú so vstupným tokom.

    Prvý znak U+FEFF BYTE ORDER MARK sa musí ignorovať, ak je prítomný v .

    Požiadavka vystrihnúť znak U+FEFF BYTE ORDER MARK, či už bol tento znak použitý na určenie poradia bajtov, je zámerným porušením Unicode, čo je spôsobené túžbou zvýšiť robustnosť používateľských agentov z hľadiska natívnych transkodérov. .

    Akýkoľvek výskyt akéhokoľvek znaku z rozsahov U+0001 až U+0008, U+000E až U+001F, U+007F až U+009F, U+FDD0 až U+FDEF a znaky U+000B, U+FFFE , U+FFFF, U+1FFFE, U+1FFFF, U+2FFFE, U+2FFFF, U+3FFFE, U+3FFFF, U+4FFFE, U+4FFFF, U+5FFFE, U+5FFFF, U+6FFFE, U + 6FFFF, U+7FFFE, U+7FFFF, U+8FFFE, U+8FFFF, U+9FFFE, U+9FFFF, U+AFFFE, U+AFFFF, U+BFFFE, U+BFFFF, U+CFFFE, U+CFFFF, U+DFFFE, U+DFFFF, U+EFFFE, U+EFFFF, U+FFFFE, U+FFFFF, U+10FFFE a U+10FFFF sú . Všetky sú to riadiace znaky alebo trvalo nedefinované/nedefinované znaky Unicode (neznaky/neznaky).

    So znakmi „CR“ (U+000D) a „LF“ (U+000A) sa zaobchádza odlišne. Všetky znaky CR sa musia skonvertovať na znaky LF a všetky znaky LF, ktoré prídu za znak CR, sa musia ignorovať. Nové riadky v HTML DOM sú teda reprezentované znakmi LF a nikdy nie znakmi CR vo vstupe do fázy.

    Ďalší vstupný znak je prvý znak, ktorý ešte nie je spotrebovaný/spotrebovaný alebo explicitne ignorovaný požiadavkami tejto časti. Na začiatku je to prvý znak vo vstupnom toku. Aktuálny vstupný znak je posledný znak, ktorý bol .

    Bod vloženia/bod vloženia je pozícia (tesne pred znakom alebo tesne pred koncom vstupného toku), kde sa skutočne vloží obsah vložený pomocou document.write(). Bod vloženia je relatívny k pozícii znaku, ktorý za ním bezprostredne nasleduje, nejde o absolútny posun vo vstupnom toku. Na začiatku nie je bod vloženia definovaný/nedefinovaný.

    Znak "EOF" v nasledujúcich tabuľkách je koncepčný znak predstavujúci koniec . Ak je syntaktickým analyzátorom analyzátor vygenerovaný skriptom, koniec sa dosiahne, keď sa použije explicitný znak „EOF“ (vložený metódou document.close()). V opačnom prípade postava „EOF“ nie je skutočnou postavou v streame, ale absenciou akýchkoľvek následných postáv.

    Spracovanie znakov U+0000 NULL sa líši v závislosti od toho, kde sa znaky nachádzajú. Vo všeobecnosti sa ignorujú, s výnimkou prípadov, keď to môže skutočne spôsobiť úder. Takéto spracovanie sa v prípade potreby rozširuje na etapy mnemonizácie a budovania stromu.