Posted by: Kovács Péter | June 24, 2009

Mi az a HTML?

Wikipedia meghatározása:

HTML (angolul: HyperText Markup Language=hiperszöveges jelölőnyelv) egy leíró nyelv, melyet weboldalak készítéséhez fejlesztettek ki, és mára már internetes szabvánnyá vált a W3C (World Wide Web Consortium) támogatásával. Az aktuális változata a 4.01, mely az SGML általános jelölőnyelv egy konkrét alkalmazása (azaz minden 4.01-es HTML dokumentum egyben az SGML dokumentumszabványnak is meg kell, hogy feleljen). Ezt tervek szerint lassan kiszorította volna azXHTML (ami a szintén SGML alapú XML leíró nyelven alapul), de az is lehetséges, hogy a HTML 5 veszi át a helyét.

Bevezetés

HTML általában szöveges állományokban található meg olyan számítógépeken, melyek az internethez kapcsolódnak. Ezek az állományok tartalmazzák azokat a szimbólumokat, amelyek a megjelenítő programnak leírják, hogyan is kell megjeleníteni illetve feldolgozni az adott állomány tartalmát. Megjelenítő program lehet egy webböngésző (angolul: web browser), aural böngésző (olyan, amelyik a felhasználónak felolvassa a megjelenítendő szöveget), braille olvasó, amely konvertálja a szöveget braille “formátumba”, levelező program (mint például: Mozilla ThunderbirdMicrosoft OutlookEudora stb.), valamint egyéb eszközök, például mobiltelefon.

Szimbólumok, tartalom

Négyfajta szimbólum (leíró elem) található meg a HTML-ben:

  • strukturális elemek, amelyek leírják az adott szöveg “célját” például <h1>Téma 1</h1> mint első szintű címsor (alcím).
  • prezentációs szimbólumok, melyek leírják, az adott szöveg hogy nézzen ki. például <b>vastag</b> vastag kinézetet eredményez. (Ez a forma azonban ma már elavultnak számít, helyette a CSS használata javasolt, ugyanis a legújabb irányelv szerint szét kell választani a tartalmat (amit a HTML kódol) és a formát (amit CSS-ben szokás kódolni), és ezáltal mindenki számára elérhetővé tehetőek a weblapok: felolvasó gépeknek, amit a gyengén látók használnak, szöveges böngészőknek, és könnyebb nyomtatóbarát verziót készíteni.)
  • hiperszöveg (hypertext) elemek, melyek segítségével kapcsolat létesíthető a dokumentum egyes elemei és más dokumentumok között (például a <a href="http://hu.wikipedia.org/">Wikipedia</a>Wikipedia szót mint egy kapcsolatot (angol szóval: link) a megadott URL-hez jeleníti meg)
  • eszköz elemek, melyek segítségével gombok, listák, beviteli mezők hozhatók létre

Felépítés

Egy HTML állomány három fő részre bontható:

  1. Dokumentum Típus Definíció az állomány legelején, ami a használni kívánt DTD-t adja meg, pl:
    <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
  2. a HTML fejléc <head>, ami technikai és dokumentációs adatokat tartalmaz, melyeket az internet böngésző nem jelenít meg, tehát átlag felhasználó ezeket nem látja és
  3. a HTML törzs <body>, amely a megjelenítendő információkat tartalmazza.

Karakterkódolás

Egy HTML dokumentum alapértelmezésként ISO-8859-1, azaz nyugat-európai kódolást használ[1]. Gyakran előforduló hiba szokott lenni, hogy nincs beállítva a charsetparaméter a fejléccontent attribútumában, annak ellenére, hogy a dokumentum nem nyugat-európai kódolású szöveget tartalmaz. Magyar nyelvű oldalak esetén ilyenkor gyakran az „ő” és „ű” betűk helyett „õ” és „û” karaktereket látunk (ekkor valószínűleg “ISO-8852-2 ” vagy “windows-1251” volna a helyes charset érték), de az is lehet, hogy minden ékezetes betű teljesen olvashatatlanná válik (ha például a megjelenítendő szöveg UTF-8 kódolású). A charset paraméter értékeként több száz kódolás és érvényes alternatív név (alias) megadható[2].

Numerikus karakter referenciák

Akármilyen kódolást használ is egy HTML dokumentum, bármilyen Unicode karakter megjeleníthető a szövegben annak UCS kódjával „&#” és „;” jelek között. Például a magyar kis „ő” betű UCS kódja a decimális 337 (vagy hexadecimális 151), ezért függetlenül a használt kódolástól, a HTML dokumentumban elhelyezett ő vagy &#x151;mindig az „ő” betűt fogja megjeleníteni.

Karakter entitás referenciák

Az SGML számos Unicode karakterhez definiál entitásneveket[3][4], azonban a HTML a lehetséges SGML entitásoknak csak egy részét használja[5] (a használt entitásokat a dokumentumDTD-jében kell megadni, és a HTML 4.01-es verziójáig ez nem tartalmazza a közép-európai betűket). Emiatt a magyar ékezetes karakterek közül is csak azokra lehetséges SGML entitásként hivatkozni, melyek a nyugat-európai kódkészletben is megtalálhatók. Vagyis hiába definiálja az SGML például „ő” betűhöz az „odblac” nevet, hivatalosan azt egy böngészőnek nem kell tudnia megjeleníteni egy 4.01-es HTML dokumentumot esetén.

Az entitás nevekre „&” és „;” jelek között hivatkozhatunk, így például az &eacute; a kis „é” betűt jeleníti meg.

XHTML

Az XHTML a HTML megfogalmazása XML-ben (a HTML SGML-ben van definiálva). Gyakorlatilag nincs jelentős eltérés a két nyelv között, csak a formai követelmények lettek szigorúbbak.

HTML Info

2001-ben, amikor a DPG Webmester csatornáján rendszeresen ismétlődő kérdések hatására határozta el Monostory Miklós, hogy kellene egy magyar honlap, ahol mindenki számára elérhetőek a W3C által kiadott webes ajánlások, és egyéb, honlapszerkesztéssel kapcsolatos leírások. A HTML Info gyorsan növekedésnek indult; a W3C ajánlások magyarításán kívül script technikákkal is foglalkozni kezdtek.

Egy példa html kódra:

  <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
      "http://www.w3.org/TR/html4/strict.dtd">
  <html>
    <head>
      <title>Az oldal címe</title>
      <meta http-equiv="Content-type" content="text/html;charset=iso-8859-2"> 
      [esetleges további fejléc-információk]
    </head>
    <body>
      Az oldal tartalma
    </body>
  </html>
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Categories

%d bloggers like this: