Home >> 映像配信入門 >> 第2章 HTML

第2章 HTML

1.ホームページ用ファイルの正体

さて、前章で「ホームページを作る」とは、

  1. 互いにリンクされて構成され
  2. ブラウザで閲覧できるファイル群を作成し
  3. 人々に公開する目的でサーバーに置くこと
……だというのが、分かりましたね?
従って当面必要なのは、「ブラウザで閲覧できる、リンク機能などがあるファイル」を作ることです。
こうしたホームページ用のファイルの規格は決まっておりまして、一般に HTML ファイルと呼ばれています。
ところで皆さん、この HTML という文字列に見覚えはありませんか?
実のところ、大多数の URL(サーバー上のファイルのアドレスのことですね)は http://なんちゃらかんちゃら/なんとか.html という風に、html という文字列で終わっているんです。
例えば    ブラウザのアドレス欄を見て下さい    このページの URL も最後は chapter2.html となっていますね。
これがこのページのファイル名なんです。
この最後の html は拡張子(あとで説明します)と言われるもので、
「これは HTML 文書としてブラウザで表示するファイルですよ」
というような意味です。
ところでこの HTML ファイルの本来の姿は、あなたがいまブラウザで見ているようなものではありません。もしあなたが InternetExplorer を使っているなら、メニューの「表示」→「ソース」を、Netscape を使っているなら、「表示」→「ページソース」をクリックしてみて下さい。
IE のソースの見方 Netscapeのソースの見方
どうですか? 何かややこしそうな、英文字混じりのファイルが出てきたでしょう。これが今あなたが見ているページのソース(source:源)なのです。
つまり、これこそ HTML ファイルの正体なのです。

2.タグ

表示されたソースをよく見て下さい。どこか、ブラウザで表示された画面と共通点がありませんか?
……そうですね。ブラウザ内で見られる文字列は、ちゃんとソースに書かれているんです。
ソースの表示
その代わり、ブラウザで見るような配色とか画像がない。そして、やたら < > で囲まれた英文字が書き込まれている。
実はこの < > こそ、HTML ファイルを作成する上での最大のポイントなのです。
この < > と、その中の文字列を、まとめてタグと言います。

(たまに、「ボタンを押してメッセージを表示」とか「スクロールバーに文字列を流す」とかいった小細工のための JavaScript のことをタグと呼ぶと、勘違いしている人がいます。あれはスクリプトというべきもので、少なくとも HTML に関する限り、タグとは区別しましょう)
つまり、こういうことです。
HTML ファイルとは、通常の文書ファイルにさまざまなタグを挿入することで、ブラウザで見るときの配色などを指定したり、リンクなどの機能を付与したテキストファイルである。
ここでテキストファイルという言葉が出てきましたね。テキストファイルとは、平たく言えば文字データのみによるファイルのことです。HTML ファイルはもともとの文書部分と、タグと呼ばれる文字列によって構成されていますよね。
ですから、HTML ファイルはテキストファイルです。
これは重要なポイントです。なぜなら HTML ファイルは、テキストファイルが編集できるソフトウェアであれば、何を使っても作ることができると分かるからです。
他にもテキストファイルに関する話を下の方の「ひとくちメモ」に書いておきましたので、ぜひ読んでみて下さい。
タグを色分けした図

3.拡張子

ところでテキストファイルは HTML ファイルに限ったものではありません。ですからコンピュータに「ああ、これは HTML ファイルなんだな」と認識させ、ブラウザで開かせるようにするには、ある決まりが必要です。
ここで先ほどの話に戻りましょう。いま表示されているこのファイル、名前が chapter2.html だということは、もう話しましたよね?
この最後の ".html" というのが、大事なんです。
このようにファイル名の最後に "ドット(.)英字文字列" と付け加える文字列を、拡張子といいます。
Windows や(多くの HTTP サーバーで使われている)Linux といった OS は、この拡張子によって、「ああ、これは HTML ファイルだからブラウザで開かなきゃな」「これは EXCEL ファイルだから EXCEL で開かなきゃな」「これは画像ファイルだから画像ビューアで開かなきゃな」……という風にファイルタイプを判断して、処理を決定するわけです。そして、HTML ファイルの場合、ふつう拡張子は html か htm に決まっているわけです(htw とか htx とか shtml とかもありますけど、ここでは覚える必要ないです)。
従って、先ほどの HTML ファイルの定義をより詳しくすると、次のようになります。
HTML ファイルとは、通常の文書ファイルにさまざまなタグを挿入することで、ブラウザで見るときの配色などを指定したり、リンクなどの機能を付与したテキストファイルで、多くの場合、拡張子は html か htm である。
ところで、中には、「ウチの Windows でフォルダの中を覗いてみても、拡張子がついてるファイルは見当たらないよ」と言う人がいるかも知れません。
これは Windows 側で拡張子を隠してるからです。
理由は恐らく、何も知らない人がファイル名を変更する時に、拡張子まで変更したら困る……ということでしょう。でも、「拡張子は基本的に変更するものではない」ということが頭に入っていれば、見えないより見えてた方がいいはずです。それが本当のファイル名なのですから。
ですから、Windows で拡張子が見えない人は、見えるように設定を直しておきましょう。
マイコンピュータかエクスプローラを開いて(開いているのはどのフォルダでも構いません)、メニューの「ツール」→「フォルダオプション」で、出てきたダイアログから「表示」を選び、「登録されているファイルの拡張子は表示しない」のチェックを外しておいて下さい。これで表示されるようになります(ショートカットファイルという例外もありますが……)。
拡張子表示

ひとくちメモ
テキストファイル
テキストファイルとは前述のように文字データでのみ構成されたファイルのことです。テキストファイル以外のファイルをバイナリファイルといいます。コンピュータで扱うファイルにはテキストファイルとバイナリファイルの2種類があるということ    これは覚えておきましょう。
Windows にはメモ帳(Notepad)、Macintosh には SimpleText というソフトウェアが最初から入っており、これらでテキストファイルを作成・編集することができます(Mac OS X に入っている TextEdit の場合、この項で書いてあることを理解するには、環境設定で "標準テキスト" 編集モードにしておいた方がいいです)。
例えばメモ帳で新規作成したファイルに何かの文章を入力して保存すると、文字情報のみで構成されたテキストファイルになります。ですからテキストファイルが表示されるソフトウェアであれば、どのようなものでも表示できますが、行間や折り返しの桁数、字体、色、縦書き/横書き等々は、まちまちになります。そういった表示面での情報は入ってないからです。従って文書の表示面での情報ばかりか、埋め込んだ画像などもひとつのファイルに保存できる Word や一太郎のファイルは、テキストファイルではありません。バイナリファイルです。
今述べたようにテキストファイルには保持・再現できる情報が限られていますが、その代わり高い互換性があります。例えば HTML ファイルはたとえブラウザが無くても、ソースが読み出せれば何が書いてあるか分かるわけです。あなたが書いた文章を(ワープロ用のファイルではなく)テキストファイルで保存しておけば、たとえ百年後のコンピュータでも読みとれる可能性は非常に高いでしょう。これに対し、Word や 一太郎が入ってないコンピュータで、それらで作ったファイルを読むのは、現在でも困難です。それどころか、今の Word で作ったファイルを昔の Word で読めなかったりもします。
「でも、HTML ファイルにはブラウザで見る時の表示情報も埋め込めるんじゃないの? それでもテキストファイル?」と、疑問に思う方もいらっしゃるかも知れません。ですが、その表示の方法を規定するタグも、文字列ですよね。ですから、HTML ファイルはテキストファイル。このように特別な文字列で表示面での方法を制御するものには、他にリッチテキストファイルという例もあります。Mac OS X の TextEdit や Windows のワードパッドなどで扱えるファイルです。これらに対し、表示情報抜きで純粋に文章の内容だけで構成されたテキストファイルを、プレーンテキストと言って区別することがあります。したがって、HTML ファイルはプレーンテキストではありません。
ところで、先ほどテキストファイルはテキストファイルが表示されるソフトウェアであれば、どのようなものでも表示できると言いましたが、実はこれはちょっと嘘があります。少なくとも日本では文字コードの問題がありまして、この点に関しては後述します。

トップへ次へ戻る
ライブシネマ