さて、前章で「ホームページを作る」とは、

表示されたソースをよく見て下さい。どこか、ブラウザで表示された画面と共通点がありませんか?
……そうですね。ブラウザ内で見られる文字列は、ちゃんとソースに書かれているんです。

その代わり、ブラウザで見るような配色とか画像がない。そして、やたら < > で囲まれた英文字が書き込まれている。
実はこの < > こそ、HTML ファイルを作成する上での最大のポイントなのです。
この < > と、その中の文字列を、まとめてタグと言います。
(たまに、「ボタンを押してメッセージを表示」とか「スクロールバーに文字列を流す」とかいった小細工のための JavaScript のことをタグと呼ぶと、勘違いしている人がいます。あれはスクリプトというべきもので、少なくとも HTML に関する限り、タグとは区別しましょう)
つまり、こういうことです。
| HTML ファイルとは、通常の文書ファイルにさまざまなタグを挿入することで、ブラウザで見るときの配色などを指定したり、リンクなどの機能を付与したテキストファイルである。 |
ところでテキストファイルは HTML ファイルに限ったものではありません。ですからコンピュータに「ああ、これは HTML ファイルなんだな」と認識させ、ブラウザで開かせるようにするには、ある決まりが必要です。
ここで先ほどの話に戻りましょう。いま表示されているこのファイル、名前が chapter2.html だということは、もう話しましたよね?
この最後の ".html" というのが、大事なんです。
このようにファイル名の最後に "ドット(.)英字文字列" と付け加える文字列を、拡張子といいます。
Windows や(多くの HTTP サーバーで使われている)Linux といった OS は、この拡張子によって、「ああ、これは HTML ファイルだからブラウザで開かなきゃな」「これは EXCEL ファイルだから EXCEL で開かなきゃな」「これは画像ファイルだから画像ビューアで開かなきゃな」……という風にファイルタイプを判断して、処理を決定するわけです。そして、HTML ファイルの場合、ふつう拡張子は html か htm に決まっているわけです(htw とか htx とか shtml とかもありますけど、ここでは覚える必要ないです)。
従って、先ほどの HTML ファイルの定義をより詳しくすると、次のようになります。
| HTML ファイルとは、通常の文書ファイルにさまざまなタグを挿入することで、ブラウザで見るときの配色などを指定したり、リンクなどの機能を付与したテキストファイルで、多くの場合、拡張子は html か htm である。 |
| ひとくちメモ |
|
テキストファイル テキストファイルとは前述のように文字データでのみ構成されたファイルのことです。テキストファイル以外のファイルをバイナリファイルといいます。コンピュータで扱うファイルにはテキストファイルとバイナリファイルの2種類があるということ これは覚えておきましょう。 Windows にはメモ帳(Notepad)、Macintosh には SimpleText というソフトウェアが最初から入っており、これらでテキストファイルを作成・編集することができます(Mac OS X に入っている TextEdit の場合、この項で書いてあることを理解するには、環境設定で "標準テキスト" 編集モードにしておいた方がいいです)。 例えばメモ帳で新規作成したファイルに何かの文章を入力して保存すると、文字情報のみで構成されたテキストファイルになります。ですからテキストファイルが表示されるソフトウェアであれば、どのようなものでも表示できますが、行間や折り返しの桁数、字体、色、縦書き/横書き等々は、まちまちになります。そういった表示面での情報は入ってないからです。従って文書の表示面での情報ばかりか、埋め込んだ画像などもひとつのファイルに保存できる Word や一太郎のファイルは、テキストファイルではありません。バイナリファイルです。 今述べたようにテキストファイルには保持・再現できる情報が限られていますが、その代わり高い互換性があります。例えば HTML ファイルはたとえブラウザが無くても、ソースが読み出せれば何が書いてあるか分かるわけです。あなたが書いた文章を(ワープロ用のファイルではなく)テキストファイルで保存しておけば、たとえ百年後のコンピュータでも読みとれる可能性は非常に高いでしょう。これに対し、Word や 一太郎が入ってないコンピュータで、それらで作ったファイルを読むのは、現在でも困難です。それどころか、今の Word で作ったファイルを昔の Word で読めなかったりもします。 「でも、HTML ファイルにはブラウザで見る時の表示情報も埋め込めるんじゃないの? それでもテキストファイル?」と、疑問に思う方もいらっしゃるかも知れません。ですが、その表示の方法を規定するタグも、文字列ですよね。ですから、HTML ファイルはテキストファイル。このように特別な文字列で表示面での方法を制御するものには、他にリッチテキストファイルという例もあります。Mac OS X の TextEdit や Windows のワードパッドなどで扱えるファイルです。これらに対し、表示情報抜きで純粋に文章の内容だけで構成されたテキストファイルを、プレーンテキストと言って区別することがあります。したがって、HTML ファイルはプレーンテキストではありません。 ところで、先ほどテキストファイルはテキストファイルが表示されるソフトウェアであれば、どのようなものでも表示できると言いましたが、実はこれはちょっと嘘があります。少なくとも日本では文字コードの問題がありまして、この点に関しては後述します。 |