初心者のためのホームページ作り 第26号

Web作成支援 初心者でもタグやスタイルシートを学んで、思い通りのホームページが作成できる講座を、現在メールマガジンにて配信しています。当サイトを利用するに当たって、是非メールマガジンを購読することをお勧めします。なお、未だ購読されていない方はこちらから登録できます。念のため無料です。

今週のおさらいバックナンバーはこちらから
第1号  第2号  第3号  第4号  第5号  第6号  第7号  第8号  第9号  第10号
第11号  第12号  第13号  第14号  第15号  第16号  第17号  第18号  第19号  第20号
第21号  第22号  第23号  第24号  第25号  目次

プレーンテキスト版バックナンバー

今週<第26号>マガジンのおさらい

                   毎週金曜日配信 What's New 2002/11/8
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
 今週の課題 ■ HTMLのデータ形式
             ■ HTML4.01で扱う特殊文字 --- 実体参照符号

HTMLデータ形式

ここでは、要素の内容や属性の値として記述される基本データ形式について解説します。初心者にとって退屈で何のことだか理解できない部分もありますが、W3Cによって定義されているHTMLの基本的なデータ形式について触れます。なお、ここで言うユーザエージェントとは、ブラウザやプロキシなどを指します。

HTMLデータ形式についての詳細は、当サイト内のリファレンス HTML 基本データ形式 を参照してください。ここでは抜粋し引用しています。

文字種情報

すべての属性の定義には、値における大文字と小文字の区別に関する情報を含めています。文字種は次のキーワードで示されています。
CS値に大文字と小文字の区別があります。ユーザエージェントは「a」と「A」を異なるものとして解釈します。
CI値に大文字と小文字の区別がありません。ユーザエージェントは「a」と「A」を等しいものとして解釈します。
CN文字種変換の影響を受けません。属性値が数値であるため大文字と小文字の区別がないというのが大きな理由です。
CA要素、あるいは属性の定義自体に大文字と小文字の区別がある場合、ユーザエージェントはこれを理解します。
CT大文字と小文字の区別については、ユーザエージェントはデータ形式の定義を参照します。

HTML基本形式

CDATA

Character Data の略で文字データそのものをあらわします。

CDATA は文書文字集合中の任意の文字の列であり、実体参照も含まれます。ユーザエージェントはこの属性値を次のように解釈しています。

style要素と、script要素はCDATA型の内容モデルを持っていますが、両者の要素について、ユーザエージェントはCDATAを上記の解釈とは異なる方法で処理する必要があります。

マークアップと実体参照とはそのままのテキストとして扱い、何も変化させることなくアプリケーション(CSSやスクリプト)に引き渡すことになります。最初に現れる「 </ 」(終了タグの開始区切り子)は、そこで要素が終わるものとして扱います。これらは非HTMLのデータ形式として定義されています。

NAME、ID

要素の名前を指定する属性の値として使われます。この値には次の制限があります。

IDは、id属性の値として使われる形式です。大文字と小文字の区別があります。また、NAMEと同じ制限も持っています。

IDREF、IDREFS

ID Reference の略で、他のIDを参照する場合に使います。他の場所で定義されたIDの値をそのまま利用します。IDREFSはIDREFの複数形で、スペースで区切って複数指定することが可能です。

意味づけされたCDATA型の属性

HTMLのすべての属性の値は、CDATAの型をとります。CDATA型の内容は多種多様です。アスキー文字で記述された名前、URI(URL)、数値や文章など、それぞれまったく異なる値であるにもかかわらず、CDATAとされています。

MIMEタイプ

MIMEタイプは大文字と小文字の区別がありません。要素の形式がこのtype属性の形式を取ります。

MIMEタイプの例として、「text/html」、「image/png」、「image/gif」、「video/mpeg」、「text/css」、「audio/basic」などがあります。

テキスト

テキストとして示される多くの属性値は、人間が読んで理解できる普通の意味のあるテキストを示します。

URI

URIにはURLが含まれています。言い換えればURLはURIのサブセットであるということです。当サイトでは、URIを馴染みの深いURLと記述していますが、正確にはURIを指します。

属性値形式「色」は、RGBで定義される色指定を表わします。色の値は、#記号を冒頭につけた16進数値、または16個の色名の、どちらかとします。色名及びカラーコードは、大文字小文字を区別しません。

文書をカラー化することにより、より多くの情報を提供することになり、読みやすくするものですが、カラー化に当たってはW3Cのアクセシビリティ指針を考慮することが求められています。

日付と時刻

日付と時刻の表現に関して、多くのオプションとバリエーションが認められています。日付時刻文字列形式は次のとおりです。

YYYY-MM-DDThh:mm:ssTZD

YYYY4桁の西暦年
MM2桁の月数(01の時には1月を表す)
DD2桁の日にち(01から31までが割り当てられる)
hh2桁の時刻(00〜23まで。am/pmは許されていません)
mm2桁の分数(00〜59まで)
ss2桁の秒数(00〜59まで)
TZDタイムゾーンを示す

TZDのタイムゾーンは、UTC(Coordinated Universal Time: 協定標準時間)を表し、「Z」は大文字でなければなりません。日本時間の場合には「+09:00:00」なので、

  2002-11-08T23:10:00+09:00 の表記になります。

文字の実体参照

HTML上で扱うものに、特殊文字というものが存在します。日頃は何の戸惑いもなく使ってしまう文字ですが、HTMLでは特別の扱いになります。これらの特殊文字を、実体参照文字符号と呼び、キーボードからは入力できない文字などが含まれます。

文字の実体参照中には、コンピューターの制御符号が含まれ、そのままの文字を使用すると、動作に影響を及ぼす可能性すらあります。 そのために、実体参照符号としての文字を表示する場合には、文字符号、あるいは番号符号で記述することが推奨されています。

HTMLの記述に半角カタカナが使えないのは広く知られています。半角カタカナの最初のコードに制御符号となるものがあり、そのために文字化けが起きてしまいます。実体参照の文字には同様の危険が潜んでいる可能性もありますので、できるだけ符号(コード)で記述するようにしましょう。

すべてのブラウザで表示可能な実体参照

すべてのブラウザで一様に認識可能な符号は4つしかありません。なお、16進数の記述法は、「&#x + 16進数;」というように、「&」「#x」を冒頭に記述し、最後にセミコロン「;」で区切ります。

例:ギリシャ語のシータの場合 &#x398; 実際例 Θ

10進数表示文字符号表示16進数説明
&#060;<&lt;<3CLeft angle bracket
&#062;>&gt;>3ERight angle bracket
&#038;&&amp;&26Ampersand
&#034;"&quot;"22Duble quote mark

ISO-8859-1 実体参照文字符号一覧

互換を大切にする場合、文字符号よりも10進数を使ったほうが安全といわれています。すべてのブラウザでサポートされていない文字符号の文字でも、10進数の方はほとんどのブラウザでサポートされていることはよくあります。なお、大文字と小文字を厳格に区別しますので注意してください。

これらの実体参照の表示は、HTML4.0以降に対応しないブラウザでは空白、ドット、四角、疑問符などに置き換えられて表示されます。特に、&#255; 以降の実体参照では顕著です。

ここでは、実際のラテン実体参照の一部を表示しています。
10進数表示文字符号表示16進数説明
&#160; 
&nbsp; 
A0Non breaking space
&#161;¡&iexcl;¡A1Inverted exclamation mark
&#162;¢&cent;¢A2Cent sign
&#163;£&pound;£A3Pound sterling symbol
&#164;¤&curren;¤A4Currency symbol
&#165;¥&yen;¥A5Yen symbol
&#166;¦&brvbar;¦A6Broken vertical bar
&#167;§&sect;§A7Section symbol
&#168;¨&uml;¨A8Umalaut/Dieresis
&#169;©&copy;©A9Copyright sign
&#170;ª&ordf;ªAAOrdinal indicator,Feminine
&#171;«&laquo;«ABLeft angle quote mark
&#172;¬&not;¬AC"not" symbol
&#173;­&shy;­ADSoft hyphen
&#174;®&reg;®AERegistered trademark symbol
&#175;¯&macr;¯AFmacron
&#176;°&deg;°B0Degree symbol
&#177;±&plusmn;±B1Plus/minus symbol
&#178;²&sup2;²B2Superscript two
&#179;³&sup3;³B3Superscript three
&#180;´&acute;´B4Acute accent
&#181;µ&micro;µB5Micro symbol
&#182;&para;B6Paragraph symbol
&#183;·&middot;·B7Middle dot
&#184;¸&cedil;¸B8Cedilla
&#185;¹&sup1;¹B9Superscript one
&#186;º&ordm;ºBAOrdinal indicator
&#187;»&raquo;»BBAngle quote mark, right
&#188;¼&frac14;¼BCFraction one quarter
&#189;½&frac12;½BDFraction one half
&#190;¾&frac34;¾BEFraction three quarters
&#191;¿&iquest;¿BFInverted question mark

実体参照の詳しい一覧表は、応用編の文字の実体参照一覧表を参照してください。



Copyright(C) 2002-2003 banban@scollabo.com