English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
文字コードは、あなたのHTMLドキュメントのテキストをバイトにどのように変換するかを決定します。それはISO010646 コードポイントを数字または16進文字参照("〹"または"ሴ"または" 2.0と一致し、選択された文字コードに関連していません。
HTMLページを正しく表示するには、ブラウザがどの文字コードを使用するか知っている必要があります。
ウェブの初期に使用されていた文字コードはASCIIです。ASCIIは0-9 の数字、大文字および小文字の英文字母表、および一部の特殊文字を含みます。
多くの国で使用される文字がASCIIに属さないため、現代のブラウザのデフォルトの文字集合はISO-8859-1。
ウェブページがISO-8859-1 の文字集合を使用する場合、<meta>タグで指定する必要があります。
ISO文字集合は、国際標準化機構 (ISO) が異なるアルファベットに対応するための文字集合です。/言語定義の標準文字集合です。
以下に、世界中で使用されている異なる文字集合を示します:
文字セット | 説明 | 使用範囲 |
---|---|---|
ISO-8859-1 | ラテン文字体系部分 1 | 北アメリカ、西ヨーロッパ、ラテンアメリカ、カリブ海、カナダ、アフリカ |
ISO-8859-2 | ラテン文字体系部分 2 | 東ヨーロッパ |
ISO-8859-3 | ラテン文字体系部分 3 | SE Europe、世界語、その他の雑多 |
ISO-8859-4 | ラテン文字体系部分 4 | スカンジナビア/バルト海(および ISOに含まれていない他の地域)-8859-1 の中の一部) |
ISO-8859-5 | ラテン語/Cyrillic part 5 | 古代スラブ文字体系を使用する言語、例えばブルガリア語、ベラルーシ語、ロシア語、マケドニア語 |
ISO-8859-6 | ラテン語/Arabic part 6 | アラビア文字を使用する言語 |
ISO-8859-7 | ラテン語/Greek part 7 | 現代ギリシャ語、およびギリシャ語から派生した数学符号 |
ISO-8859-8 | ラテン語/Hebrew part 8 | ヘブライ語を使用する言語 |
ISO-8859-9 | ラテン語 5 part 9 | トルコ語。トルコ文字がアイスランド文字を置き換えた以外は、ISO-8859-1 と同じです。 |
ISO-8859-10 | ラテン語 6 | ラプラン語、ドイツ語、エスキモー北欧語 |
ISO-8859-15 | ラテン語 9 (別名 Latin 0) | と ISO 8859-1 同様に、ユーロ符号や他の一部の文字は、使用頻度の低い符号を置き換えています。 |
ISO-2022-JP | ラテン語/Japanese part 1 | 日本語 |
ISO-2022-JP-2 | ラテン語/Japanese part 2 | 日本語 |
ISO-2022-KR | ラテン語/Korean part 1 | 韓国語 |
上記の文字集合には容量制限があり、多言語環境に不適応であるため、Unicode 聯盟は Unicode 标準を開発しました。
Unicode 标準は世界中のすべての文字、記号、符号をカバーしています。
どのようなプラットフォーム、プログラム、言語でも、Unicode はテキストデータの処理、保存、交換ができます。
Unicode 聯盟は Unicode 标準を開発しました。彼らの目標は、標準の Unicode 転換形式 (UTF) で現在の文字集合を置き換えることです。
Unicode 标準は成功を収めました。XML、Java、ECMAScript (JavaScript)、LDAP、CORBA 3.0、WML では、Unicode が実装されています。多くのオペレーティングシステムおよびすべての現代のブラウザで、Unicode がサポートされています。
Unicode 聯盟は ISO、W などのリーダーシップを持つ標準開発組織と協力しています。3C および ECMA。
Unicode は異なる文字セットで互換性があります。最も一般的なエンコーディング方式は UTF-8 そして UTF-16:
文字セット | 説明 |
---|---|
UTF-8 | UTF8 の文字は 1-4 バイトで長さがあります。UTF-8 Unicode 標準の任意の文字を表現できます。UTF-8 ASCIIと後方互換。UTF-8 はウェブページや電子メールの首选エンコーディングです。 |
UTF-16 | 16 ビットの Unicode 変換形式は、すべての Unicode 指令表をエンコードできる Unicode 変数文字エンコーディングです。UTF-16 主にオペレーティングシステムや環境、例えばマイクロソフトの Windows で使用されています。 2000/XP/2003/Vista/CE および Java と .NET バイトコード環境。 |
ヒント: 最も前の 256 Unicode 字集の文字が対応する 256 ISO-8859-1 文字。
ヒント: すべての HTML 4 プロセッサーはすべて UTF をサポート-8、すべての XHTML と XML プロセッサーが UTF をサポート-8 そして UTF-16!