国際化ドメイン名(IDN)

登録規則

ベリサイン共有登録システム(SRS)は、さまざまなUnicodeスクリプトを含んでいる国際化ドメイン名(IDN)をサポートしています。

ベリサインは、許可および禁止のコードポイントを指定したIDN登録ポリシーを作成しています。ポリシーは、以下の5つの確認規則に従って実装されます。これら5つの規則に従っているIDNは、有効な登録であると判断されます。

1.IETF標準

IDNA2008仕様は、IDN 登録においてUnicodeポイントを許可/禁止する規則およびアルゴリズムを定義します。ベリサインは、IDNA2008標準を構成するすべてのRFCドキュメントに完全に適合しています。IETF標準をご確認ください。

2.特定の言語に関する制限

すべてのIDN登録には、3文字の言語タグが必要です。たとえば、CHIは中国語を表しています。登録に関する言語タグが以下のテーブルにあれば、ベリサインにその言語に関して「含まれる文字のリスト」があります。要求されたIDNは、この「含まれる文字のリスト」に完全に含まれている必要があります。IDNのコードポイントが1つでもこの言語で有効な文字でない場合は、登録は拒否されます。

以下のテーブルは、関連する「含まれる文字のリスト」がある言語の一覧です。

言語タグ 言語
AZE アゼルバイジャン語
BEL ベラルーシ語
BUL ブルガリア語
CHI 中国語
GRE ギリシャ語
JPN 日本語
KOR 韓国語
KUR クルド語
MAC マケドニア語
MOL モルダビア語
POL ポーランド語
RUS ロシア語
UKR ウクライナ語

3.スクリプトの混合に関する制約

IDN登録で指定する言語タグが上のテーブルになく、「含まれる文字のリスト」がない場合、単一ドメインでの異なるスクリプトの混合を防ぐために、ベリサインは代替の制約を適用します。

Unicode標準では、各 コードポイントに1つのUnicodeスクリプト値を厳密に割り当てることによって、 Unicodeスクリプトを定義しています。一般に、ベリサインのレジストリは異なるUnicodeスクリプトからのコードポイントの混入を拒否します。つまり、IDNに2つ以上のUnicodeスクリプトのコードポイントが含まれていると、IDN登録は拒否されます。たとえば、ラテン文字のスクリプトをキリル文字と同じ IDNで使用することはできません。IDN内のすべてのコードポイントは同じUnicodeスクリプトのものでなければなりません。これは、混乱を招くコードポイントが同じIDNに表示されるのを防ぐために行われます。

繰り返しますが、この規則は「含まれる文字のリスト」が厳密に定義されていない言語にだけ適用されます。たとえば、フランス語を示すFRE言語タグには、「含まれる文字のリスト」がないので、混合に関する規則が適用されます。フランス語ドメイン内のすべてのコードポイントは単一スクリプトのものでなければなりません。ただし、そのスクリプトは有効なUnicodeで定義されたスクリプトであればかまいません。

次のテーブルはUnicodeスクリプトと、使用可能なコードポイントについての関連テーブルです。

Unicodeスクリプトと関連するコードポイント

IDN登録で使用できるすべてのUnicodeポイントの完全なリストは、ここをクリックしてください。

4.ICANNの制約Unicodeポイント

ベリサイン SRSは、ICANNの国際化ドメイン名の実装に関するガイドラインのセクション5のIETF標準によって認められていてもIDN登録では禁止されている文字を説明した文書に準拠しています。この理由により、ベリサインSRS はすべての登録で次の Unicodeコードポイントを禁じています。ICANNの制約Unicodeポイントの完全なリストは、ここをクリックしてください。

5.特殊文字

最新の定義が以前のバージョンのIDNA標準と後方互換ではないUnicode文字が2種類だけあります。ラテン文字エスツェットとギリシャ文字ファイナルシグマは、以前は別の文字にマッピングされていました。たとえば、ラテン文字エスツェットを2文字のラテン小文字のSにマップするなど、クライアントとレジストリは古い標準と互換である必要があります。このマッピングは一方向だけです。最新バージョンのIDNA標準には、このマッピングは適用されません。したがって、ラテン文字エスツェットが以前禁止されていた(他の文字にマッピング)ことから、最新の標準ではレジストリが自身の判断でこの文字を受け入れることを認めています。

これらの文字は後方互換ではないので、ベリサインでは、登録に関する明快で公平なアプローチに達して、それが十分に周知されるまでは、これらの2文字を許可しないことにしています。

文字 Unicodeポイント グリフ
ラテン文字エスツェット U+00DF ß
ギリシャ文字ファイナルシグマ U+03C2 ς