この記事は翻訳者によって翻訳されたものです。 記事の文章にポインターを重ねると、原文のテキストが表示されます。 |
訳文
原文
|
.NET Framework で文字列を使用するためのベスト プラクティス
.NET Framework には、ローカライズされたアプリケーションやグローバル化されたアプリケーションを開発するための広範なサポートが用意されており、文字列の並べ替えや表示などの一般的な操作を実行するときに、現在のカルチャの規則や特定のカルチャの規則を簡単に適用できるようになっています。 しかし、文字列の並べ替えや比較の操作は、必ずしもカルチャに依存するとは限りません。 たとえば、アプリケーションが内部で使用する文字列は、通常、すべてのカルチャで同じように処理される必要があります。 XML タグ、HTML タグ、ユーザー名、ファイル パス、システム オブジェクトの名前などのカルチャに依存しない文字列データがカルチャに依存するかのように解釈されると、アプリケーション コードで軽度のバグが発生したり、パフォーマンスが低下したり、場合によってはセキュリティの問題を引き起こしたりする可能性があります。
ここでは、.NET Framework Version 4 以降の文字列の並べ替え、比較、および大文字と小文字の区別のメソッドについて検討し、適切な文字列処理メソッドを選択するための推奨事項と、文字列処理メソッドに関する追加情報を紹介します。
このトピックは、次のセクションで構成されています。
.NET Framework による開発で文字列を使用するときの簡単な推奨事項を次に示します。
-
文字列操作に対して文字列比較の規則を明示的に指定するオーバーロードを使用します。 そのためには、通常、StringComparison 型のパラメーターを持つメソッド オーバーロードを呼び出します。
-
カルチャに依存しない文字列照合の安全な既定の方法として、StringComparison.Ordinal または StringComparison.OrdinalIgnoreCase を使用して比較を行います。
-
パフォーマンスを向上させるには、StringComparison.Ordinal または StringComparison.OrdinalIgnoreCase による比較を使用します。
-
ユーザーに出力を表示する場合は、StringComparison.CurrentCulture に基づく文字列操作を使用します。
-
比較が言語的な意味を持たない場合 (記号としての比較など) は、CultureInfo.InvariantCulture に基づく文字列操作ではなく、非言語的な StringComparison.Ordinal 値または StringComparison.OrdinalIgnoreCase 値を使用します。
-
比較のために文字列を正規化する場合は、String.ToLowerInvariant メソッドではなく String.ToUpperInvariant メソッドを使用します。
-
2 つの文字列が等価かどうかをテストするには、String.Equals メソッドのオーバーロードを使用します。
-
Compare と CompareTo は、文字列を並べ替える場合に使用し、文字列の等価性を確認する場合には使用しません。
文字列を使用する際に避ける必要があることを次に示します。
-
文字列操作に対して文字列比較の規則を明示的または暗黙的に指定しないオーバーロードは使用しないでください。
-
ほとんどの場合、StringComparison.InvariantCulture に基づく文字列操作は使用しないでください。 数少ない例外の 1 つは、言語的な意味を持つがカルチャには依存しないデータを永続化する場合です。
-
2 つの文字列が等価かどうかを確認する場合に、String.Compare メソッドまたは CompareTo メソッドのオーバーロードで戻り値が 0 かどうかをテストする方法は使用しないでください。
.NET Framework の文字列操作メソッドは、ほとんどがオーバーロードされています。 通常は、既定の設定をそのまま使用する 1 つまたは複数のオーバーロードと、既定の設定を使用せずに文字列の比較または操作の正確な方法を定義するその他のオーバーロードがあります。 既定の設定に依存しないメソッドには、ほとんどの場合、StringComparison 型のパラメーターが含まれています。これは、カルチャおよび大文字と小文字の区別によって文字列比較の規則を明示的に指定する列挙型です。 StringComparison 列挙型のメンバーを次の表に示します。
|
StringComparison のメンバー |
説明 |
|---|---|
|
CurrentCulture |
現在のカルチャを使用して、大文字と小文字を区別する比較を実行します。 |
|
CurrentCultureIgnoreCase |
現在のカルチャを使用して、大文字と小文字を区別しない比較を実行します。 |
|
InvariantCulture |
インバリアント カルチャを使用して、大文字と小文字を区別する比較を実行します。 |
|
InvariantCultureIgnoreCase |
インバリアント カルチャを使用して、大文字と小文字を区別しない比較を実行します。 |
|
Ordinal |
序数に基づく比較を実行します。 |
|
OrdinalIgnoreCase |
大文字と小文字を区別しない、序数に基づく比較を実行します。 |
たとえば、文字または文字列に一致する String オブジェクト内の部分文字列のインデックスを返す IndexOf メソッドには、次の 9 つのオーバーロードがあります。
-
IndexOf(Char)、IndexOf(Char, Int32)、および IndexOf(Char, Int32, Int32)。文字列内の文字の序数に基づく (大文字と小文字を区別し、カルチャに依存しない) 検索を既定で実行します。
-
IndexOf(String)、IndexOf(String, Int32)、および IndexOf(String, Int32, Int32)。文字列内の部分文字列の、大文字と小文字を区別し、カルチャに依存した検索を既定で実行します。
-
IndexOf(String, StringComparison)、IndexOf(String, Int32, StringComparison)、および IndexOf(String, Int32, Int32, StringComparison)。比較の形式を指定できる StringComparison 型のパラメーターが含まれています。
次のような理由から、既定値を使用しないオーバーロードを選択することをお勧めします。
-
既定のパラメーターを持つオーバーロードには、序数に基づく比較を実行するもの (文字列インスタンスで Char を検索するもの) と、カルチャに依存するもの (文字列インスタンスで文字列を検索するもの) があります。 どのメソッドがどの既定値を使用するのかを覚えておくのは容易ではなく、使用するオーバーロードを間違えやすくなります。
-
メソッド呼び出しで既定値に依存するコードは、意図が不明確になります。 たとえば、既定値に依存する次の例では、2 つの文字列の序数に基づく比較と言語に基づく比較のどちらを開発者が意図しているのかや、protocol と "http" の大文字と小文字が違っていた場合に等価性テストで false が返されるのかどうかがわかりにくくなっています。
一般的には、既定値に依存しないメソッドを呼び出すことをお勧めします。そうすると、コードの意図が明確になります。 その結果、コードが読みやすくなるため、デバッグや保守も容易になります。 次の例は、先ほどのコードと同じ内容のコードですが、序数に基づく比較が使用されることと、大文字と小文字の違いが無視されることが明確になっています。
文字列比較は、多くの文字列関連操作 (特に並べ替えおよび等価性テスト) の中核です。 文字列は、決まった順序で並べられています。たとえば、文字列の並べ替え済みリストで "my" が "string" の前にある場合は、比較で "my" が "string" 以下になる必要があります。 また、比較は等価性を暗黙的に定義します。 比較演算では、等価と見なされた文字列に対して 0 が返されます。 これは、どちらの文字列ももう一方の文字列より小さくないという意味に解釈するとわかりやすくなります。 文字列に関係する、意味のある操作のほとんどには、他の文字列との比較か、正しく定義された並べ替え操作の実行のいずれかまたは両方の処理が含まれています。
しかし、2 つの文字列の等価性や並べ替え順序を評価する場合、正しい結果は 1 つではありません。結果は、文字列の比較に使用される基準に依存するためです。 特に、序数に基づく文字列比較や、現在のカルチャまたはインバリアント カルチャ (英語をベースとする、ロケールに依存しないカルチャ) の大文字と小文字の規則や並べ替えの規則に基づく文字列比較では、さまざまな結果が返される可能性があります。
現在のカルチャを使用する文字列比較
文字列を比較するときの基準として現在のカルチャの規則が使用される場合があります。 現在のカルチャに基づく比較では、スレッドの現在のカルチャ (ロケール) が使用されます。 ユーザーがカルチャを設定していない場合は、コントロール パネルの [地域のオプション] ウィンドウの設定が既定で使用されます。 言語的な意味を持つデータや、カルチャに依存したユーザー操作を反映するデータに対しては、常に現在のカルチャに基づく比較を使用する必要があります。
しかし、.NET Framework の比較や大文字と小文字の区別の動作は、カルチャによって変わります。 たとえば、開発されたコンピューターとは異なるカルチャのコンピューターでアプリケーションが実行された場合や、実行中のスレッドのカルチャが変更された場合などに、この変化が生じます。 これは意図的な動作ですが、多くの開発者にはまだあまり知られていません。 次の例は、英語 (U.S.) ("en-US") とスウェーデン語 ("sv-SE") のカルチャの並べ替え順序の違いを示しています。 並べ替えられた文字列配列で、"ångström"、"Windows"、および "Visual Studio" の位置が違っていることに注目してください。
using System; using System.Globalization; using System.Threading; public class Example { public static void Main() { string[] values= { "able", "ångström", "apple", "Æble", "Windows", "Visual Studio" }; Array.Sort(values); DisplayArray(values); // Change culture to Swedish (Sweden). string originalCulture = CultureInfo.CurrentCulture.Name; Thread.CurrentThread.CurrentCulture = new CultureInfo("sv-SE"); Array.Sort(values); DisplayArray(values); // Restore the original culture. Thread.CurrentThread.CurrentCulture = new CultureInfo(originalCulture); } private static void DisplayArray(string[] values) { Console.WriteLine("Sorting using the {0} culture:", CultureInfo.CurrentCulture.Name); foreach (string value in values) Console.WriteLine(" {0}", value); Console.WriteLine(); } } // The example displays the following output: // Sorting using the en-US culture: // able // Æble // ångström // apple // Visual Studio // Windows // // Sorting using the sv-SE culture: // able // Æble // apple // Windows // Visual Studio // ångström
現在のカルチャを使用する、大文字と小文字を区別しない比較は、スレッドの現在のカルチャの大文字と小文字の区別の規則が無視される以外は、カルチャに依存した比較と同じです。 この動作も、並べ替え順序に影響する場合があります。
現在のカルチャのセマンティクスを使用する比較は、次のメソッドで既定で使用されます。
-
StringComparison パラメーターを含まない String.Compare のオーバーロード。
-
String.CompareTo のオーバーロード。
-
既定の String.StartsWith(String) メソッドと、null の CultureInfo パラメーターを持つ String.StartsWith(String, Boolean, CultureInfo) メソッド。
-
既定の String.EndsWith(String) メソッドと、null の CultureInfo パラメーターを持つ String.EndsWith(String, Boolean, CultureInfo) メソッド。
-
検索パラメーターとして String を受け取る、StringComparison パラメーターを持たない String.IndexOf のオーバーロード。
-
検索パラメーターとして String を受け取る、StringComparison パラメーターを持たない String.LastIndexOf のオーバーロード。
どのような場合でも、StringComparison パラメーターを持つオーバーロードを呼び出して、メソッド呼び出しの意図を明確にすることをお勧めします。
非言語的な文字列データが言語的に解釈されたり、特定のカルチャの文字列データが別のカルチャの規則で解釈されたりすると、軽度のバグやあまり軽度でないバグが発生する可能性があります。 その典型的な例が、トルコ語の I の問題です。
文字 "i" (\u0069) は、 ほぼすべてのアルファベット (米国英語のアルファベットなど) で文字 "I" (\u0049) の小文字版です。 この大文字と小文字の規則は、このようなカルチャでプログラミングを行う人にとってはすぐに当たり前のことになります。 しかし、トルコ語 ("tr-TR") のアルファベットには、"i" の大文字版である "ドット付きの I" ("İ" (\u0130)) や、 大文字にすると "I" になる小文字の "ドットなしの i" ("ı" (\u0131)) があります。 この動作は、アゼリ語 ("az") のカルチャでも発生します。
したがって、"i" を大文字にしたり "I" を小文字にしたりする動作に関する前提は、すべてのカルチャで有効なわけではありません。 文字列比較ルーチンの既定のオーバーロードを使用すると、カルチャ間の差異の影響を受けることになります。 また、非言語的なデータを比較する場合も、既定のオーバーロードを使用すると望ましくない結果が返される可能性があります。たとえば次の例では、文字列 "file" と "FILE" の大文字と小文字を区別しない比較を実行しようとしています。
using System; using System.Globalization; using System.Threading; public class Example { public static void Main() { string fileUrl = "file"; Thread.CurrentThread.CurrentCulture = new CultureInfo("en-US"); Console.WriteLine("Culture = {0}", Thread.CurrentThread.CurrentCulture.DisplayName); Console.WriteLine("(file == FILE) = {0}", fileUrl.StartsWith("FILE", true, null)); Console.WriteLine(); Thread.CurrentThread.CurrentCulture = new CultureInfo("tr-TR"); Console.WriteLine("Culture = {0}", Thread.CurrentThread.CurrentCulture.DisplayName); Console.WriteLine("(file == FILE) = {0}", fileUrl.StartsWith("FILE", true, null)); } } // The example displays the following output: // Culture = English (United States) // (file == FILE) = True // // Culture = Turkish (Turkey) // (file == FILE) = False
この比較は、セキュリティが重要となる状況でカルチャが不注意に使用されると、重大な問題を引き起こす可能性があります。 たとえば、IsFileURI("file:") などのメソッド呼び出しでは、現在のカルチャが英語 (U.S.) の場合は true が返されますが、 現在のカルチャがトルコ語の場合には false が返されます。 したがって、"FILE:" で始まる URI へのアクセスを大文字と小文字の区別なくブロックするセキュリティ対策は、トルコ語のシステムでは攻略される可能性があります。
この例の "file:" は、カルチャに依存しない非言語的な識別子として解釈されるものなので、コードを次のように書き換える必要があります。
上の例では String.StartsWith(String, StringComparison) メソッドを使用して等価性をテストしていますが、 この比較の目的は文字列の順序付けではなく等価性テストであるため、次の例のように Equals メソッドを呼び出すのがより適切な選択肢になります。
序数に基づく文字列操作
メソッド呼び出しで StringComparison.Ordinal 値または StringComparison.OrdinalIgnoreCase 値を指定すると、非言語的な比較が行われ、自然言語の特性は無視されます。 これらの StringComparison 値を使用して呼び出されたメソッドでは、文字列操作の判断が、大文字と小文字の指定、またはカルチャでパラメーター化される同等の表ではなく、単純なバイト比較に基づいて行われます。 これにより、ほとんどの場合に文字列が意図されたとおりに解釈され、コードの実行速度と信頼性も向上します。
序数に基づく比較とは、各文字列の各バイトが言語的に解釈されずに比較される文字列比較です (たとえば、"windows" と "Windows" は一致しません)。 これは、実質的には C ランタイムの strcmp 関数の呼び出しです。 文字列が厳密に一致する必要がある状況や、慎重な照合ポリシーが求められる状況では、この比較を使用します。 また、序数に基づく比較は最も高速な比較演算でもあります。これは、結果を判定するときに言語の規則が適用されないためです。
.NET Framework の文字列には、null 文字が埋め込まれる場合があります。 序数に基づく比較とカルチャに依存した比較 (インバリアント カルチャを使用する比較を含む) の最も明白な違いの 1 つは、文字列に埋め込まれた null 文字の処理に関連しています。 これらの文字は、String.Compare メソッドや String.Equals メソッドを使用して、カルチャに依存した比較 (インバリアント カルチャを使用する比較を含む) を実行する場合には無視されます。 その結果、カルチャに依存した比較では、null 文字が埋め込まれた文字列と null 文字が埋め込まれていない文字列が等価と見なされる可能性があります。
重要
|
|---|
|
埋め込まれた null 文字は、文字列比較メソッドでは無視されますが、文字列検索メソッド (String.Contains、String.EndsWith、String.IndexOf、String.LastIndexOf、String.StartsWith など) では無視されません。 |
次の例では、文字列 "Aa" と、"A" と "a" の間にいくつかの null 文字が埋め込まれた類似の文字列とのカルチャに依存した比較を実行して、2 つの文字列が等価と見なされることを示しています。
using System; public class Example { public static void Main() { string str1 = "Aa"; string str2 = "A" + new String('\u0000', 3) + "a"; Console.WriteLine("Comparing '{0}' ({1}) and '{2}' ({3}):", str1, ShowBytes(str1), str2, ShowBytes(str2)); Console.WriteLine(" With String.Compare:"); Console.WriteLine(" Current Culture: {0}", String.Compare(str1, str2, StringComparison.CurrentCulture)); Console.WriteLine(" Invariant Culture: {0}", String.Compare(str1, str2, StringComparison.InvariantCulture)); Console.WriteLine(" With String.Equals:"); Console.WriteLine(" Current Culture: {0}", String.Equals(str1, str2, StringComparison.CurrentCulture)); Console.WriteLine(" Invariant Culture: {0}", String.Equals(str1, str2, StringComparison.InvariantCulture)); } private static string ShowBytes(string str) { string hexString = String.Empty; for (int ctr = 0; ctr < str.Length; ctr++) { string result = String.Empty; result = Convert.ToInt32(str[ctr]).ToString("X4"); result = " " + result.Substring(0,2) + " " + result.Substring(2, 2); hexString += result; } return hexString.Trim(); } } // The example displays the following output: // Comparing 'Aa' (00 41 00 61) and 'A a' (00 41 00 00 00 00 00 00 00 61): // With String.Compare: // Current Culture: 0 // Invariant Culture: 0 // With String.Equals: // Current Culture: True // Invariant Culture: True
一方、次の例のように序数に基づく比較を使用すると、これらの文字列は等価とは見なされません。
Console.WriteLine("Comparing '{0}' ({1}) and '{2}' ({3}):", str1, ShowBytes(str1), str2, ShowBytes(str2)); Console.WriteLine(" With String.Compare:"); Console.WriteLine(" Ordinal: {0}", String.Compare(str1, str2, StringComparison.Ordinal)); Console.WriteLine(" With String.Equals:"); Console.WriteLine(" Ordinal: {0}", String.Equals(str1, str2, StringComparison.Ordinal)); // The example displays the following output: // Comparing 'Aa' (00 41 00 61) and 'A a' (00 41 00 00 00 00 00 00 00 61): // With String.Compare: // Ordinal: 97 // With String.Equals: // Ordinal: False
序数に基づく比較の次に慎重な方法は、大文字と小文字を区別しない序数に基づく比較です。 この比較では、大文字と小文字の区別のほとんどが無視されます (たとえば、"windows" と "Windows" は一致します)。 ASCII 文字を操作する場合、このポリシーは StringComparison.Ordinal と同等ですが、通常の ASCII の大文字と小文字の区別が無視されます。 したがって、[A, Z] (\u0041-\u005A) の任意の文字が [a,z] (\u0061-\007A) の対応する文字と一致します。 ASCII の範囲外の大文字と小文字の区別には、インバリアント カルチャのテーブルが使用されます。 次に例を示します。
この比較は、次の比較と同等です (ただし、より高速です)。
とはいえ、これらの比較はどちらも非常に高速です。
メモ
|
|---|
|
ファイル システム、レジストリのキーと値、および環境変数の文字列の動作は、StringComparison.OrdinalIgnoreCase によって最もよく表現されます。 |
StringComparison.Ordinal と StringComparison.OrdinalIgnoreCase は、どちらもバイナリ値を直接使用するため、照合に最適です。 比較の設定について確信を持てない場合は、この 2 つのいずれかの値を使用してください。 ただし、これらの値を使用するとバイトごとの比較が行われるため、言語的な順序 (英語の辞書のような順序) ではなくバイナリの順序で並べ替えが行われます。 したがって、結果をユーザーに表示すると、ほとんどの場合不自然に見えます。
序数に基づくセマンティクスは、StringComparison 引数を含まない String.Equals のオーバーロード (等値演算子を含む) で既定で使用されます。 どのような場合でも、StringComparison パラメーターを持つオーバーロードを呼び出すことをお勧めします。
インバリアント カルチャを使用する文字列操作
インバリアント カルチャを使用する比較では、静的 CultureInfo.InvariantCulture プロパティから返される CompareInfo プロパティが使用されます。 この動作は、すべてのシステムで同じです。範囲外の文字は、等価のインバリアント文字と見なされる文字に変換されます。 このポリシーは、同じ文字列動作のセットを複数のカルチャにわたって保持する場合に便利ですが、予期しない結果になることもよくあります。
インバリアント カルチャを使用する、大文字と小文字を区別しない比較でも、静的 CultureInfo.InvariantCulture プロパティから返される静的 CompareInfo プロパティが比較情報として使用されます。 変換後の文字の大文字と小文字の違いは無視されます。
StringComparison.InvariantCulture を使用する比較と StringComparison.Ordinal を使用する比較は、ASCII 文字列に対して同じように動作します。 ただし、StringComparison.InvariantCulture では言語的な判断が下されるため、バイト セットとして解釈する必要がある文字列に対しては不適切になることがあります。 CultureInfo.InvariantCulture.CompareInfo オブジェクトのために Compare メソッドで特定の文字のセットが等価と解釈されることもあります。 たとえば、次の例が等価になるのは、インバリアント カルチャでは妥当です。
InvariantCulture: a + ̊ = å
LATIN SMALL LETTER A 文字 "a" (\u0061) は、COMBINING RING ABOVE 文字 "+ " ̊" (\u030a) の横にある場合、LATIN SMALL LETTER A WITH RING ABOVE 文字 "å" (\u00e5) として解釈されます。 この動作は、次の例に示すように、序数に基づく比較とは異なります。
string separated = "\u0061\u030a"; string combined = "\u00e5"; Console.WriteLine("Equal sort weight of {0} and {1} using InvariantCulture: {2}", separated, combined, String.Compare(separated, combined, StringComparison.InvariantCulture) == 0); Console.WriteLine("Equal sort weight of {0} and {1} using Ordinal: {2}", separated, combined, String.Compare(separated, combined, StringComparison.Ordinal) == 0); // The example displays the following output: // Equal sort weight of a° and å using InvariantCulture: True // Equal sort weight of a° and å using Ordinal: False
ファイル名や Cookie など、"å" のような組み合わせが出現する可能性がある要素を解釈する場合にも、序数に基づく比較を使用するのが最も明確かつ適切な方法になります。
結局のところ、インバリアント カルチャには、比較に使用する際に便利なプロパティがほとんどありません。 インバリアント カルチャを使用すると、言語的な意味を持つ形で比較が行われるため、記号の完全な等価性は保証されません。その一方で、特定のカルチャでの表示にも適していません。 StringComparison.InvariantCulture を比較に使用する数少ない理由の 1 つは、順序付けされたデータを複数のカルチャで同じように表示するために永続化できることです。 たとえば、表示する並べ替え済みの識別子のリストを含む大きなデータ ファイルがアプリケーションに付属している場合に、そのリストにエントリを追加するには、インバリアント スタイルの並べ替えを使用する挿入が必要になります。
文字列のセマンティックなコンテキストと StringComparison 列挙型のメンバーとの対応関係の概要を次の表に示します。
|
データ |
動作 |
対応する System.StringComparison value |
|---|---|---|
|
大文字と小文字が区別される内部識別子。 XML や HTTP などの標準の、大文字と小文字が区別される識別子。 大文字と小文字が区別されるセキュリティ関連の設定。 |
バイトが正確に一致する非言語的識別子。 |
Ordinal |
|
大文字と小文字が区別されない内部識別子。 XML や HTTP などの標準の、大文字と小文字が区別されない識別子。 ファイル パス。 レジストリのキーと値。 環境変数。 リソース識別子 (ハンドル名など)。 大文字と小文字が区別されないセキュリティ関連の設定。 |
大文字と小文字が区別されない、言語的な意味を持たない識別子 (ほとんどの Windows システム サービスで格納されるデータなど)。 |
OrdinalIgnoreCase |
|
永続化される、言語的な意味を持つデータの一部。 一定の並べ替え順序を必要とする言語的なデータの表示。 |
カルチャに依存しないが、言語的な意味を持つデータ。 |
InvariantCulture または InvariantCultureIgnoreCase |
|
ユーザーに表示されるデータ。 ほとんどのユーザー入力。 |
特定の言語の規則を必要とするデータ。 |
CurrentCulture または CurrentCultureIgnoreCase |
以降では、文字列比較でよく使用されるメソッドについて説明します。
String.Compare
既定の解釈: StringComparison.CurrentCulture
このメソッドは文字列解釈の中心的な操作となるため、メソッド呼び出しのすべてのインスタンスを調べて、文字列を現在のカルチャに従って解釈するべきか、カルチャから切り離して (記号として) 扱うべきかどうかを確認する必要があります。 ほとんどは後者なので、その場合は代わりに StringComparison.Ordinal の比較を使用します。
CultureInfo.CompareInfo プロパティから返される System.Globalization.CompareInfo クラスにも、CompareOptions フラグ列挙体でさまざまな照合方法 (序数に基づく、空白文字を無視する、カナ型を無視するなど) を指定できる Compare メソッドが含まれています。
String.CompareTo
既定の解釈: StringComparison.CurrentCulture
このメソッドには、現時点では、StringComparison 型を指定するオーバーロードはありません。 通常は、推奨される String.Compare(String, String, StringComparison) の形式に変換できます。
このメソッドは、IComparable インターフェイスと IComparable(Of T) インターフェイスを実装する型に実装されます。 このメソッドには StringComparison パラメーターのオプションがないため、実装する型のコンストラクターで StringComparer を指定できるようにするのが一般的です。 次の例では、クラス コンストラクターに StringComparer パラメーターを含む FileName クラスを定義しています。 この StringComparer オブジェクトは、その後、FileName.CompareTo メソッドで使用されています。
using System; public class FileName : IComparable { string fname; StringComparer comparer; public FileName(string name, StringComparer comparer) { if (String.IsNullOrEmpty(name)) throw new ArgumentNullException("name"); this.fname = name; if (comparer != null) this.comparer = comparer; else this.comparer = StringComparer.OrdinalIgnoreCase; } public string Name { get { return fname; } } public int CompareTo(object obj) { if (obj == null) return 1; if (! (obj is FileName)) return comparer.Compare(this.fname, obj.ToString()); else return comparer.Compare(this.fname, ((FileName) obj).Name); } }
String.Equals
既定の解釈: StringComparison.Ordinal
String クラスで等価性テストを実行するには、Equals メソッド (静的メソッドまたはインスタンス メソッド) のオーバーロードを呼び出すか、静的等値演算子を使用します。 これらのオーバーロードと演算子では、序数に基づく比較が既定で使用されますが、 序数に基づく比較を実行する場合でも、StringComparison 型を明示的に指定するオーバーロードを呼び出すことをお勧めします。これにより、特定の文字列解釈のコードを検索しやすくなります。
String.ToUpper と String.ToLower
既定の解釈: StringComparison.CurrentCulture
これらのメソッドを使用するときには注意が必要です。というのも、文字列を大文字や小文字に強制的に変換する操作は、文字列を大文字と小文字の区別に関係なく比較するための小規模の正規化としてよく使用されるからです。 その場合は、大文字と小文字を区別しない比較を使用することを検討してください。
String.ToUpperInvariant メソッドと String.ToLowerInvariant メソッドを使用することもできます。 ToUpperInvariant は、大文字と小文字を正規化するための標準的な方法です。 StringComparison.OrdinalIgnoreCase を使用して行われる比較は、動作の内容を見ると、両方の文字列引数に対して ToUpperInvariant を呼び出し、StringComparison.Ordinal を使用して比較を行うという、2 つの呼び出しの組み合わせです。
特定のカルチャを表す CultureInfo オブジェクトを渡してそのカルチャで大文字および小文字への変換を行うためのオーバーロードもあります。
Char.ToUpper と Char.ToLower
既定の解釈: StringComparison.CurrentCulture
これらのメソッドの動作は、上で説明した String.ToUpper メソッドおよび String.ToLower メソッドと同様です。
String.StartsWith と String.EndsWith
既定の解釈: StringComparison.CurrentCulture
これらのメソッドは、いずれもカルチャに依存した比較を既定で実行します。
String.IndexOf と String.LastIndexOf
既定の解釈: StringComparison.CurrentCulture
これらのメソッドの既定のオーバーロードは、比較の実行方法が一貫していません。 Char パラメーターを含むすべての String.IndexOf メソッドと String.LastIndexOf メソッドは、序数に基づく比較を実行します。一方、String パラメーターを含む既定の String.IndexOf メソッドと String.LastIndexOf メソッドは、カルチャに依存した比較を実行します。
String.IndexOf(String) メソッドまたは String.LastIndexOf(String) メソッドを呼び出して、現在のインスタンスで検索する文字列を渡す場合は、StringComparison 型を明示的に指定するオーバーロードを呼び出すことをお勧めします。 Char 引数を含むオーバーロードでは、StringComparison 型を指定することはできません。
文字列比較を中心的な操作とする非文字列メソッドの中には、StringComparer 型を使用するものがあります。 StringComparer クラスには、StringComparer のインスタンスを返す静的プロパティが 6 つ含まれています。これらのインスタンスの StringComparer.Compare メソッドは、次の種類の文字列比較を実行します。
-
現在のカルチャを使用する、カルチャに依存した文字列比較。 この StringComparer オブジェクトは、StringComparer.CurrentCulture プロパティによって返されます。
-
現在のカルチャを使用する、大文字と小文字を区別しない比較。 この StringComparer オブジェクトは、StringComparer.CurrentCultureIgnoreCase プロパティによって返されます。
-
インバリアント カルチャの単語ベースの比較規則を使用する、カルチャに依存しない比較。 この StringComparer オブジェクトは、StringComparer.InvariantCulture プロパティによって返されます。
-
インバリアント カルチャの単語ベースの比較規則を使用する、大文字と小文字を区別しない、カルチャに依存しない比較。 この StringComparer オブジェクトは、StringComparer.InvariantCultureIgnoreCase プロパティによって返されます。
-
序数に基づく比較。 この StringComparer オブジェクトは、StringComparer.Ordinal プロパティによって返されます。
-
大文字と小文字を区別しない、序数に基づく比較。 この StringComparer オブジェクトは、StringComparer.OrdinalIgnoreCase プロパティによって返されます。
Array.Sort と Array.BinarySearch
既定の解釈: StringComparison.CurrentCulture
データをコレクションに格納したり、永続化されたデータをファイルやデータベースからコレクションに読み取ったりするときに現在のカルチャを切り替えると、コレクション内のインバリアントが無効になる可能性があります。 Array.BinarySearch メソッドでは、配列内で検索する要素が既に並べ替えられていると見なされます。 Array.Sort メソッドは、配列内の文字列要素を並べ替えるために、String.Compare メソッドを呼び出して個々の要素を順序付けます。 配列の並べ替えが行われてから内容の検索が行われるまでの間にカルチャが変更される場合、カルチャに依存した比較演算子を使用するのは危険です。 たとえば、次のコードでは、Thread.CurrentThread.CurrentCulture プロパティによって暗黙的に提供される比較演算子で格納と取得の操作が行われています。 StoreNames の呼び出しと DoesNameExist の呼び出しの間にカルチャが変更されると (この 2 つのメソッドの呼び出しの間に配列の内容が永続化された場合には特に)、バイナリ サーチが失敗する可能性があります。
// Incorrect. string []storedNames; public void StoreNames(string [] names) { int index = 0; storedNames = new string[names.Length]; foreach (string name in names) { this.storedNames[index++] = name; } Array.Sort(names); // Line A. } public bool DoesNameExist(string name) { return (Array.BinarySearch(this.storedNames, name) >= 0); // Line B. }
次の例は、推奨されるバリエーションを示しています。ここでは、配列の並べ替えと検索の両方に、同じ序数に基づく (カルチャに依存しない) 比較メソッドが使用されています。 コードの変更は、2 つの例の Line A および Line B というラベルが付いた行に反映されています。
// Correct. string []storedNames; public void StoreNames(string [] names) { int index = 0; storedNames = new string[names.Length]; foreach (string name in names) { this.storedNames[index++] = name; } Array.Sort(names, StringComparer.Ordinal); // Line A. } public bool DoesNameExist(string name) { return (Array.BinarySearch(this.storedNames, name, StringComparer.Ordinal) >= 0); // Line B. }
このデータを永続化して別のカルチャのシステムに移動したり、データをユーザーに表示するために並べ替えたりする場合は、StringComparison.InvariantCulture を使用することを検討してください。そうすると、ユーザー出力のために言語的な操作を行っても、カルチャの変更による影響を受けることはありません。 次の例では、前の 2 つの例を変更して、配列の並べ替えと検索にインバリアント カルチャを使用しています。
// Correct. string []storedNames; public void StoreNames(string [] names) { int index = 0; storedNames = new string[names.Length]; foreach (string name in names) { this.storedNames[index++] = name; } Array.Sort(names, StringComparer.InvariantCulture); // Line A. } public bool DoesNameExist(string name) { return (Array.BinarySearch(this.storedNames, name, StringComparer.InvariantCulture) >= 0); // Line B. }
コレクションの例: Hashtable のコンストラクター
文字列のハッシュも、文字列の比較方法の影響を受ける操作の 1 つです。
次の例では、StringComparer.OrdinalIgnoreCase プロパティから返される StringComparer オブジェクトを渡して Hashtable オブジェクトをインスタンス化しています。 StringComparer から派生するクラス StringComparer は IEqualityComparer インターフェイスを実装するため、その GetHashCode メソッドを使用して、ハッシュ テーブルの文字列のハッシュ コードを計算しています。
const int initialTableCapacity = 100; Hashtable h; public void PopulateFileTable(string directory) { h = new Hashtable(initialTableCapacity, StringComparer.OrdinalIgnoreCase); foreach (string file in Directory.GetFiles(directory)) h.Add(file, File.GetCreationTime(file)); } public void PrintCreationTime(string targetFile) { Object dt = h[targetFile]; if (dt != null) { Console.WriteLine("File {0} was created at time {1}.", targetFile, (DateTime) dt); } else { Console.WriteLine("File {0} does not exist.", targetFile); } }
