Unicode

Unicode は多様な書記系の間で文字を符号化するための規格です。MariaDB 5.5 は Unicode データを格納するための文字集合のほとんどをサポートしています。

文字集合説明追加されたバージョン
ucs2UCS-2。各文字は2バイトコードの MSB first (ビッグエンディアン) で表されます。16ビット固定長の符号化方式です。
utf81文字につき1〜3バイト使用する UTF-8 の符号化方式です。基本ラテン文字、数字、記号類には1バイト使用します。ヨーロッパ、中東の文字のほとんどは2バイトに収まります。韓国、中国、日本の表意文字は3バイトを使用します。補助文字を保存することはできません。
utf8mb3現在は utf8 の別名です。MariaDB 5.5
utf8mb4utf8 とほぼ同じですが、補助文字を4バイトで保存します。MariaDB 5.5
utf16UTF-16。ucs2 とほぼ同じですが、補助文字を32ビットで保存します。16ビット、または32ビットです。MariaDB 5.5
utf32UTF-32。32ビット固定長の符号化方式です。MariaDB 5.5

Comments

Comments loading...
Content reproduced on this site is the property of its respective owners, and this content is not reviewed in advance by MariaDB. The views, information and opinions expressed by this content do not necessarily represent those of MariaDB or any other party.