この項目では、文字コードについて記述しています。その他の用法については「 アスキー」をご覧ください。
| この項目には、一部のコンピュータや一部の閲覧ソフトで表示できない文字が含まれています(詳細)。 |
American Standard Code for Information Interchangeは、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。略称はASCII(アスキー)。これはコンピュータその他の通信機器において最もよく使われているものである。
概要
ASCIIは、7桁の2進数で表すことのできる整数の数値のそれぞれに、大小のラテン文字や数字、英文でよく使われる約物などを割り当てた文字コードである。1963年6月17日に、American Standards Association(ASA、後の ANSI)によって制定された。当時の規格番号は ASA X3.4 、現在の規格番号は ANSI INCITS 4 である。
ASCIIはISO標準7ビット文字コードISO/IEC 646の元となり、後に8ビット文字コードであるISO/IEC 8859が主流となって以降、世界中で使用されている様々な文字の符号化方式の多くは、ASCIIで使用されていない128番以降の部分に、その他の文字を割り当てたものである。
他の文字コードと同じく、ASCIIは整数で表されるデジタルデータと文字集合とが対応づけられたコードである。このコードに従い、文字等を整数に変換する事で、通信、文字情報の処理や保存を行うのが容易になる。ASCIIやASCII互換コードは、ほとんど全てのコンピュータ(特にパーソナルコンピュータやワークステーション)で扱う事が出来る。MIMEでは、"US-ASCII"とするのが望ましい。
ASCIIは7ビットコードである。つまり、情報を表すのに7桁の2進数(10進数では0〜127)を用いる。ASCIIが規格化された頃ですら、ほとんどのコンピュータの扱う最少単位のバイトは8ビットであるオクテットであった。そのため8ビット目は通信におけるエラーチェック用のパリティビットとして用いられていた。21世紀初頭においても、互換性を維持する目的で、7ビットコードが正式で、8ビット目は使用できない規格がいくつか存在する。
ASCIIはテキストの構造や見た目に関する情報は持たない。そのような情報はマークアップ言語などを使用する事で補うことが出来る。
ASCIIの構成は次のようになっている。
| コード範囲(16進) |
内容 |
| 0x00-0x1f |
制御文字 |
| 0x20 |
空白 |
| 0x21-0x7e |
図形文字 |
| 0x7f |
制御文字(DEL) |
ASCII制御文字
初めの32文字(10進数で0-31)はASCIIでは制御文字として予約されている。基本的にはこれらの制御文字は表示するための文字ではなく、モニタやプリンタなどの機器を制御するために用いられる。例えば、ASCII 10(10進)はline feed(改行)を表し(プリンタの紙送りなどに用いる)、ASCII 27はエスケープを表す。
ASCII 127(全てのビットがON、つまり、2進数で1111111)は、deleteとして知られる制御文字である。この記号が現れた場合、その部分のデータが消去されていることを示す。この制御文字だけ先頭部分になく最後にある理由は、パンチテープへの記録は上書きが出来ないため、削除する際には全てに穴を空けることで対応できるというところからきている(1111111は全てに穴の開いた状態を示す)。また、ASCII 0(全てのビットがOFF、つまり2進数で0000000)はヌルあるいは空文字と呼ばれ、deleteと同様に多くのコンピュータシステムでは無視される。これは、仮にパンチテープと反対に1を0に変えることでデータを記録し、かつ上書きが不可能な媒体が存在する場合でも対応できるようにしているのである。
コードの多くは、データ転送プロトコルで用いられる。(例:ヘッディング開始、テキスト開始、テキスト終了など。)
セパレータは磁気テープへの保存のために設計された。
XON や XOFF は、プリンタのような処理の遅いデバイスにおいて、データを失うことがないように情報の流れを制御するために用いる事がある。
| 2進 |
10進 |
16進 |
略語 |
図形表現 |
Ctrl+ |
名前/意味 |
| 000 0000 |
0 |
00 |
NUL |
␀ |
@ |
空文字 |
| 000 0001 |
1 |
01 |
SOH |
␁ |
A |
ヘッディング開始 |
| 000 0010 |
2 |
02 |
STX |
␂ |
B |
テキスト開始 |
| 000 0011 |
3 |
03 |
ETX |
␃ |
C |
テキスト終了 |
| 000 0100 |
4 |
04 |
EOT |
␄ |
D |
伝送終了 |
| 000 0101 |
5 |
05 |
ENQ |
␅ |
E |
問合せ |
| 000 0110 |
6 |
06 |
ACK |
␆ |
F |
肯定応答 |
| 000 0111 |
7 |
07 |
BEL |
␇ |
G |
ベル |
| 000 1000 |
8 |
08 |
BS |
␈ |
H |
後退 |
| 000 1001 |
9 |
09 |
HT |
␉ |
I |
文字タブ |
| 000 1010 |
10 |
0A |
LF |
␊ |
J |
改行 |
| 000 1011 |
11 |
0B |
VT |
␋ |
K |
行タブ |
| 000 1100 |
12 |
0C |
FF |
␌ |
L |
書式送り |
| 000 1101 |
13 |
0D |
CR |
␍ |
M |
復帰 |
| 000 1110 |
14 |
0E |
SO |
␎ |
N |
シフトアウト |
| 000 1111 |
15 |
0F |
SI |
␏ |
O |
シフトイン |
| 001 0000 |
16 |
10 |
DLE |
␐ |
P |
伝送制御拡張 |
| 001 0001 |
17 |
11 |
DC1 |
␑ |
Q |
装置制御1,XON |
| 001 0010 |
18 |
12 |
DC2 |
␒ |
R |
装置制御2 |
| 001 0011 |
19 |
13 |
DC3 |
␓ |
S |
装置制御3,XOFF |
| 001 0100 |
20 |
14 |
DC4 |
␔ |
T |
装置制御4 |
| 001 0101 |
21 |
15 |
NAK |
␕ |
U |
否定応答 |
| 001 0110 |
22 |
16 |
SYN |
␖ |
V |
同期信号 |
| 001 0111 |
23 |
17 |
ETB |
␗ |
W |
伝送ブロック終結 |
| 001 1000 |
24 |
18 |
CAN |
␘ |
X |
取消 |
| 001 1001 |
25 |
19 |
EM |
␙ |
Y |
媒体終端 |
| 001 1010 |
26 |
1A |
SUB |
␚ |
Z |
置換 |
| 001 1011 |
27 |
1B |
ESC |
␛ |
[ |
エスケープ |
| 001 1100 |
28 |
1C |
FS |
␜ |
\ |
ファイル分離標識 |
| 001 1101 |
29 |
1D |
GS |
␝ |
] |
グループ分離標識 |
| 001 1110 |
30 |
1E |
RS |
␞ |
^ |
レコード分離標識 |
| 001 1111 |
31 |
1F |
US |
␟ |
_ |
ユニット分離標識 |
| 111 1111 |
127 |
7F |
DEL |
␡ |
|
抹消 |
ASCII印字可能文字
ASCII 32は、空白文字である。キーボードのスペースキーから入力でき言葉の間に空白を表示する。 ASCII 33~126は印刷可能な文字(printable characters)であり、半角英数の数字、句読点や記号を表す。
| 2進 |
10進 |
16進 |
文字 |
| 010 0000 |
32 |
20 |
間隔 (␠) |
| 010 0001 |
33 |
21 |
! |
| 010 0010 |
34 |
22 |
" |
| 010 0011 |
35 |
23 |
# |
| 010 0100 |
36 |
24 |
$ |
| 010 0101 |
37 |
25 |
% |
| 010 0110 |
38 |
26 |
& |
| 010 0111 |
39 |
27 |
' |
| 010 1000 |
40 |
28 |
( |
| 010 1001 |
41 |
29 |
) |
| 010 1010 |
42 |
2A |
* |
| 010 1011 |
43 |
2B |
+ |
| 010 1100 |
44 |
2C |
, |
| 010 1101 |
45 |
2D |
- |
| 010 1110 |
46 |
2E |
. |
| 010 1111 |
47 |
2F |
/ |
| 011 0000 |
48 |
30 |
0 |
| 011 0001 |
49 |
31 |
1 |
| 011 0010 |
50 |
32 |
2 |
| 011 0011 |
51 |
33 |
3 |
| 011 0100 |
52 |
34 |
4 |
| 011 0101 |
53 |
35 |
5 |
| 011 0110 |
54 |
36 |
6 |
| 011 0111 |
55 |
37 |
7 |
| 011 1000 |
56 |
38 |
8 |
| 011 1001 |
57 |
39 |
9 |
| 011 1010 |
58 |
3A |
: |
| 011 1011 |
59 |
3B |
; |
| 011 1100 |
60 |
3C |
< |
| 011 1101 |
61 |
3D |
= |
| 011 1110 |
62 |
3E |
> |
| 011 1111 |
63 |
3F |
? |
|
|
| 2進 |
10進 |
16進 |
文字 |
| 100 0000 |
64 |
40 |
@ |
| 100 0001 |
65 |
41 |
A |
| 100 0010 |
66 |
42 |
B |
| 100 0011 |
67 |
43 |
C |
| 100 0100 |
68 |
44 |
D |
| 100 0101 |
69 |
45 |
E |
| 100 0110 |
70 |
46 |
F |
| 100 0111 |
71 |
47 |
G |
| 100 1000 |
72 |
48 |
H |
| 100 1001 |
73 |
49 |
I |
| 100 1010 |
74 |
4A |
J |
| 100 1011 |
75 |
4B |
K |
| 100 1100 |
76 |
4C |
L |
| 100 1101 |
77 |
4D |
M |
| 100 1110 |
78 |
4E |
N |
| 100 1111 |
79 |
4F |
O |
| 101 0000 |
80 |
50 |
P |
| 101 0001 |
81 |
51 |
Q |
| 101 0010 |
82 |
52 |
R |
| 101 0011 |
83 |
53 |
S |
| 101 0100 |
84 |
54 |
T |
| 101 0101 |
85 |
55 |
U |
| 101 0110 |
86 |
56 |
V |
| 101 0111 |
87 |
57 |
W |
| 101 1000 |
88 |
58 |
X |
| 101 1001 |
89 |
59 |
Y |
| 101 1010 |
90 |
5A |
Z |
| 101 1011 |
91 |
5B |
[ |
| 101 1100 |
92 |
5C |
\ |
| 101 1101 |
93 |
5D |
] |
| 101 1110 |
94 |
5E |
^ |
| 101 1111 |
95 |
5F |
_ |
|
|
| 2進 |
10進 |
16進 |
文字 |
| 110 0000 |
96 |
60 |
` |
| 110 0001 |
97 |
61 |
a |
| 110 0010 |
98 |
62 |
b |
| 110 0011 |
99 |
63 |
c |
| 110 0100 |
100 |
64 |
d |
| 110 0101 |
101 |
65 |
e |
| 110 0110 |
102 |
66 |
f |
| 110 0111 |
103 |
67 |
g |
| 110 1000 |
104 |
68 |
h |
| 110 1001 |
105 |
69 |
i |
| 110 1010 |
106 |
6A |
j |
| 110 1011 |
107 |
6B |
k |
| 110 1100 |
108 |
6C |
l |
| 110 1101 |
109 |
6D |
m |
| 110 1110 |
110 |
6E |
n |
| 110 1111 |
111 |
6F |
o |
| 111 0000 |
112 |
70 |
p |
| 111 0001 |
113 |
71 |
q |
| 111 0010 |
114 |
72 |
r |
| 111 0011 |
115 |
73 |
s |
| 111 0100 |
116 |
74 |
t |
| 111 0101 |
117 |
75 |
u |
| 111 0110 |
118 |
76 |
v |
| 111 0111 |
119 |
77 |
w |
| 111 1000 |
120 |
78 |
x |
| 111 1001 |
121 |
79 |
y |
| 111 1010 |
122 |
7A |
z |
| 111 1011 |
123 |
7B |
{ |
| 111 1100 |
124 |
7C |
| |
| 111 1101 |
125 |
7D |
} |
| 111 1110 |
126 |
7E |
~ |
|
- 備考
- 大文字のASCII値に32を加えると小文字に変換することが出来る。この変換は、2進法では、6ビット目に1をセットするだけでよい。また、数字から48を減じれば、対応する値が得られる。この変換は、5ビット目及び6ビット目に0をセットするか、あるいは単純に上位4ビットを無視するだけでもよい。なお、印字可能文字のうち、"@"から始まる32文字については、ASCII値を64減じて対応する制御文字を求め、この制御文字を"コントロール+"(英:control+)という前置表現を付けた印字可能文字で表記する慣習がある。
- 例
- BELコード(07)→"コントロール+G"(受信した側の機器で注意喚起音が鳴る)
- この制御文字の表記方法は、キーボード上の印字可能文字キーを制御文字の送出に用いていた機器の名残りであると考えられる(7ビット目を0にセットする専用キー(Ctrlキー)を、印字可能文字キーと同時に押して制御文字を送出)。
参考文献
ANSI INCITS 4-1986 (formerly ANSI X3.4-1986) American National Standard for Information Systems ― Coded Character Sets ― 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII), American National Standards Institute (1963年6月17日制定, 1986年3月26日最終改正, 2002年1月15日規格番号変更).
関連項目
Questions for article: ascii code, двоично де??тичные wikipedia, online converter character to decimal ascii, unicode (hex), www.tablaascii.com, 128 bit hex online converter, 7 bit ascii online converter, 7-bit ascii Неизобразими Контролни Символи, a c program that converts ascii characters to its equivalent binary number, acii 2 band art, alt ascii code
|