>>  <<  Ркв  Ввд  JfC  LJ  Фрз  Слв  Изм  Рзг  !:  Помощь  Словарь

Уникод (Unicode) u:  _ _ _ Уникод (Unicode)

типы данных J: char (1-байтный символ) — 8-битное значение от 0 до 255
  wchar (2-байтный символ, wide char) — 16-битное значение от 0 до 65535
Кодировки:  ASCII — 0 до 127, подмножество U8
  U8 — многобайтная кодировка символов Unicode

Большинство диад u: работают со значениями, не с кодировками. Кодировки ASCII и U8 используются в 7&u: и 8&u: .

Монада u: принимает несколько видов аргумента:

Аргумент   Результат
char    как 2&u:
wchar копия аргумента
целые как 4&u:

Обратным к u: является глагол 3&u:
 
  Диада u: принимает скалярный целый левый аргумент и несколько видов правого аргумента:

Левый    Результат               Правый
1char
char  как есть
wchar отбрасывает старшие 8 бит
2wchar
char  старшие 8 бит равны 0
wchar как есть
3integers char или wchar
4wchar целые от -65536 до 65535
5char wchar от 0 до 255
6wchar пары char преобразуются в wchar
7char или
wchar
U8  преобразуется в wchar
ASCII как есть
wchar если все значения <128, преобразовать в ASCII, иначе как есть
пустой правый аргумент производит пустой массив char
8U8
wchar преобразуется в U8
char  как есть
пустой правый аргумент производит пустой массив char

1&u: и 2&u: обратны друг другу, так же 3&u: и 4&u: , так же 7&u: и 8&u: .
 

Например:
   ] t=: u: 'We the people' 
We the people
   3!:0 t
131072                         NB. код типа данных unicode есть 131072

   u: 97 98 99 +/ 0 256 512 1024
aaaa                           NB. 2-байтные символы показываются
bbbb                           NB. как 1-байтные
cccc 

   'a' = u: 97 + 0 256 512 1024
1 0 0 0

   ] t=: (2 4$'abcdefgh') , u: 'wxyz'
abcd                           NB. списки 1- и 2-байтных символов можно соединять.
efgh                           NB. 1-байтные символы при этом преобразуются.
wxyz
   3!:0 t
131072


>>  <<  Ркв  Ввд  JfC  LJ  Фрз  Слв  Изм  Рзг  !:  Помощь  Словарь