std::c32rtomb
Определено в заголовочном файле <cuchar>
|
||
std::size_t c32rtomb( char* s, char32_t c32, std::mbstate_t* ps ); |
(начиная с C++11) | |
Преобразует символ UTF-32 в его узкое многобайтовое представление.
Если s не является нулевым указателем, функция определяет количество байтов, необходимых для хранения многобайтового символьного представления c32 (включая любые последовательности сдвига и с учётом текущего многобайтового состояние преобразования *ps) и сохраняет представление многобайтового символа в массиве символов, на первый элемент которого указывает s, обновляя *ps по мере необходимости. Эта функция может записать не более MB_CUR_MAX байт.
Если s является нулевым указателем, вызов эквивалентен вызову std::c32rtomb(buf, U'\0', ps) для некоторого внутреннего буфера buf
.
Если c32 является нулевым широким символом U'\0', сохраняется нулевой байт, которому предшествует любая последовательность сдвига, необходимая для восстановления исходного состояния сдвига, и параметр состояния преобразования *ps обновляется для представления начального состояния сдвига.
Многобайтовая кодировка, используемая этой функцией, определяется текущей активной локалью C.
Содержание |
[править] Параметры
s | — | указатель на массив узких символов, в котором будет храниться многобайтовый символ |
c32 | — | 32-битный символ для преобразования |
ps | — | указатель на объект состояния преобразования, используемый при интерпретации многобайтовой строки |
[править] Возвращаемое значение
В случае успеха возвращает количество байтов (включая любые последовательности сдвигов), записанных в массив символов, на первый элемент которого указывает s. Это значение может быть 0, например при обработке первого char32_t в многосимвольной последовательности char32_t (не происходит в UTF-32).
В случае неудачи (если c32 не является допустимым 32-битным символом) возвращает -1, сохраняет EILSEQ в errno и оставляет *ps в не указанном состоянии.
[править] Пример
#include <climits> #include <clocale> #include <cuchar> #include <iomanip> #include <iostream> #include <string_view> int main() { std::setlocale(LC_ALL, "en_US.utf8"); std::u32string_view strv = U"zß水🍌"; // или z\u00df\u6c34\U0001F34C std::cout << "Обработка " << strv.size() << " кодовых единиц UTF-32: [ "; for (char32_t c : strv) std::cout << std::showbase << std::hex << static_cast<int>(c) << ' '; std::cout << "]\n"; std::mbstate_t state{}; char out[MB_LEN_MAX]{}; for (char32_t c : strv) { std::size_t rc = std::c32rtomb(out, c, &state); std::cout << static_cast<int>(c) << " преобразовано в [ "; if (rc != (std::size_t) - 1) for (unsigned char c8 : std::string_view{out, rc}) std::cout << +c8 << ' '; std::cout << "]\n"; } }
Вывод:
Обработка 4 кодовых единиц UTF-32: [ 0x7a 0xdf 0x6c34 0x1f34c ] 0x7a преобразовано в [ 0x7a ] 0xdf преобразовано в [ 0xc3 0x9f ] 0x6c34 преобразовано в [ 0xe6 0xb0 0xb4 ] 0x1f34c преобразовано в [ 0xf0 0x9f 0x8d 0x8c ]
[править] Смотрите также
(C++11) |
преобразует узкий многобайтовый символ в кодировку UTF-32 (функция) |
[virtual] |
преобразует строку из internT в externT, например, при записи в файл Оригинал: converts a string from internT to externT, such as when writing to file Текст был переведён автоматически используя Переводчик Google. Вы можете проверить и исправить перевод. Для инструкций щёлкните сюда. (virtual protected std::codecvt функция-элемент)
|
Документация C по c32rtomb
|