mbrlen
来自cppreference.com
在标头 <wchar.h> 定义 | ||
(C95 起) (C99 前) | ||
(C99 起) | ||
确定多字节字符的表示的字节大小。
此函数等价于对于某个隐藏的 mbstate_t 类型对象 internal 调用 mbrtowc(NULL, s, n, ps ? ps : &internal),但只求值 ps 一次。
参数
s | - | 指向多字节字符串的元素的指针 |
n | - | s 中能检验的字节数限制 |
ps | - | 指向保有转换状态的对象的指针 |
返回值
应用下列首个可用者:
- 0,若接下来 n 个或更少字节组成空字符,或 s 为空指针。两种情况下都重置转换状态。
- 字节数 [1...n],这些字节组成合法的多字节字符。
- (size_t)-2,若接下来 n 个字节是可能合法的多字节字符的一部分,但在检验所有 n 个字节后仍不完整
- (size_t)-1,若出现编码错误。设置 errno 的值为 EILSEQ;转换状态未指定。
示例
运行此代码
#include <locale.h> #include <stdio.h> #include <string.h> #include <wchar.h> int main(void) { // 允许 mbrlen() 以 UTF-8 多字节编码工作 setlocale(LC_ALL, "en_US.utf8"); // UTF-8 窄多字节编码 const char* str = "水"; size_t sz = strlen(str); mbstate_t mb; memset(&mb, 0, sizeof mb); int len1 = mbrlen(str, 1, &mb); if (len1 == -2) printf("%s 的第一个字节是不完整的多字节字符" " (mbrlen 返回 -2)\n", str); int len2 = mbrlen(str + 1, sz - 1, &mb); printf("%s 的剩余 %zu 个字节保有此多字节字符的 %d 个字节\n", str, sz - 1, len2); printf("尝试在 %s 的中间以初始迁移状态调用 mbrlen() 返回 %zd\n", str, mbrlen(str + 1, sz - 1, &mb)); }
输出:
水 的第一个字节是不完整的多字节字符 (mbrlen 返回 -2) 水 的剩余 2 个字节保有此多字节字符的 2 个字节 尝试在 水 的中间以初始迁移状态调用 mbrlen() 返回 -1
引用
- C23 标准(ISO/IEC 9899:2024):
- 7.29.6.3.1 The mbrlen function (第 TBD 页)
- C17 标准(ISO/IEC 9899:2018):
- 7.29.6.3.1 The mbrlen function (第 TBD 页)
- C11 标准(ISO/IEC 9899:2011):
- 7.29.6.3.1 The mbrlen function (第 442 页)
- C99 标准(ISO/IEC 9899:1999):
- 7.24.6.3.1 The mbrlen function (第 388 页)
参阅
(C95) | 给定状态,转换下一个多字节字符为宽字符 (函数) |
返回下一个多字节字符的字节数 (函数) | |
mbrlen 的 C++ 文档 |