mbrlen

来自cppreference.com
< c‎ | string‎ | multibyte
在标头 <wchar.h> 定义
size_t mbrlen( const char* s, size_t n, mbstate_t* ps );
(C95 起)
(C99 前)
size_t mbrlen( const char* restrict s, size_t n, mbstate_t* restrict ps );
(C99 起)

确定多字节字符的表示的字节大小。

此函数等价于对于某个隐藏的 mbstate_t 类型对象 internal 调用 mbrtowc(NULL, s, n, ps ? ps : &internal),但只求值 ps 一次。

参数

s-指向多字节字符串的元素的指针
n-s 中能检验的字节数限制
ps-指向保有转换状态的对象的指针

返回值

应用下列首个可用者:

  • 0,若接下来 n 个或更少字节组成空字符,或 s 为空指针。两种情况下都重置转换状态。
  • 字节数 [1...n],这些字节组成合法的多字节字符。
  • (size_t)-2,若接下来 n 个字节是可能合法的多字节字符的一部分,但在检验所有 n 个字节后仍不完整
  • (size_t)-1,若出现编码错误。设置 errno 的值为 EILSEQ;转换状态未指定。

示例

#include <locale.h>
#include <stdio.h>
#include <string.h>
#include <wchar.h>
 
int main(void)
{
    // 允许 mbrlen() 以 UTF-8 多字节编码工作
    setlocale(LC_ALL, "en_US.utf8");
 
    // UTF-8 窄多字节编码
    const char* str = "水";
    size_t sz = strlen(str);
 
    mbstate_t mb;
    memset(&mb, 0, sizeof mb);
    int len1 = mbrlen(str, 1, &mb);
 
    if (len1 == -2) 
        printf("%s 的第一个字节是不完整的多字节字符"
               " (mbrlen 返回 -2)\n", str);
 
    int len2 = mbrlen(str + 1, sz - 1, &mb);
    printf("%s 的剩余 %zu 个字节保有此多字节字符的 %d 个字节\n", str, sz - 1, len2);
 
    printf("尝试在 %s 的中间以初始迁移状态调用 mbrlen() 返回 %zd\n",
           str, mbrlen(str + 1, sz - 1, &mb));
}

输出:

水 的第一个字节是不完整的多字节字符 (mbrlen 返回 -2)
水 的剩余 2 个字节保有此多字节字符的 2 个字节
尝试在 水 的中间以初始迁移状态调用 mbrlen() 返回 -1

引用

  • C23 标准(ISO/IEC 9899:2024):
  • 7.29.6.3.1 The mbrlen function (第 TBD 页)
  • C17 标准(ISO/IEC 9899:2018):
  • 7.29.6.3.1 The mbrlen function (第 TBD 页)
  • C11 标准(ISO/IEC 9899:2011):
  • 7.29.6.3.1 The mbrlen function (第 442 页)
  • C99 标准(ISO/IEC 9899:1999):
  • 7.24.6.3.1 The mbrlen function (第 388 页)

参阅

给定状态,转换下一个多字节字符为宽字符
(函数)
返回下一个多字节字符的字节数
(函数)
mbrlen 的 C++ 文档