位域

来自cppreference.com
< cpp‎ | language

声明具有以位为单位的明确大小的类数据成员。相邻的位域成员可以打包成共享和跨过各个字节。

位域声明是使用下列声明符的类数据成员声明

标识符(可选) 属性(可选) : 大小 (1)
标识符(可选) 属性(可选) : 大小 花括号或等号初始化器 (2) (C++20 起)

位域的类型声明语法声明说明符序列 引入.

属性 - (C++11 起) 任意数量属性的序列
标识符 - 被声明的位域名。名字是可选的:无名位域引入指定数量的填充位
大小 - 值大于或等于零的整型常量表达式。大于零时,这是位域将占有的位数。零值只能用于无名位域并具有特殊含义
花括号或等号初始化器 - 此位域所使用的默认成员初始化器

解释

位域的类型只能是整型或(可有 cv 限定的)枚举类型,无名位域不能声明为具有有 cv 限定的类型。

位域不能是静态数据成员

没有位域纯右值:左值到右值转换始终生成位域底层类型的对象。

位域中的位数设置它能保有的值的极限:

#include <iostream>
 
struct S
{
    // 三位的无符号位域,允许的值有 0...7
    unsigned int b : 3;
};
 
int main()
{
    S s = {6};
 
    ++s.b; // 在位域中存储值 7
    std::cout << s.b << '\n';
 
    ++s.b; // 值 8 不适合此位域
    std::cout << s.b << '\n'; // 正式来说是由实现定义的行为,通常为 0
}

可能的输出:

7
0

多个相邻位域通常打包在一起(尽管此行为由实现定义):

#include <iostream>
 
struct S
{
    // 通常会占用 2 个字节:
    // 3 位:b1 的值
    // 2 位:不使用
    // 3 位:不使用, 因为当前字节剩余量(3)不足以存放下一个位域声明的大小(6)
    // 6 位:b2 的值
    // 2 位:b3 的值
    unsigned char b1 : 3, : 2, b2 : 6, b3 : 2;
};
 
int main()
{
    std::cout << "Size of unsigned short: " << sizeof(S) << '\n';   // 通常为 2
    std::cout << "Size of S: " << sizeof(unsigned short) << '\n';   // 通常为 2
    S s;
    *(unsigned short*)(&s) = 0;
    s.b1 = (1 << 3) - 1;
    s.b2 = (1 << 6) - 1;
    s.b3 = (1 << 2) - 1;
    std::cout << *(unsigned short*)(&s) << '\n'; // 通常值为 65287, 二进制表示为 1111_1111 0000_0111
}

可能的输出:

Size of unsigned short: 2
Size of S: 2
65287

特殊的零大小无名位域可用于强行打破填充。它指定下个位域在它的分配单元的开始处开始:

#include <iostream>
 
struct S
{
    // 通常会占用 2 个字节:
    // 3 位:b1 的值
    // 5 位:不使用
    // 6 位:b2 的值
    // 2 位:b3 的值
    unsigned char b1 : 3;
    unsigned char :0; // 开始新字节
    unsigned char b2 : 6;
    unsigned char b3 : 2;
};
 
int main()
{
    std::cout << sizeof(S) << '\n'; // 通常打印 2
}

可能的输出:

2

如果位域所指定的大小大于它的类型的大小,那么值由类型所限制:std::uint8_t b : 1000; 仍只能保存 0 与 255 间的值。额外的位是填充位

因为位域不一定在一个字节的开始处开始,所以不能取位域的地址。指向位域的指针和非 const 引用是不可行的。从位域初始化 const 引用时,将创建一个临时量(其类型是位域的类型),并以该位域的值复制初始化,而引用绑定到该临时量。

位域没有默认成员初始化器int b : 1 = 0;int b : 1 {0} 是非良构的。

(C++20 前)

在位域大小与默认初始化器有歧义的情况下,选择组成合法大小的最长记号序列:

int a;
const int b = 0;
 
struct S
{
    // 简单情况
    int x1 : 8 = 42;              // OK:"= 42" 是花括号或等号初始化器
    int x2 : 8 { 42 };            // OK:"{ 42 }" 是花括号或等号初始化器
 
    // 有歧义
    int y1 : true ? 8 : a = 42;   // OK:不存在花括号或等号初始化器
    int y2 : true ? 8 : b = 42;   // 错误:不能赋值给 const int
    int y3 : (true ? 8 : b) = 42; // OK:"= 42" 是花括号或等号初始化器
    int z : 1 || new int { 0 };   // OK:不存在花括号或等号初始化器
};
(C++20 起)

注解

位域的下列性质由实现定义

  • 以范围外的值对有符号位域进行赋值或初始化,或对有符号位域进行自增越过其范围,所产生的值。
  • 任何关于类对象中位域的实际分配细节:
  • 例如,在某些平台上,位域不跨过字节,其他平台上会跨过
  • 还有,在某些平台上,位域从左到右打包,其他平台上从右到左

在 C 编程语言中,位域的宽度不能超过底层类型的宽度,并且未显式标为 signedunsignedint 位域是有符号还是无符号由实现定义。例如,C 中 int b:3; 可能有值域 0..7-4..3,但在 C++ 中只有后者。

缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告 应用于 出版时的行为 正确行为
CWG 324 C++98 未指明对位域的赋值的返回值是否也是位域 对可能返回左值的操作符添加位域说明
CWG 739 C++98 未显式声明为 signedunsigned 的位域由实现定义是否有符号 与底层类型一致
CWG 2229 C++98 无名位域可以声明为具有有 cv 限定的类型 已禁止
CWG 2511 C++98 位域类型不能有 cv 限定 位域的类型可以是有 cv 限定的枚举类型

引用

  • C++20 标准(ISO/IEC 14882:2020):
  • 11.4.9 Bit-fields [class.bit]
  • C++17 标准(ISO/IEC 14882:2017):
  • 12.2.4 Bit-fields [class.bit]
  • C++14 标准(ISO/IEC 14882:2014):
  • 9.6 Bit-fields [class.bit]
  • C++11 标准(ISO/IEC 14882:2011):
  • 9.6 Bit-fields [class.bit]
  • C++03 标准(ISO/IEC 14882:2003):
  • 9.6 Bit-fields [class.bit]
  • C++98 标准(ISO/IEC 14882:1998):
  • 9.6 Bit-fields [class.bit]

参阅

实现常量长度的位数组
(类模板)
节省空间的动态 bitset
(类模板特化)
位操纵工具 (C++20) 用来访问,操纵以及处理单独位和位序列的工具