const 的内部链接属性

最早注意到这个问题也是很偶然:某天发现工程里面有个头文件定义了一堆的字符常量:

const std::string sKeyCode                  =    "code";        
const std::string sKeyResult                =    "result";      
const std::string sKeyResults               =    "results";

一时手贱,顺手把所有 std:: string 替换成了 char *,结果一跑:链接错误,XXXX 重定义。百思不得其解,后来被人提醒这些变量都是全局变量啊,那用的时候应该是需要 extern 先声明一下。但是比较诡异的是: 原来那种写法也是全局变量却不需要做另外的声明!

查了一下,才明白原来 const 是默认具有内部链接属性(internal linkage),也就是说仅在定义这个变量的文件内可见,在链接时对外是不可见的。头文件里的全局常量实际上是 include 该头文件的 CPP 都有自己的一份额外的定义,而对于其他编译单元来说是透明的,不会造成重定义的链接错误。而改成 const char* 的写法就需要注意了:** 这时候定义的只是一个指向常量字符串的普通指针而已,而不是常量指针。** 正确的写法应该是 const char* const 或者 const char xx[]。

上面就是关于这个问题的一个简单分析,顺带顺藤摸瓜摸了些非主流的边角知识过来:

  • const 关键字具有内部链接属性,但是其 “优先级” 是低于 extern 的,如果我们以 extern const int i = 0; 这样的语法来定义一个常量 i 时,这个 i 是具有外部链接属性的,换而言之在使用时需要注意先用 extern 声明。
  • 关于 const 修饰的变量地址:在通常情况下编译器是不会为 const 对象分配内存,只有在几种情况下会分配地址:
    • extern 和 const 同时使用,使得变量具有了外部链接属性。
    • 对 const 对象取地址—- 我们知道常量一般是放到符号表中的,所以上面的情况即使各个编译单元有自己的额外定义,但是实际上还是存放在同一个地方,并不占额外空间。而当我们的程序对 const 对象取地址的时候才会强制分配内存地址:不同 CPP 里面定义的相同常量一般来说对他们取地址得到的结果应该是一样的。(至少 MSVC 中是这样的结果)
    • runtime 的 const—- 编译器是需要为它分配空间的,而且也不在符号表里面记录相关信息。

最后补一句关于 const char* 这种写法的废话:const char* p = “hello”和 char* p = “hello”这两种写法表达的意思都一样:指向 hello 这个常量字符串的指针。从 C 语言时代起后一种写法就是如此,而到了 C++ 时代,为了兼容以前的程序所以做了同样的规定,但是 const char * 这种写法相对而言更正规。