C、C++ 和 VC++ 中的字符串

我们先从使用的角度,从最直观的数据类型说起。

ps 这一篇笔记并不显式地涉及 wchar_t,也不包含字符(串)之间如何转换。更多内容请跳转 字符(串)之间的转换

类型:char[]\char*\string\CString

转帖来源:C++中的字符串

C++支持两种字符串:C风格字符串和string。之所以抛弃char*的字符串而选用C++标准程序库中的string类,是因为它和前者比较起来,不必担心内存是否足够、字符串长度等等,而且作为一个类出现,它集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作,== 进行比较,+ 做串联(是不是很简单:-D)。我们尽可以把它看成是C++的基本数据类型。此外,CString类在MFC中广泛应用,简化了字符串的处理。

C风格字符串

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <cstring>		//如果是C++代码,用cstring;如果是写C 请用string.h
#include <iostream>
using namespace std;
int main()
{
char str1[] = "Hello"; //字符串数组
cout<<"sizeof(str1)="<<sizeof(str1)<<endl; //sizeof计算占用的空间,包括\0
cout<<"strlen(str1)="<<strlen(str1)<<endl; //strlen计算字符串长度,不包括\0

char* str2 = "Hello"; //字符串指针
cout<<"sizeof(str2)="<<sizeof(str2)<<endl; //sizeof计算指针=4
cout<<"strlen(str2)="<<strlen(str2)<<endl; //strlen计算字符串长度,不包括\0
return 0;
}

ps:如果操作系统是32位,则指针(无论是什么类型的指针)是按32位寻址的,一个字节8位,所以得出其长度为32/8=4

延伸阅读:sizeof(数组名)和sizeof(指针)C++指针长度size

string

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
char* str2 = "Hello";
//2.string类
//a.定义和初始化
string s1; //默认无参构造,空串
string s2(s1); //拷贝构造
string s3(s2,0); //s2内位置字符初始化s3
string s4(str1); //使用c风格字符串初始化
string s5(10,'a'); //生成10个a的字符串

//b.常用操作
s1 = s5; //赋值,也可使用assign。s1内容清空,然后将s5的内容拷贝到s1处
s1 += s5; //尾部添加,也可使用push_back,append
s1.insert(0,str2); //插入字符串
s1.size(); //返回字符数量,也可用length
s1.c_str(); //返回C风格字符串,data()返回字符数组不包括\0,c_str()包括\0,
//copy()则把字符串的内容复制或写入既有的c_string或字符数组内
s1.empty(); //检测是否为空
string::iterator iter = s1.begin(); //返回迭代器,rbegin为逆向迭代器

s1.compare(s2); //比较
s1.find('a',0); //从位置0开始查找a,返回位置
s1.replace(0,10,str2); //用str2替换从位置0开始的10个字符
s1.erase(0,10); //删除从位置0开始的10个字符

延伸阅读:string中c_str()、data()、copy(p,n)函数的用法

CString类

初始化

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
CString str;
CString str1(_T("abc"));
CString str2 = _T("defg");

TCHAR szBuf[] = _T("kkk");
CString str3(szBuf);
CString str4 = szBuf;

TCHAR *p = _T("1k2");
//TCHAR * 转换为 CString
CString str5(p);
CString str6 = p;

CString str7(str1);
CString str8 = str7;

其他基本操作

  • 长度:GetLength();

    1
    2
    CString str(_T("abc"));
    int len = str.GetLength(); //len == 3
  • 是否为空,即不含字符:IsEmpty();

  • 清空字符串:Empty();

    1
    2
    3
    4
    CString str(_T("abc"));
    BOOL mEmpty = str.IsEmpty(); //mEmpty == FALSE
    str.Empty();
    mEmpty = str.IsEmpty(); //mEmpty == TRUE
  • 转换大小写:MakeUpperMakeLower

  • 转换顺序:MakeReverse

    1
    2
    3
    4
    CString str(_T("Abc"));
    str.MakeUpper(); //str == ABC
    str.MakeLower(); //str == abc
    str.MakeReverse(); //str == cba
  • 字符串的连接:++=

    1
    2
    3
    4
    5
    CString str(_T("abc"));
    str = _T("de") + str + _T("kp");//str == deabckp
    str += _T("123"); //str == deabckp123
    TCHAR szBuf[] = _T("789");
    str += szBuf; //str == deabckp123789
  • 字符串的比较:==!=、(<><=>= 不常用)、Compare(区分大小写)、CompareNoCase(不区分大小写)

    1
    2
    3
    4
    5
    6
    7
    CString str1(_T("abc"));
    CString str2 = _T("aBc");
    if (str1 == str2){
    MessageBox(_T("str1 等于 str2"));
    }else{
    MessageBox(_T("str1 不等于 str2"));
    }

延伸阅读:CString 成员函数用法大全

头文件:string\cstring\string.h

接下来我们再深入一点,说说有关的头文件。(不涉及 Windows)

先上结论

参考自:cstring,string,string.h 区别比较

首先,要明确的是cstring, string, string.h 是三个文件名,而不是类名,如果你将vs 2010(或者其它版本)安装在默认路径下,这三个文件可以在 C:\Program Files\Microsoft Visual Studio 10.0\VC\include 路径下找到,查看每个文件里面的内容,结合网上看的一些帖子,我得出以下结论:

  1. string.h 是C标准库下的文件,C++向下兼容C,所以包含了该文件,这个文件应该是原封不动的与C标准库下一致的。类似这样的文件还有math.h,setjmp.h,stdlib.h,stddef.h等等C标准库下的头文件;

  2. cstring 是C++对string.h的简略升级与包装,并将它放置在命名空间 std 下,该文件的所有代码如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    // cstring standard header
    #pragma once
    #ifndef _CSTRING_
    #define _CSTRING_
    #include <yvals.h>

    #ifdef _STD_USING
    #undef _STD_USING
    #include <string.h>
    #define _STD_USING

    #else /* _STD_USING */
    #include <string.h>
    #endif /* _STD_USING */

    #if _GLOBAL_USING && !defined(RC_INVOKED)
    _STD_BEGIN
    using _CSTD size_t; using _CSTD memchr; using _CSTD memcmp;

    using _CSTD memcpy; using _CSTD memmove; using _CSTD memset;
    using _CSTD strcat; using _CSTD strchr; using _CSTD strcmp;
    using _CSTD strcoll; using _CSTD strcpy; using _CSTD strcspn;
    using _CSTD strerror; using _CSTD strlen; using _CSTD strncat;
    using _CSTD strncmp; using _CSTD strncpy; using _CSTD strpbrk;
    using _CSTD strrchr; using _CSTD strspn; using _CSTD strstr;
    using _CSTD strtok; using _CSTD strxfrm;
    _STD_END
    #endif /* _GLOBAL_USING */

    #endif /* _CSTRING_ */

    /*
    * Copyright (c) 1992-2009 by P.J. Plauger. ALL RIGHTS RESERVED.
    * Consult your license regarding permissions and restrictions.
    V5.20:0009 */

    所以,使用 cstring 时要用 using namespace std,cstring 里的内容与方法,应该与 C 标准库下的 string.h 一致。

  3. 而string就与前面两个有本质差别了。它是C++自己开发封装的类,同样用于字符串操作,其中用到了很多的操作符重载等方法,实现方法和C标准库中的string.h有很大差别。

  4. 另外容易混淆的是,在MFC中,还有CString类,它与cstring是有本质区别的(形式上区分大小写),前者是类名,使用时包含头文件 afx.h,后者是文件名,两者实现的方法也大相径庭。

再讲故事

参考自:string.h cstring string的关系

延伸看一下,C++ 标准库。

C++标准库很大。非常大。难以置信的大。怎么个大法?这么说吧:在C++标准中,关于标准库的规格说明占了密密麻麻300 多页,这还不包括标准C 库,后者只是”作为参考”(老实说,原文就是用的这个词)包含在C++库中。当然,并非总是越大越好,但在现在的情况下,确实越大越好,因为大的库会包含大量的功能。标准库中的功能越多,开发自己的应用程序时能借助的功能就越多。C++库并非提供了一切(很明显的是,没有提供并发和图形用户接口的支持),但确实提供了很多。几乎任何事你都可以求助于它。

在归纳标准库中有些什么之前,需要介绍一下它是如何组织的。因为标准库中东西如此之多,你(或象你一样的其他什么人)所选择的类名或函数名就很有可能和标准库中的某个名字相同。为了避免这种情况所造成的名字冲突,实际上标准库中的一切都被放在名字空间 std 中。但这带来了一个新问题。无数现有的C++代码都依赖于使用了多年的伪标准库中的功能,例如,声明在 <iostream.h><complex.h><limits.h> 等头文件中的功能。现有软件没有针对使用名字空间而进行设计,如果用 std 来包装标准库导致现有代码不能用,将是一种可耻行为。(这种釜底抽薪的做法会让现有代码的程序员说出比”可耻” 更难听的话)慑于被激怒的程序员会产生的破坏力,标准委员会决定为包装了 std 的那部分标准库构件创建新的头文件名。

生成新头文件的方法仅仅是将现有C++头 文件名中的.h 去掉,方法本身不重要,正如最后产生的结果不一致也并不重要一样。所以 <iostream.h> 变成了 <iostream><complex.h> 变成了 <complex> 等等。对于C 头文件,采用同样的方法,但在每个名字前还要添加一个C。所以 C 的 <string.h> 变成了 <cstring><stdio.h> 变成 <cstdio>。最后一点是,旧的C++头文件是官方所反对使用的(即,明确列出不再支持),但旧的 C 头文件则没有(以保持对 C 的兼容性)。实际上,编译器制造商不会停止对客户现有软件提供支持,所以可以预计,旧的C++头文件在未来几年内还是会被支持。

所以,实际来说,下面是C++头文件的现状:

  • 旧的 C++ 头文件名如 <iostream.h> 将会继续被支持,尽管它们不在官方标准中。这些头文件的内容不在名字空间 std 中。
  • 新的 C++ 头文件如 <iostream> 包含的基本功能和对应的旧头文件相同,但头文件的内容在名字空间 std 中。(在标准化的过程中,库中有些部分的细节被修改了,所以旧头文件和新头文件中的实体不一定完全对应。)
  • 标准 C 头文件如 <stdio.h> 继续被支持。头文件的内容不在 std 中。
  • 具有 C 库功能的新 C++ 头文件具有如 <cstdio> 这样的名字。它们提供的内容和相应的旧 C 头文件相同,只是内容在 std 中。

重申结论

重要的事情放在最后:

  1. <string.h> 是 C 标准库中的字符串处理函数的头文件 如 strcmp strcat 等等函数

  2. <cstring> 是与 C 标准库的 <string.h> 相对应的,但被加入到 std 名字空间的版本。

    cstring 是 C++ 的组成部分,它可以说是把 C 的 string.h 的升级版,但它不是 C 的组成部分。

    所以如果你用的是 C++,那么请用 cstring;如果你用的是 C 请用 string.h。

  3. <string.h><string>

    string.h 和 C++中的string类是有很大区别的,<string> 并非 <string.h> 的“升级版本”,他们是毫无关系的两个头文件。

    string,它是C++定义的 std::string 所使用的文件,是string类的头文件,属于 STL 范畴。它有很多对字符串操作的方法。

  4. string 与 cstring: 看了以上3点,这两者的区别大家应该很明白了,唯一的联系就是都是 C++ 组成部分。