一、字符分类函数
C语⾔中有⼀系列的函数是专⻔做字符分类的,也就是⼀个字符是属于什么类型的字符的。
这些函数的使⽤都需要包含⼀个头⽂件是 ctype.h
这些函数的使⽤⽅法⾮常类似,我们就讲解⼀个函数的事情,其他的⾮常类似:
int islower ( int c );
islower 是能够判断参数部分的 c 是否是⼩写字⺟的。
通过返回值来说明是否是⼩写字⺟,如果是⼩写字⺟就返回⾮0的整数,如果不是⼩写字⺟,则返回0。
#include <stdio.h>
#include <ctype.h>
int main ()
{
int i = 0;
char str[] = "Test String.\n";
char c;
while (str[i])
{
c = str[i];
if (islower(c))
c -= 32;
putchar(c);
i++;
}
return 0;
}
二、字符转换函数
C语⾔提供了2个字符转换函数:
int tolower ( int c ); //将参数传进去的⼤写字⺟转⼩写
int toupper ( int c ); //将参数传进去的⼩写字⺟转⼤写
#include <stdio.h>
#include <ctype.h>
int main ()
{
int i = 0;
char str[] = "Test String.\n";
char c;
while (str[i])
{
c = str[i];
if (islower(c))
c = toupper(c);
putchar(c);
i++;
}
return 0;
}
三、strlen 的使⽤和模拟实现
size_t strlen ( const char * str );
字符串以 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前⾯出现的字符个数(不包 含 '\0' )。
参数指向的字符串必须要以 '\0' 结束。
注意函数的返回值为 size_t,是⽆符号的( 易错 )
strlen的使⽤需要包含头⽂件
学会strlen函数的模拟实现
#include <stdio.h>
#include <string.h>
int main()
{
const char* str1 = "abcdef";
const char* str2 = "bbb";
if (strlen(str2) - strlen(str1) > 0)
{
printf("str2>str1\n");
}
else
{
printf("srt1>str2\n");
}
return 0;
}
strlen的模拟实现:
⽅式1:
//计数器⽅式
int my_strlen(const char* str)
{
int count = 0;
assert(str);
while (*str)
{
count++;
str++;
}
return count;
}
//不能创建临时变量计数器
int my_strlen(const char* str)
{
assert(str);
if (*str == '\0')
return 0;
else
return 1 + my_strlen(str + 1);
}
//指针-指针的⽅式
int my_strlen(char* s)
{
assert(str);
char* p = s;
while (*p != '\0')
p++;
return p - s;
}
四、strcpy 的使⽤和模拟实现
char* strcpy(char * destination, const char * source );
Copies the C string pointed by source into the array pointed by destination, including theterminating null character (and stopping at that point).
源字符串必须以 '\0' 结束。
会将源字符串中的 '\0' 拷⻉到⽬标空间。
⽬标空间必须⾜够⼤,以确保能存放源字符串。
⽬标空间必须可修改。
学会模拟实现。
strcpy的模拟实现:
//1.参数顺序
//2.函数的功能,停⽌条件
//3.assert
//4.const修饰指针
//5.函数返回值
//6.题⽬出⾃《⾼质量C/C++编程》书籍最后的试题部分
char* my_strcpy(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while ((*dest++ = *src++))
{
;
}
return ret;
}
五、strcat 的使⽤和模拟实现
Appends a copy of the source string to the destination string. The terminating null character in destination is overwritten by the first character of source, and a null-character is included at the end of the new string formed by the concatenation of both in destination.
源字符串必须以 '\0' 结束。
⽬标字符串中也得有 \0 ,否则没办法知道追加从哪⾥开始。
⽬标空间必须有⾜够的⼤,能容纳下源字符串的内容。
⽬标空间必须可修改。
字符串⾃⼰给⾃⼰追加,如何?
模拟实现strcat函数:
char* my_strcat(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while (*dest)
{
dest++;
}
while ((*dest++ = *src++))
{
;
}
return ret;
}
六、strcmp 的使⽤和模拟实现
- This function starts comparing the first character of each string. If they are equal to each other, it continues with the following pairs until the characters differ or until a terminating null-character is reached.
标准规定:
- 第⼀个字符串⼤于第⼆个字符串,则返回⼤于0的数字
- 第⼀个字符串等于第⼆个字符串,则返回0
- 第⼀个字符串⼩于第⼆个字符串,则返回⼩于0的数字
那么如何判断两个字符串? ⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩。
strcmp函数的模拟实现:
#include <cstddef>
int my_strcmp(const char* str1, const char* str2)
{
int ret = 0;
assert(str1 != NULL);
assert(str2 != NULL);
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
七、strncpy 函数的使⽤
char * strncpy ( char * destination, const char * source, size_t num );
Copies the first num characters of source to destination. If the end of the source C string (which is signaled by a null-character) is found before num characters have been copied, destination is padded with zeros until a total of num characters have been written to it.
拷⻉num个字符从源字符串到⽬标空间。
如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。
八、strncat 函数的使⽤
char * strncat ( char * destination, const char * source, size_t num );
Appends the first num characters of source to destination, plus a terminating null-character. (将source指向字符串的前num个字符追加到destination指向的字符串末尾,再追加⼀个 \0 字符)。
If the length of the C string in source is less than num, only the content up to the terminating null-character is copied.(如果source 指向的字符串的⻓度⼩于num的时候,只会将字符串中到 \0 的内容追加到destination指向的字符串末尾)。
/* strncat example */
#include <stdio.h>
#include <string.h>
int main()
{
char str1[20];
char str2[20];
strcpy(str1, "To be ");
strcpy(str2, "or not to be");
strncat(str1, str2, 6);
printf("%s\n", str1);
return 0;
}
九、strncmp函数的使⽤
int strncmp ( const char * str1, const char * str2, size_t num );
⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不⼀样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0.
十、strstr 的使⽤和模拟实现
char * strstr ( const char * str1, const char * str2);
Returns a pointer to the first occurrence of str2 in str1, or a null pointer if str2 is not part of str1. (函数返回字符串str2在字符串str1中第⼀次出现的位置)。
The matching process does not include the terminating null-characters, but it stops there.(字符串的⽐较匹配不包含 \0 字符,以 \0 作为结束标志)。
/* strstr example */
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "This is a simple string";
char* pch;
pch = strstr(str, "simple");
strncpy(pch, "sample", 6);
printf("%s\n", str);
return 0;
}
#include <cstddef>
char* strstr(const char* str1, const char* str2)
{
char* cp = (char*)str1;
char* s1, * s2;
if (!*str2)
return((char*)str1);
while (*cp)
{
s1 = cp;
s2 = (char*)str2;
while (*s1 && *s2 && !(*s1 - *s2))
s1++, s2++;
if (!*s2)
return(cp);
cp++;
}
return(NULL);
}
十一、strtok 函数的使⽤
char * strtok ( char * str, const char * sep);
sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。
strtok函数找到str中的下⼀个标记,并将其⽤ \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。)
strtok函数的第⼀个参数不为 NULL ,函数将找到str中第⼀个标记,strtok函数将保存它在字符串中的位置。
strtok函数的第⼀个参数为 NULL ,函数将在同⼀个字符串中被保存的位置开始,查找下⼀个标记。
如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "192.168.6.111";
char* sep = ".";
char* str = NULL;
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
十二、strerror 函数的使⽤
char* strerror ( int errnum );
strerror 函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码,⼀般是放在 errno.h 这个头⽂件中说明的,C语⾔程序启动的时候就会使⽤⼀个全局的变量 errno 来记录程序的当前错误码,只不过程序启动的时候errno是 0,表⽰没有错误,当我们在使⽤标准库中的函数的时候发⽣了某种错误,就会将对应的错误码,存放在 errno 中,⽽⼀个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。
#include <errno.h>
#include <string.h>
#include <stdio.h>
//我们打印⼀下0~10这些错误码对应的信息
int main()
{
int i = 0;
for (i = 0; i <= 10; i++) {
printf("%s\n", strerror(i));
}
return 0;
}
在Windows11+VS2022环境下输出的结果如下:
No error
Operation not permitted
No such file or directory
No such process
Interrupted function call
Input/output error
No such device or address
Arg list too long
Exec format error
Bad file descriptor
No child processes
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
FILE* pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
printf("Error opening file unexist.ent: %s\n", strerror(errno));
return 0;
}
Error opening file unexist.ent: No such file or directory
也可以了解⼀下 perror 函数,perror函数相当于⼀次将上述代码中的第9⾏完成了,直接将错误信息打印出来。perror函数打印完参数部分的字符串后,再打印⼀个冒号和⼀个空格,再打印错误信息。
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
FILE* pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
perror("Error opening file unexist.ent");
return 0;
}
Error opening file unexist.ent: No such file or directory
十三、总结
字符分类函数:用于判断字符的类型,如isalpha用于判断字符是否为字母,isdigit用于判断字符是否为数字,islower用于判断字符是否为小写字母,isupper用于判断字符是否为大写字母,isspace用于判断字符是否为空白字符等。这些函数返回非零值表示字符满足条件,返回零表示字符不满足条件。
字符转换函数:用于将字符转换为其他类型,如tolower将大写字母转换为小写字母,toupper将小写字母转换为大写字母。这些函数返回转换后的字符。
strlen的使用和模拟实现:strlen函数用于计算字符串的长度,即字符串中字符的个数(不包括字符串结束符'\0')。模拟实现时可以使用循环遍历字符串,计算字符的个数直到遇到字符串结束符。
strcpy的使用和模拟实现:strcpy函数用于将一个字符串复制到另一个字符串,包括字符串结束符'\0'。使用时需要提供目标字符串和源字符串,目标字符串需要有足够的空间存储源字符串。模拟实现时可以使用循环遍历源字符串,逐个字符复制到目标字符串。
strcat的使用和模拟实现:strcat函数用于将一个字符串连接到另一个字符串的末尾,包括字符串结束符'\0'。使用时需要提供目标字符串和源字符串,目标字符串需要有足够的空间存储源字符串。模拟实现时可以使用循环遍历源字符串,逐个字符追加到目标字符串的末尾。
strcmp的使用和模拟实现:strcmp函数用于比较两个字符串的大小关系,返回值为0表示两个字符串相等,大于0表示第一个字符串大于第二个字符串,小于0表示第一个字符串小于第二个字符串。模拟实现时可以使用循环遍历两个字符串,逐个字符比较它们的大小关系。
strncpy函数的使用:strncpy函数用于将一个字符串的一部分复制到另一个字符串,包括指定的字符个数,不包括字符串结束符'\0'。使用时需要提供目标字符串、源字符串和指定字符的个数。如果源字符串的长度小于指定字符的个数,目标字符串将以字符串结束符'\0'填充剩余的空间。
strncat函数的使用:strncat函数用于将一个字符串的一部分连接到另一个字符串的末尾,包括指定的字符个数,不包括字符串结束符'\0'。使用时需要提供目标字符串、源字符串和指定字符的个数。如果源字符串的长度小于指定字符的个数,目标字符串将以字符串结束符'\0'填充剩余的空间。
strncmp函数的使用:strncmp函数用于比较两个字符串的大小关系,包括指定的字符个数,返回值的意义与strcmp函数相同。使用时需要提供两个字符串和指定字符的个数。
strstr的使用和模拟实现:strstr函数用于在一个字符串中查找另一个字符串的第一次出现的位置,返回值为指向第一次出现位置的指针,如果未找到则返回NULL。模拟实现时可以使用循环遍历原字符串,逐个字符与目标字符串进行比较,直到找到匹配的子字符串。
strtok函数的使用:strtok函数用于将一个字符串分割成多个子字符串,根据指定的分隔符进行分割。使用时需要提供原字符串和分隔符,返回值为指向第一个分割子字符串的指针。可以通过多次调用strtok函数来获取所有的分割子字符串。
strerror函数的使用:strerror函数用于将错误码转换为相应的错误信息字符串。使用时需要提供错误码,返回值为错误信息字符串。
综上所述,字符操作函数和字符串操作函数在C语言中非常常用,对于处理字符和字符串的操作具有重要的作用,同时也有一些模拟实现的方法用于更好地理解它们的底层实现原理。