admin管理员组

文章数量:1661508

文本文件的编码方式及内容类型是应用层测试中文本测试关注的重点,常见的文本编码方式为UTF -8、GBK2312、GBK、BIG5、GB18030等等,常见的文本内容类型为TXT、HTML、XML、Torrent、WML、XHTML等。

下面详细介绍下文件编码格式的转变及部分文本内容的格式。

1、TXT文件:大家都非常熟悉,重点讲解下编码格式的转换。

第一步:先熟悉一个linux命令;

在linux系统下,使用iconv命令进行编码格式的转换,具体的命令使用方式如下:

[root@localhost xhtml]# iconv --help

用法: iconv [选项...] [文件...]

转换给定文件的编码。

输入/输出格式规范:

  -f, --from-code=名称     原始文本编码

  -t, --to-code=名称         输出编码

信息:

  -l, --list                 列举所有已知的字符集

输出控制:

  -c                         从输出中忽略无效的字符

  -o, --output=FILE          输出文件

  -s, --silent               关闭警告

      --verbose              打印进度信息

  -?, --help                 给出该系统求助列表

      --usage                给出简要的用法信息

  -V, --version              打印程序版本号

长选项的强制或可选参数对对应的短选项也是强制或可选的。

本文标签: 文本格式转换类型内容