tr命令如何使用

发布时间：2022-02-19 09:39:20 作者：iii
来源：亿速云阅读：184

# tr命令如何使用

## 1. 概述

`tr`（translate）是Unix/Linux系统中一个强大的字符转换和删除工具。它主要用于从标准输入读取数据，经过字符替换、压缩或删除后输出到标准输出。作为文本处理的基础工具之一，`tr`以其简洁高效的特性被广泛应用于shell脚本和日常命令行操作中。

### 1.1 tr命令的特点

- **单行处理**：逐字符处理输入流
- **轻量高效**：不直接修改源文件
- **功能专注**：专注于字符级转换
- **正则支持**：支持简单的字符类表达式

### 1.2 典型应用场景

- 大小写转换
- 字符集替换
- 删除特定字符
- 压缩重复字符
- 简单的加密/解密

## 2. 基本语法

```bash
tr [选项]... SET1 [SET2]

2.1 参数说明

参数	说明
SET1	指定要转换或删除的字符集合
SET2	指定转换目标字符集合（当进行删除操作时可省略）

2.2 常用选项

选项	全称	作用
-d	–delete	删除SET1中的字符
-s	–squeeze-repeats	压缩SET1中连续重复的字符
-c	–complement	对SET1取补集
-t	–truncate-set1	将SET1截断为与SET2等长

3. 基础用法

3.1 字符替换

# 将小写字母转换为大写
echo "hello world" | tr 'a-z' 'A-Z'
# 输出: HELLO WORLD

# 字符一对一映射
echo "abcde" | tr 'abc' '123'
# 输出: 123de

注意：当SET1比SET2长时，SET2最后一个字符会被重复使用

3.2 字符删除

# 删除所有数字
echo "My phone is 123-4567" | tr -d '0-9'
# 输出: My phone is -

# 删除所有标点
echo "Hello, World!" | tr -d '[:punct:]'
# 输出: Hello World

3.3 字符压缩

# 压缩连续空格
echo "Too    many    spaces" | tr -s ' '
# 输出: Too many spaces

# 压缩连续换行符
tr -s '\n' < multiline.txt

4. 高级用法

4.1 使用字符类

tr支持预定义的字符类：

字符类	等价表示	说明
[:alnum:]	-	字母和数字
[:alpha:]	-	字母
[:digit:]	0-9	数字
[:lower:]	a-z	小写字母
[:upper:]	A-Z	大写字母
[:space:]	-	空白字符
[:punct:]	-	标点符号

示例：

# 将所有标点替换为空格
echo "Hello, World!" | tr '[:punct:]' ' '

4.2 转义字符处理

tr支持的特殊转义序列：

转义符	含义
\n	换行
\t	制表符
\	反斜杠
\ooo	八进制值字符

示例：

# 将制表符转换为空格
tr '\t' ' ' < tabbed_file.txt

4.3 补集操作

# 删除所有非数字字符
echo "Phone: 123-4567" | tr -cd '[:digit:]'
# 输出: 1234567

4.4 范围表示法

# 旋转字母13个位置(ROT13加密)
echo "secret" | tr 'A-Za-z' 'N-ZA-Mn-za-m'
# 输出: frperg

# 十六进制字符处理
echo "ABCD" | tr 'A-F' '0-5'
# 输出: 0123

5. 实用案例

5.1 文本格式化

# 将DOS格式换行(CRLF)转换为Unix格式(LF)
tr -d '\r' < dos_file.txt > unix_file.txt

# 将文件中的多个空行压缩为单个空行
tr -s '\n' < input.txt > output.txt

5.2 数据清洗

# 清理日志文件中的非ASCII字符
tr -cd '\11\12\15\40-\176' < dirty.log > clean.log

# 提取CSV文件中的特定列
cut -d',' -f1 data.csv | tr -d '"'

5.3 密码生成

# 生成8位随机密码
cat /dev/urandom | tr -dc 'A-Za-z0-9' | head -c 8

5.4 文件差异比较

# 比较两个文件(忽略大小写和空格差异)
tr 'A-Z' 'a-z' < file1 | tr -s ' ' > normalized1
tr 'A-Z' 'a-z' < file2 | tr -s ' ' > normalized2
diff normalized1 normalized2

6. 注意事项

6.1 性能考虑

对于大文件处理，tr通常比sed或awk更快
复杂的替换模式应考虑使用其他工具

6.2 常见陷阱

字符顺序问题：

# 错误示例：会先转换A为B，然后转换B为A
echo "ABC" | tr 'AB' 'BA'
# 输出: BAC

多字节字符：tr不直接支持UTF-8多字节字符处理

集合长度不匹配：

# SET2会被填充最后一个字符
echo "abcdef" | tr 'abcd' '12'
# 输出: 1222ef

6.3 替代方案

当需要更复杂的功能时，可考虑： - sed：支持正则表达式和更复杂的替换 - awk：适合字段处理和条件转换 - iconv：专业的字符编码转换工具

7. 与其他命令组合

7.1 管道组合

# 统计文本中不同单词的出现频率(忽略大小写)
cat text.txt | tr 'A-Z' 'a-z' | tr -s ' ' '\n' | sort | uniq -c | sort -nr

7.2 与xargs配合

# 查找并删除所有临时文件
find . -name "*.tmp" | tr '\n' '\0' | xargs -0 rm

7.3 与sort/uniq组合

# 提取文本中所有唯一单词
tr -cs '[:alpha:]' '\n' < document.txt | sort | uniq

8. 跨平台差异

8.1 GNU tr扩展

GNU版本的tr提供了一些扩展功能： - 支持\b(退格)、\f(换页)等更多转义字符 - 更严格的错误检查

8.2 BSD/macOS差异

BSD实现（包括macOS）： - 对字符类的实现略有不同 - 部分转义序列行为不一致

9. 性能优化技巧

减少管道使用：合并多个tr操 “`bash

不推荐

cat file | tr ‘A-Z’ ‘a-z’ | tr -d ‘\n’

# 推荐 tr ‘A-Z’ ‘a-z’ < file | tr -d ‘\n’


2. **使用字符类代替显式枚举**
   ```bash
   # 较差
   tr '0123456789' 'xxxxxxxxxx'
   
   # 较好
   tr '0-9' 'x'

避免不必要的字符处理

# 处理前先过滤
grep 'pattern' file | tr 'a-z' 'A-Z'

10. 总结

tr命令作为Unix文本处理工具链中的重要一环，虽然功能相对简单，但在字符级转换和删除操作上具有无可比拟的效率优势。掌握tr命令可以：

显著提高日常文本处理效率
简化许多常见的文本转换任务
在shell脚本中实现轻量级文本处理

记住tr的核心特点： - 专精于字符集转换 - 不直接修改源文件 - 通常作为管道的一部分使用

通过本文介绍的基础和高级用法，读者应能够将tr命令灵活应用于各种文本处理场景中。

附录：常用命令速查表

功能	命令示例
大小写转换	`tr 'a-z' 'A-Z'`
删除数字	`tr -d '0-9'`
压缩空格	`tr -s ' '`
加密(ROT13)	`tr 'A-Za-z' 'N-ZA-Mn-za-m'`
删除非打印字符	`tr -cd '\11\12\15\40-\176'`
DOS转Unix换行	`tr -d '\r'`
制表符转空格	`tr '\t' ' '`
生成随机字符串	`tr -dc 'A-Za-z0-9' < /dev/urandom \\| head -c 16`

”`

这篇文章总计约2850字，全面介绍了tr命令的用法，包含基础语法、常用选项、实用案例、注意事项等内容，采用Markdown格式编写，结构清晰，便于阅读和参考。