MongoDB在Linux上的存储优化策略 - 问答

选择高性能文件系统
- 推荐XFS：适合高并发、大容量场景，元数据处理效率更高，官方推荐用于生产环境。
- ext4适用场景：中小型部署，配置简单但高负载下性能受限。
- 格式化参数：
  - XFS：-n size=64k（优化元数据块大小），-d agcount=16（增加并行写入组）。
  - ext4：-b 4096（与MongoDB默认页大小对齐）。
挂载选项优化
- 共用参数：noatime,nodiratime（减少元数据写入），barrier=0（提升SSD写入性能，需确保硬件支持）。
- XFS特有：allocsize=512m（减少碎片），logbufs=8（增大日志缓冲区）。
内核参数调优
- I/O调度器：SSD使用deadline调度器（减少延迟），机械盘可考虑noop。
- 内存管理：
  - vm.dirty_ratio=10，vm.dirty_background_ratio=5（控制脏页写入比例）。
  - vm.swappiness=5（降低swap使用，优先利用内存）。
- 禁用THP：echo never > /sys/kernel/mm/transparent_hugepage/enabled（避免内存分配延迟）。

缓存与内存管理
- WiredTiger缓存：设置storage.wiredTiger.engineConfig.cacheSizeGB为系统内存的50%-75%，避免过度占用内存。
- 日志配置：启用storage.journal.enabled（确保数据一致性），合理设置journal.commitIntervalMs（默认100ms，高负载可降低）。
分片与副本集策略
- 分片集群：按数据访问模式选择分片键（如范围分片、哈希分片），分散读写压力。
- 副本集：配置奇数个节点（如3节点），实现高可用和读写分离，主节点处理写操作，从节点分担读负载。
数据模型优化
- 避免大文档（建议≤16MB），拆分大字段为子文档或关联集合。
- 使用嵌入式文档存储关联数据，减少查询时的JOIN操作。

索引设计
- 覆盖索引：创建包含查询所需字段的索引，避免回表查询（如db.collection.createIndex({field1: 1, field2: 1})）。
- 复合索引：为多条件查询设计索引，字段顺序遵循“最左前缀”原则（如{status: 1, create_time: -1}）。
- 定期维护：使用db.collection.reIndex()重建碎片化索引，监控索引命中率（通过db.collection.stats()）。
查询语句优化
- 使用projection指定返回字段，避免SELECT *。
- 用limit()限制结果集大小，分页查询优先使用skip()+limit()或cursor。
- 避免全表扫描，通过explain()分析查询计划，确保索引被命中。

存储硬件选择
- 优先使用SSD，显著提升IOPS和降低延迟，尤其适合高并发场景。
- 配置RAID 10（高可用+高性能），避免单点故障，条带大小建议64KB。
系统资源监控
- 使用iostat、vmstat监控磁盘I/O和内存使用，及时发现瓶颈。
- 通过mongostat、mongotop分析数据库负载，定位慢查询或资源占用异常。

压缩与归档
- 启用WiredTiger压缩（storage.wiredTiger.engineConfig.compression: snappy），减少磁盘占用。
- 定期归档历史数据到冷存储，释放主库空间。
批量操作与异步处理
- 使用bulkWrite()批量插入/更新，减少网络往返和事务开销。
- 非实时操作（如日志记录）可异步写入，避免阻塞主业务。

参考来源：

0 赞

0 踩