如何在Ubuntu上使用C++进行机器学习开发 - 问答

在 Ubuntu 上使用 C++ 进行机器学习开发

一环境准备与工具链

二常用 C++ 机器学习库与安装方式

传统机器学习与计算机视觉
- Dlib（SVM、线性回归、图像处理）：sudo apt install libdlib-dev -y
- MLpack（聚类、回归、降维）：sudo apt install libmlpack-dev -y
- Shark（神经网络、SVM、随机森林）：sudo apt install libshark-dev -y
- OpenCV（Haar/HOG、特征与视觉算法）：sudo apt install libopencv-dev -y
深度学习
- Flashlight（FAIR 纯 C++ 深度学习库，需 C++17）：从源码构建
  - git clone https://github.com/facebookresearch/flashlight.git
  - cd flashlight && mkdir build && cd build
  - cmake … && make -j$(nproc) && sudo make install
- TensorFlow C++ API（推理为主，模型需转换为 SavedModel）
  - 方式 A：使用系统包（CPU）：sudo apt install libtensorflow-cpu-dev
  - 方式 B：从源码构建 C++ 库（更灵活，支持 GPU）：参考官方文档或使用社区封装脚本（如 tensorflow_cc）。

三项目构建与最小示例

使用 CMake 管理依赖（以 Dlib 线性回归为例）
- 目录结构
  - my_ml_project/
    - CMakeLists.txt
    - main.cpp
- CMakeLists.txt
  - cmake_minimum_required(VERSION 3.10)
    - project(MyMLProject)
    - set(CMAKE_CXX_STANDARD 17)
    - find_package(Dlib REQUIRED)
    - add_executable(MyMLProject main.cpp)
    - target_link_libraries(MyMLProject Dlib::Dlib)
- main.cpp（线性回归 y=2x+3）
  - #include <dlib/svm.h>
    - #include <dlib/data_io.h>
    - #include
    - int main() {
      - dlib::matrix x(10,1), y(10,1);
      - for (int i = 0; i < 10; ++i) { x(i,0)=i+1; y(i,0)=2*(i+1)+3; }
      - dlib::linear_regression_trainer<dlib::matrix> trainer;
      - auto model = trainer.train(x, y);
      - std::cout << "Predicted y for x=11: " << model(x(9))(0,0) << std::endl;
      - return 0;
      - }
- 构建与运行
  - mkdir build && cd build
  - cmake … && make
  - ./MyMLProject
说明：若使用深度学习库（如 Flashlight、TensorFlow C++），在 CMake 中链接对应目标（如 flashlight::fl），并确保启用 C++17。

四推理部署与 GPU 加速

TensorFlow C++ 推理要点
- 模型导出：在 Python 中将模型保存为 SavedModel 格式（tf.saved_model.save）
- 加载与运行：使用 C++ API 的 SavedModel 加载器，Session 运行并获取输出张量
- 编译链接：除头文件与库路径外，常见链接选项为 -ltensorflow_cc -ltensorflow_framework
GPU 支持
- 安装与版本匹配：安装 CUDA 与 cuDNN，确保与库版本兼容（如 TensorFlow 2.4 需 CUDA 10.1+、cuDNN 7.6+）
- 构建配置：启用 GPU（如设置 -DCUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda），并在库配置中打开 CUDA 支持
性能分析
- CPU 侧：使用 gprof（编译加 -pg）或 Valgrind 定位瓶颈（内存与热点函数）。

五常见问题与实用建议

依赖冲突与环境隔离
- 使用 sudo apt autoremove 清理无用包；或用 conda 创建隔离环境（如 conda create -n ml_env python=3.8）以管理不同版本依赖
构建与兼容性
- 深度学习库从源码构建时，注意 Bazel 版本兼容与内存需求（建议 ≥4GB 可用内存）
- TensorFlow C++ 构建失败常见于依赖不全或 Bazel 资源不足，按报错信息补齐依赖并合理设置资源限制
实践路径
- 传统任务优先选用 Dlib/MLpack/OpenCV；研究型或自定义网络可选 Flashlight
- 生产推理优先 TensorFlow C++ SavedModel 工作流，便于与现有 C++ 系统集成与部署。

0 赞

0 踩