利用python怎么对系统声音进行录制

发布时间:2020-12-21 15:23:34 作者:Leah
来源:亿速云 阅读:396

本篇文章给大家分享的是有关利用python怎么对系统声音进行录制,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

环境准备

python

wave 可以通过pip直接install,在安装pyaudio时,通过正常的pip install 直接安装一直处于报错阶段,后来想到可以通过轮子直接安装。

在pypi提供的安装包中有对应的安装包,注意,不仅仅是python2和python3的区别,python3的小版本也有点差别。可杯具的是,小主电脑里装的是python3.8,后来想到还有一个网站可以安装pythonlibs,找到对应的版本后,下载下来。直接在文件所在目录,或者在安装中指定文件目录中执行安装

pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl

代码和运行

def audio_record(out_file, rec_time):
  CHUNK = 1024
  FORMAT = pyaudio.paInt16 # 16bit编码格式
  CHANNELS = 1 # 单声道
  RATE = 16000 # 16000采样频率
  p = pyaudio.PyAudio()
  # 创建音频流
  dev_idx = findInternalRecordingDevice(p)
  stream = p.open(format=FORMAT, # 音频流wav格式
          channels=CHANNELS, # 单声道
          rate=RATE, # 采样率16000
          input=True,
          input_device_index=dev_idx, # 指定内录设备的id,可以不写,使用win的默认录音设备
          frames_per_buffer=CHUNK)
  print("Start Recording...")
  frames = [] # 录制的音频流
  # 录制音频数据
  for i in range(0, int(RATE / CHUNK * rec_time)): # 控制录音时间
    data = stream.read(CHUNK)
    frames.append(data)
  # 录制完成
  stream.stop_stream()
  stream.close()
  p.terminate()
  print("Recording Done...")
  # 保存音频文件
  wf = wave.open(out_file, 'wb')
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  wf.writeframes(b''.join(frames))
  wf.close()

在使用默认录音设备时,发现是话筒录音,效果并不是太理想,所以就去查查能不能直接录系统的声音。

def findInternalRecordingDevice(p):
  # 要找查的设备名称中的关键字
  target = '立体声混音'
  # 逐一查找声音设备
  for i in range(p.get_device_count()):
    devInfo = p.get_device_info_by_index(i)
    print(devInfo)
    if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
      # print('已找到内录设备,序号是 ',i)
      return i
  print('无法找到内录设备!')
  return -1

可以使用p.get_device_info_by_index()去查看系统有关声音的设备,通过设置为立体声混音就可以录制系统声音。

保存声音

def save(fileName):
  # 创建pyAudio对象
  p = pyaudio.PyAudio()
  # 打开用于保存数据的文件
  wf = wave.open(fileName, 'wb')
  # 设置音频参数
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  # 写入数据
  wf.writeframes(b''.join(_frames))
  # 关闭文件
  wf.close()
  # 结束pyaudio
  p.terminate()

保存声音是通过上述代码进行保存,此处的_frames是个list,是通过每录一个chunk(数据流块),就把这一块的数据添加进去

然后只需要重新创建PyAudio对象,把这个list转为字节串保存到文件中就可以了

问题

上述一般可以录到系统声音,但在执行的时候发现,并不能。

原因是:win的输入设备中没有配置立体声混音

设置步骤:

就此,就完成了录制系统声音的需求

注意

上述操作,可以外放,可以插入3.5mm耳机,但系统静音和tpye-c耳机插入的时候不能录到声音

完整代码

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime

# 需要系统打开立体声混音

# 录音类
class Recorder():
  def __init__(self, chunk=1024, channels=2, rate=44100):
    self.CHUNK = chunk
    self.FORMAT = pyaudio.paInt16
    self.CHANNELS = channels
    self.RATE = rate
    self._running = True
    self._frames = []

  # 获取内录设备序号,在windows操作系统上测试通过,hostAPI = 0 表明是MME设备
  def findInternalRecordingDevice(self, p):
    # 要找查的设备名称中的关键字
    target = '立体声混音'
    # 逐一查找声音设备
    for i in range(p.get_device_count()):
      devInfo = p.get_device_info_by_index(i)
      # print(devInfo)
      if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
        # print('已找到内录设备,序号是 ',i)
        return i
    print('无法找到内录设备!')
    return -1

  # 开始录音,开启一个新线程进行录音操作
  def start(self):
    threading._start_new_thread(self.__record, ())

  # 执行录音的线程函数
  def __record(self):
    self._running = True
    self._frames = []

    p = pyaudio.PyAudio()
    # 查找内录设备
    dev_idx = self.findInternalRecordingDevice(p)
    if dev_idx < 0:
      return
    # 在打开输入流时指定输入设备
    stream = p.open(input_device_index=dev_idx,
            format=self.FORMAT,
            channels=self.CHANNELS,
            rate=self.RATE,
            input=True,
            frames_per_buffer=self.CHUNK)
    # 循环读取输入流
    while (self._running):
      data = stream.read(self.CHUNK)
      self._frames.append(data)

    # 停止读取输入流
    stream.stop_stream()
    # 关闭输入流
    stream.close()
    # 结束pyaudio
    p.terminate()
    return

  # 停止录音
  def stop(self):
    self._running = False

  # 保存到文件
  def save(self, fileName):
    # 创建pyAudio对象
    p = pyaudio.PyAudio()
    # 打开用于保存数据的文件
    wf = wave.open(fileName, 'wb')
    # 设置音频参数
    wf.setnchannels(self.CHANNELS)
    wf.setsampwidth(p.get_sample_size(self.FORMAT))
    wf.setframerate(self.RATE)
    # 写入数据
    wf.writeframes(b''.join(self._frames))
    # 关闭文件
    wf.close()
    # 结束pyaudio
    p.terminate()


if __name__ == "__main__":

  # 检测当前目录下是否有record子目录
  if not os.path.exists('record'):
    os.makedirs('record')

  print("\npython 录音机 ....\n")
  print("提示:按 r 键并回车 开始录音\n")

  i = input('请输入操作码:')
  if i == 'r':
    rec = Recorder()
    begin = time.time()

    print("\n开始录音,按 s 键并回车 停止录音,自动保存到 record 子目录\n")
    rec.start()

    running = True
    while running:
      i = input("请输入操作码:")
      if i == 's':
        running = False
        print("录音已停止")
        rec.stop()
        t = time.time() - begin
        print('录音时间为%ds' % t)
        # 以当前时间为关键字保存wav文件
        rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

以上就是利用python怎么对系统声音进行录制,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。

推荐阅读:
  1. 利用python怎么对图像进行全景拼接
  2. 利用Python怎么对敏感词进行过滤

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python

上一篇:怎么对JetBrains IntelliJ IDEA进行优化

下一篇:怎么将Springboot项目打包成一个Docker镜像

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》