🥦C++数字化声音信号处理和数控振荡合成

关键词

C++ | 数学 | 声音 | 数字信号 | 加法 | 减法 | 共振峰 | 粒状 | 调频 | 线性算术 | 相位失真 | 扫描 | 矢量 | 虚拟模拟 | 波表 | 物理 | 建模 | GUI 控件 | 渲染 | 音频 | 声道 | 音符 | 语音对象 | 复调 | 时间 | 标签 | 调制器 | 振荡器 | 拨弦算法 | 脉冲编码调制 | 滤波器 | MIDI | 衰减 | 功率 | 包络 | 线性调频 | 数控 | 样本 | 矩阵 | 波形

🏈page指点迷津 | Brief

🎯要点

  1. C++声音数控方法及应用实例:🎯加法合成、减法合成、共振峰合成、粒状合成、调频 (FM) 合成、线性算术合成、相位失真合成、扫描合成、矢量合成、虚拟模拟合成、波表合成、物理建模。f1

  2. C++声音​数字​化实现​:🎯声音合成引擎作用:初始化、使用GUI控件、渲染音频。

    1. 🎯合成器三种基本操作模式:单声道、单声道齐奏和复调,区别音符关闭事件和音符结束信号。🖊拆分MIDI事件为MIDI音符事件和连续控制器事件。🖊设置语音对象的失谐、平移和相位偏移。🖊储存声音状态和MIDI事件。🖊复调操作:代码中声明合成器类型、目标设备、CPU 功率和其他信息的语音对象。🖊复调和声音时间标签。

    2. 🎯使用模块创建自定义C++音频模块核:🖊加载模块并调用自定义模块,🖊在代码中使用调制器,🖊访问调制器输出,🖊使用振荡器和访问音频输出:四振荡器虚拟模拟合成器、拨弦算法合成器、四振荡器波表合成器、脉冲编码调制振荡器,🖊使用滤波器对象和访问滤波器音频输入输出,🖊提供MIDI数据结构渲染音频,🖊GUI控件。

    3. 🎯调制计算:🖊调制源:低频振荡器、包络发生器、MIDI 连续控制器、力度和音符编号,🖊衰减计算:凹变换和凸变换,🖊计算MIDI 起音速度和衰减音数缩放,🖊恒定功率平移和交叉淡入淡出控制,🖊包络调制计算,🖊双极调制线性调频,🖊多个振荡器量化输出信号,🖊斜坡调制,滑音调制,🖊计算振荡器音高,🖊脉冲宽度调制,🖊振荡器与内部主振荡器的时基硬同步,🖊过滤键跟踪。

    4. 🎯包络发生器和数控放大器、🎯低频振荡器、🎯波表振荡器、🎯虚拟模拟 (VA) 振荡器、🎯脉冲编码调制样本回放振荡器。🎯合成器滤波、🎯弹拨弦模型、🎯调制矩阵、🎯波变形和序列。f2

🍇C++声音合成和音效处理

由于不同系统之间计算机扬声器发出的声音有很大差异,因此我们将首先编写一个 .wave 文件。波形文件头有很多可选部分,但我们只会关注完成工作所需的最低限度。我们的波形文件头结构如下所示:


 struct SMinimalWaveFileHeader
 {
   
     unsigned char m_szChunkID[4];
     uint32 m_nChunkSize;
     unsigned char m_szFormat[4];
 ​

     unsigned char m_szSubChunk1ID[4];
     uint32 m_nSubChunk1Size;
     uint16 m_nAudioFormat;
     uint16 m_nNumChannels;
     uint32 m_nSampleRate;
     uint32 m_nByteRate;
     uint16 m_nBlockAlign;
     uint16 m_nBitsPerSample;
 ​

     unsigned char m_szSubChunk2ID[4];
     uint32 m_nSubChunk2Size;

 };

以下是填充结构并将其写入磁盘的函数:

 bool WriteWaveFile(const char *szFileName, void *pData, int32 nDataSize, int16 nNumChannels, int32 nSampleRate, int32 nBitsPerSample)
 {
   
     FILE *File = fopen(szFileName,"w+b");
     if(!File)
     {
         return false;
     }
 ​
     SMinimalWaveFileHeader waveHeader;
 ​
     memcpy(waveHeader.m_szChunkID,"RIFF",4);
     waveHeader.m_nChunkSize = nDataSize + 36;
     memcpy(waveHeader.m_szFormat,"WAVE",4);
 ​
     memcpy(waveHeader.m_szSubChunk1ID,"fmt ",4);
     waveHeader.m_nSubChunk1Size = 16;
     waveHeader.m_nAudioFormat = 1;
     waveHeader.m_nNumChannels = nNumChannels;
     waveHeader.m_nSampleRate = nSampleRate;
     waveHeader.m_nByteRate = nSampleRate * nNumChannels * nBitsPerSample / 8;
     waveHeader.m_nBlockAlign = nNumChannels * nBitsPerSample / 8;
     waveHeader.m_nBitsPerSample = nBitsPerSample;
 ​
 
     memcpy(waveHeader.m_szSubChunk2ID,"data",4);
     waveHeader.m_nSubChunk2Size = nDataSize;
 ​

     fwrite(&waveHeader,sizeof(SMinimalWaveFileHeader),1,File);
 ​
     fwrite(pData,nDataSize,1,File);
 ​
     fclose(File);
     return true;
 }

现在,我们将生成一些音频数据并制作一个真正的波形文件!由于它们很容易生成,我们将使用锯齿波作为声音。

 int nSampleRate = 44100;
 int nNumSeconds = 4;
 int nNumChannels = 1;

采样率定义每秒有多少个音频数据样本。 音频数据流只不过是数字流,每个数字都是一个音频样本,因此采样率就是每秒有多少个数字音频数据。 使用的数字越少,声音文件的“水平分辨率”就越小,或者波形数据每秒振幅变化的次数就越少。

采样率还定义了可以存储在音频流中的最大频率。 您可以存储的最大频率是采样率的一半。 换句话说,在 44100 采样率的情况下,您可以存储的最大频率为 22,050hz。 人耳的最大可听频率约为 20,000hz,因此使用 44100 的采样率应该可以满足大多数需求(出于复杂的技术原因,您可能需要更高的采样率,但这对于现在来说已经足够了!)。

秒数是波持续的时间(以秒为单位),通道数是有多少个音频通道。由于这是单声道声音,因此只有一个音频通道。

 int nNumSamples = nSampleRate * nNumChannels * nNumSeconds;
 int32 *pData = new int32[nNumSamples];

这里我们计算有多少实际音频样本,然后分配空间来保存音频数据。 我们使用 32 位整数,但您也可以使用 16 位整数。 音频样本中的位数表示音频数据的垂直分辨率,或者有多少个唯一值。 在 16 位整数中,有 65536 个不同的值,在 32 位中,有 42 亿个不同的值。 如果您将数据视为图表上的图,每个样本的位数越多,采样率越高,您的图表就越接近真实的数据。 较少的位数和较低的采样率意味着它与您尝试建模的真实数据相距较远,这将导致音频听起来不太正确。

 int32 nValue = 0;
 for(int nIndex = 0; nIndex < nNumSamples; ++nIndex)
 {
     nValue += 8000000;
     pData[nIndex] = nValue;
 }

在这里,我们实际上正在创建我们的波浪数据。 我们利用这样一个事实:如果你有一个 int 接近可以存储的最大值,然后添加更多值,它将回绕到 int 可以存储的最小值。 如果你在图表上看它,它看起来像锯齿波,即我们正在创建锯齿波! 通常你不会以这种方式创建它们,因为我们这样做的方式对耳朵来说很刺耳,并且引入了一种称为混叠的东西。

您可以更改添加到 nValue 的数量来更改所得波的频率。 添加较小的数字使其频率较低,添加较大的数字使其频率较高。

 WriteWaveFile("outmono.wav",pData,nNumSamples * sizeof(pData[0]),
     nNumChannels,nSampleRate,sizeof(pData[0])*8);
 delete[] pData;

后,我们编写波形文件并释放内存。

写入立体声文件

立体声文件中唯一真正发生变化的是有 2 个通道而不是 1 个,并且我们生成音频数据的方式略有不同。 由于有 2 个通道,一个用于左通道,一个用于右通道,因此对于相同采样率和时间长度的波形文件,实际上存在双倍的音频数据,因为每个通道都需要一整套数据。

Last updated