torchaudio.functional¶
执行常见音频操作的函数。
工具¶
将频谱图从功率/幅度刻度转换为分贝刻度。 |
|
将张量从分贝刻度转换为功率/幅度刻度。 |
|
创建频率分箱转换矩阵。 |
|
创建一个线性三角滤波器组。 |
|
创建一个形状为 ( |
|
沿 |
|
沿 |
|
基于 μ 律压扩对信号进行编码。 |
|
解码 μ 律编码信号。 |
|
将编解码器作为一种增强形式进行应用。 |
|
使用带限插值以新频率对波形进行重采样。 |
|
根据 ITU-R BS.1770-4 建议测量音频响度。 |
|
使用直接方法沿输入的最后一个维度进行卷积。 |
|
使用 FFT 沿输入的最后一个维度进行卷积。 |
|
根据信噪比对波形进行缩放并添加噪声。 |
|
对波形沿其最后一个维度进行预加重,即对于 |
|
降低波形在其最后一个维度上的强调。 |
|
调整波形速度。 |
过滤¶
设计二阶全通滤波器。 |
|
设计二极点带通滤波器。 |
|
设计二极点带通滤波器。 |
|
设计二极点带阻滤波器。 |
|
设计一个低音音调控制效果。 |
|
对输入张量执行双二阶滤波器处理。 |
|
应用对比效果。 |
|
对音频应用直流偏移。 |
|
应用 ISO 908 CD 去加重(搁架)IIR 滤波器。 |
|
应用抖动 |
|
设计双二阶峰值均衡器滤波器并执行滤波。 |
|
对波形应用前向和后向 IIR 滤波器。 |
|
对音频应用镶边效果。 |
|
对整个波形应用放大或衰减。 |
|
设计二阶高通滤波器并执行滤波操作。 |
|
通过评估差分方程执行 IIR 滤波。 |
|
设计二阶低通滤波器并执行滤波操作。 |
|
对音频应用过载效果。 |
|
对音频应用相位效果。 |
|
应用 RIAA 黑胶唱片播放均衡。 |
|
设计一个三段式音调控制效果。 |
特征提取¶
语音活动检测器。 |
|
从原始音频信号创建频谱图或一批频谱图。 |
|
根据提供的复数频谱图,生成逆频谱图或一批逆频谱图。 |
|
使用 Griffin-Lim 变换从线性尺度幅度谱图计算波形。 |
|
给定一个 STFT 张量,在不改变音高的情况下将时间加速 |
|
将波形的音高移动 |
|
计算张量(通常是频谱图)的差分系数: |
|
检测音高频率。 |
|
对每个语音片段应用滑动窗口倒谱均值(以及可选的方差)归一化。 |
|
根据A pitch extraction algorithm tuned for automatic speech recognition中描述的方法提取音高 [Ghahremani et al., 2014]。 |
|
沿时间轴计算每个通道的频谱质心。 |
Multi-channel¶
计算跨通道功率谱密度 (PSD) 矩阵。 |
|
通过 MVDR 方法([Capon, 1969])计算最小方差无失真响应的波束形成权重,该方法由 Souden et, al. 提出([Souden et al., 2009])。 |
|
根据相对传递函数 (RTF) 和噪声功率谱密度 (PSD) 矩阵,计算最小方差无失真响应 (MVDR [Capon, 1969]) 波束成形权重。 |
|
通过特征值分解估计相对传递函数(RTF)或导向矢量。 |
|
通过功率法估计相对传递函数 (RTF) 或导向矢量。 |
|
将波束成形权重应用于多通道噪声频谱,以获得单通道增强频谱。 |
损失¶
计算来自 基于循环神经网络的序列转导 的 RNN Transducer 损失 [Graves, 2012]。 |
指标¶
计算两个序列之间的词级编辑(Levenshtein)距离。 |