AI Glossary: Processamento De Áudio Terms & Definitions

Transformer de Espectrograma de Áudio

AST

Um Transformador de Espectrograma de Áudio é um modelo de aprendizado profundo que processa espectrogramas de áudio para tarefas como reconhecimento de fala e análise de música.

Redução de ruído

DN

Denoising é o processo de remover ruído de dados, aprimorando a clareza e qualidade em várias aplicações como imagens e áudio.

Diarização

Diarization is the process of segmenting audio recordings into distinct speakers' segments.

Transformada Discreta do Cosseno

DCT

A Transformada Discreta do Cosseno (DCT) é uma técnica matemática usada para converter sinais em componentes de frequência.

Transformada de Fourier Discreta

DFT

A Transformada Discreta de Fourier (DFT) converte uma sequência de valores em componentes de diferentes frequências.

Transformada Rápida de Fourier

FFT

A Transformada Rápida de Fourier (FFT) é um algoritmo eficiente para calcular a Transformada de Fourier de um sinal.

Transformada de Fourier

TF

A Transformada de Fourier converte sinais entre os domínios do tempo e da frequência, revelando componentes de frequência nos dados.

Coeficientes Cepstrais de Frequência Mel

MFCC

Coeficientes Cepstrais de Frequência Mel (MFCCs) são recursos usados em processamento de áudio e reconhecimento de fala.

Processamento de Áudio com Micarray

O Processamento de Áudio com Micarray envolve o uso de múltiplos microfones para melhorar a captura e processamento de áudio.

Frequência de Modo

Frequência de modo refere-se à frequência que ocorre com maior frequência em um conjunto de dados ou sinal.

Codificação Mu Law

μ-law

A Codificação Mu Law é um método de compressão de dados de áudio, comumente usado em sistemas de telecomunicações.

Filtragem de Ruído

Filtragem de ruído é uma técnica usada para remover ruído indesejado de dados ou sinais para melhorar a clareza e precisão.

Redução de Ruído

Redução de ruído é o processo de minimizar sinais de som indesejados no processamento de áudio e sistemas de comunicação.

Fonte de Ruído

Uma fonte de ruído é uma entidade que gera som indesejado, impactando a qualidade do áudio em várias aplicações.

Supressão de Ruído

A supressão de ruído é uma técnica usada para reduzir interferências de som indesejadas em sinais de áudio.

Ruído de saída

Ruído de saída refere-se a perturbações indesejadas no sinal de saída de um sistema, afetando a qualidade e precisão dos dados.

Método de Sobreposição e Adição

O Método de Sobreposição e Adição é uma técnica para convolução eficiente de sinais, particularmente útil para sequências longas.

Método de Sobreposição e Salvamento

O Método de Sobreposição e Salvamento é uma técnica para processamento eficiente de grandes conjuntos de dados em processamento de sinais e aplicações de IA.

Diarização de Falantes

SD

A diarização de falantes é o processo de identificar e separar diferentes falantes em uma gravação de áudio.

WaveNet

WN

WaveNet é um modelo generativo profundo para produzir formas de onda de áudio bruto, originalmente desenvolvido pela DeepMind.

Arquitetura WaveNet

WN

A arquitetura WaveNet é um modelo de aprendizado profundo para gerar áudio e fala com alta qualidade e naturalidade.