Search Results - RepositoryStats

119

706

mit

23

NISQA - Non-Intrusive Speech Quality and TTS Naturalness Assessment

tts icassp pytorch interspeech deep-learning speech-quality text-to-speech speech-synthesis voice-conversion quality-of-experience

Created 2019-02-14

61 commits to master branch, last one 21 days ago

Text2Video sibozhang

92

430

unknown

12

ICASSP 2022: "Text2Video: text-driven talking-head video synthesis with phonetic dictionary".

gan tts aigc video avatar icassp talking vid2vid metaverse talking-head deep-learning generative-ai talking-heads text-to-video virtual-humans speech-synthesis digital-humanities talking-face-generation

Created 2021-04-05

50 commits to main branch, last one about a year ago

ICASSP-2023-24-Papers DmitryRyumin

17

418

mit

29

ICASSP 2023-2024 Papers: A complete collection of influential and exciting research papers from the ICASSP 2023-24 conferences. Explore the latest advancements in acoustics, speech and signal processi...

Created 2023-08-01

975 commits to main branch, last one a day ago

TabFormer IBM

85

329

apache-2.0

11

Code & Data for "Tabular Transformers for Modeling Multivariate Time Series" (ICASSP, 2021)

gpt bert icassp pytorch icassp2021 huggingface transformer prsa-dataset tabular-data fraud-detection machine-learning credit-card-dataset artificial-intelligence credit-card-transaction

Created 2020-10-20

21 commits to main branch, last one 2 years ago

awesome-sound_event_detection soham97

9

166

mit

8

Reading list for research topics in Sound AI

icassp interspeech audio-retrieval audio-captioning audio-generation audio-processing zero-shot-learning sound-event-detection representation-learning acoustic-scene-classification

Created 2020-11-28

62 commits to main branch, last one 4 months ago

TIM-Net_SER Jiaxin-Ye

25

165

gpl-3.0

10

[ICASSP 2023] Official Tensorflow implementation of "Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition".

casia emodb emovo savee icassp iemocap ravdess bi-directional emotion-recognition speech-emotion-recognition

Created 2022-11-29

52 commits to main branch, last one 7 months ago

EmotionalConversionStarGAN glam-imperial

27

129

unknown

7

This repository contains code to replicate results from the ICASSP 2020 paper "StarGAN for Emotional Speech Conversion: Validated by Data Augmentation of End-to-End Emotion Recognition".

icassp stargan stargan-vc icassp-2020 deep-learning imperial-glam speech-synthesis data-augmentation augsburg-university emotion-recognition deep-neural-networks imperial-college-london generative-adversarial-network

Created 2020-02-09

38 commits to master branch, last one 3 years ago

NewEraAI-Papers DmitryRyumin

2

99

mit

9

The repository provides links to collections of influential and interesting research papers from top AI conferences, with open-source code to promote reproducibility and provide detailed implementatio...

cvpr iccv emnlp ismir icassp interspeech deep-learning computer-vision neural-networks image-processing mashine-learning video-processing signal-processing text-classification artificial-intelligence natural-language-processing

Created 2023-08-01

72 commits to main branch, last one 7 months ago

HiPAMA doheejin

1

29

bsd-3-clause

1

This repository is the implementation of the HiPAMA architecture, introduced in the paper, Hierarchical Pronunciation Assessment with Multi-Aspect Attention (ICASSP 2023).

apa nlp capt icassp assessment icassp2023 pronunciation language-learning speech-processing pronunciation-scoring automatic-pronunciation-assessment

Created 2023-09-23

10 commits to main branch, last one 7 months ago

latex_templates monetjoe

1

26

mit

1

LaTeX templates for papers, please select your conference or journal by switching branches.

csmt icme ismir icassp eurasip

Created 2023-03-29

13 commits to icme branch, last one 21 hours ago