About

Employment

09.2019 - present
DJI
Audio Engineer

09.2019 - present
Kuaishou Technology
Audio Research Engineer (Tech Lead)

01.2018 - 08.2019
Tibet WiseBridge Asset Management Corporation
Director of Investment (Partner)

06.2016 - 12.2017
Yinkman (Beijing) Technology Co., Ltd
Principal_Researcher (Partner)

03.2013 - 05.2016
Dolby Laboratories
Senior Researcher

Education

08.2009 - 12.2013
University of Wollongong, Australia Doctor of Philosophy – Dissertation Topic: “Soundfield Navigation: Separation, Compression and Transmission” – Advisor: Prof. Christian Ritz and Prof. Jiangtao Xi

09.2005 - 06.2009
Beijing University of Posts and Telecommunications, China Bachelor of Engineering (Joint Program) Queen Mary University of London, United Kingdom Bachelor of Engineering (Joint Program)

Honors and Awards

2024 RNK 1 ICASSP 2024 Deep Audio PLC Challenge
2024 RNK 1 ICASSP 2024 Speech Signal Improvement Challenge
2023 RNK 2 ICASSP 2023 Acoustic Echo Cancellation Challenge
2022 RNK 1 Interspeech 2022 Deep Audio PLC Challenge
2022 RNK 2 Interspeech 2022 Conferencing Speech Challenge
2022 RNK 2 ICASSP 2022 Acoustic Echo Cancellation Challenge
2022 RNK 4 ICASSP 2022 Deep Noise Suppression Challenge Task 2
2021 RNK 1 Interspeech 2021 Conferencing Speech Challenge task 1
2021 RNK 1 Interspeech 2021 Conferencing Speech Challenge task 2
2021 RNK 1 IEEE MLSP 2021 L3DAS21 Challenge task 1
2021 RNK 6 Interspeech 2021 Deep Noise Suppression Challenge task 1
2021 RNK 3 Interspeech 2021 Acoustic Echo Cancellation Challenge
2015 Elsevier Computers and Electrical Engineering Outstanding Reviewer Award
2013 Chinese Government Scholarship for Outstanding Self-financed Students Studying Abroad
2010-2012 International Postgraduate Tuition Award
2010-2012 Australian Research Council - Spatial Audio Signal Processing Scholarship

2024 第一名, ICASSP 2024 微软语音音质增强挑战赛 2023 第二名, ICASSP 2023 微软回声消除挑战赛 2022 第一名, INTERSPEECH 2022 微软深度丢包补偿挑战赛 2022 第二名, INTERSPEECH 2022 腾讯语音音质预测挑战赛 2022 第二名, IEEE ICASSP 2022 微软回声消除挑战赛 2022 第四名, IEEE ICASSP 2022 微软深度降噪挑战赛任务 2 2021 第一名, INTERSPEECH 2021 腾讯多通道降噪挑战赛任务 1 2021 第一名, INTERSPEECH 2021 腾讯多通道降噪挑战赛任务 2 2021 第一名, IEEE MLSP 2021 L3DAS21 多通道降噪挑战赛任务 1 2021 第三名, INTERSPEECH 2021 微软回声消除挑战赛 2021

Publications

Journal

12. J. Zhao, X.Zheng, C. Ritz and D. Jiang “Interpolating the Directional Room Impulse Response for Dynamic Spatial Audio Reproduction”, Applied Sciences, vol. 12, no. 4, Art. no. 4, Jan. 2022. (IF = 2.679, SCI Q2)
11. M. Jia, J. Sun, and X. Zheng ”Multiple Speech Source Separation Using Inter-Channel Correlation and Relaxed Sparsity”, Applied Sciences, pp. 8, no. 1: 123., 2018. (IF = 2.736, SCI Q2)
10. M. Jia, J. Zhang, C. Bao, and X. Zheng. ”A Psychoacoustic-Based Multiple Audio Object Coding Approach via Intra-Object Sparsity”, Applied Sciences, pp. 7, no.12: 1301., 2017. (IF = 2.736, SCI Q2)
9. X. Zheng, C Ritz, and J. Xi, ”Encoding and communicating navigable speech soundfields”, Multimedia Tools and Applications, pp. 1-22, 2015. (IF = 2.757, SCI Q2, CCF: C)
8. M. Jia, Z.Yang, C. Bao, X. Zheng and C. Ritz, ”Encoding Multiple Audio Objects using Intra-object Sparsity”, IEEE Transactions on Audio, Speech and Language Processing, vol. 23, no. 6, pp.1082-1095, Jun. 2015. (IF = 3.919, SCI Q1, CCF: B)
7. B. Cheng, C. Ritz, I. Burnett, and X. Zheng ”A General Compression Approach to Multi-Channel Three-Dimensional Audio”, IEEE Transactions on Audio, Speech and Language Processing, August, 2013. (IF = 3.919, SCI Q1, CCF: B)
6. X. Zheng, C. Ritz, and J. Xi, ”Collaborative Blind Source Separation Using Location Informed Spatial Microphones”, IEEE Signal Processing Letters, Jan, 2013. (IF = 3.109, SCI Q2, CCF: C)
5. X. Zheng, C. Ritz, and J. Xi, ”Encoding Navigable Speech Sources: A Psychoacoustic-based Analysis-By-Synthesis Approach”, IEEE Transactions on Audio, Speech and Language Processing, Jan, 2013. (IF = 3.919, SCI Q1, CCF: B)
4. C. H. Ritz, M. Shujau, X. Zheng, B. Cheng, and E. C. and I. S. Burnett, “Backward Compatible Spatialized Teleconferencing based on Squeezed Recordings”, in Advances in Sound Localization, Intech, Apr. 2011. (Book Chapter)
3. J. Huang, L. Wang, M. Jiang and X. Zheng, “Interferon Inducible Protein 27 Computational Network Construction and Comparison between the Frontal Cortex of HIV Encephalitis (HIVE) and HIVE-Control Patients”, The Open Genomics Journal, vol. 3, no. 1, pp. 1–8, Sep. 2010.
2. L. Wang, J. Huang, M. Jiang, and X. Zheng, “AFP computational secreted network construction and analysis between human hepatocellular carcinoma (HCC) and no-tumor hepatitis/cirrhotic liver tissues”, Tumour Biol., vol. 31, no. 5, pp. 417–425, Oct. 2010. (IF = 3.526, SCI Q2)
1. L. Wang, Y. Sun, M. Jiang, and X. Zheng, “Integrative Decomposition Procedure and Kappa Statistics for the Distinguished Single Molecular Network Construction and Analysis”, Journal of Biomedicine and Biotechnolog, vol. 2009, pp. 1–7, 2009.

Conference

22. G. Yu, X. Zheng, N. Li, R. Han, C. Zheng, C. Zhang, C. Zhou, Q. Huang, B. Yu, “BAE-Net: A Low complexity and high fidelity Bandwidth-Adaptive neural network for speech super-resolution”, in ICASSP 2024, in press. (CCF:B)
21. C. Xu, X. Zheng, C. Zhang, C. Zhou, Q. Huang, B. Yu,”Kaq: A Non-Intrusive Stacking Framework for Mean Opinion Score Prediction with Multi-Task Learning”, in ASRU 2023, 2023. 20. H.Wang, S.Zhao, X.Zheng, and Y.Qin, “RAMP: Retrieval-Augmented MOS Prediction via Confidence-based Dynamic Weighting”, Proc. INTERSPEECH 2023, 2023. (CCF:C)
19. H. Wang, X. Zheng, Y. Qin, “Intermediate-task Learning with Pretrained Model for Synthesized Speech MOS Prediction”, in ICME 2023, 2023. (CCF:B)
18. H. Zhao, N. Li, R. Han, X. Zheng, C. Zhang, L. Guo, B. Yu, “A Low-Latency Deep Hierarchical Fusion Network for Fullband Acoustic Echo Cancellation”, in IEEE International Conference on Acoustics, Speech and Signal Processing, 2023. (CCF:B)
17. N. Li, X. Zheng, C. Zhang, L. Guo, and B. Yu, “End-to-End Multi-Loss Training for Low Delay Packet Loss Concealment”, in Interspeech 2022 , pp.585-589, 2022. (CCF:C)
16. L. Chen, X. Ren, X. Zhang, X. Zheng, C. Zhang, L. Guo, and B. Yu, “Impairment Representation Learning for Speech Quality Assessment”, in Interspeech 2022 , pp.3323-3327, 2022. (CCF:C)
15. L. Chen, X. Zheng, C. Zhang, L. Guo, and B. Yu, “MULTI-SCALE TEMPORAL-FREQUENCY ATTENTION FOR MUSIC SOURCE SEPARATION”, in ICME 2022 , in press. (CCF:B)
14. H. Zhao, N. Li, R. Han, L. Chen, X. Zheng, C. Zhang, L. Guo and B. Yu “A DEEP HIERARCHICAL FUSION NETWORK FOR FULLBAND ACOUSTIC ECHO CANCELLATION”, in 2022 IEEE International Conference on Acoustics, Speech and Signal Processing, 2022, pp 9112-9116. (CCF:B)
13. E. Guizzo et al.,“L3DAS22 CHALLENGE: LEARNING 3D AUDIO SOURCES IN A REAL OFFICE ENVIRONMENT”, in 2022 IEEE International Conference on Acoustics, Speech and Signal Processing, 2022, pp. 9186-9190. (CCF:B)
12. X. Zhang, X. Ren, L. Chen, X. Zheng, C. Zhang, L. Guo and B. Yu “A TWO-STEP BACKWARD COMPATIBLE FULLBAND SPEECH ENHANCEMENT SYSTEM”, in 2022 IEEE International Conference on Acoustics, Speech and Signal Processing, 2022, pp. 7762-7766. (CCF:B)
11. L. Chen, C. Xu, X. Zhang, X. Ren, X. Zheng, C. Zhang, L. Guo and B. Yu “MULTI-STAGE AND MULTI-LOSS TRAINING FOR FULLBAND NON-PERSONALIZED AND PERSONALIZED SPEECH ENHANCEMENT”, in 2022 IEEE International Conference on Acoustics, Speech and Signal Processing, 2022, pp. 9296-9300. (CCF:B)
10. X. Ren, X. Zhang, L. Chen, X. Zheng, C. Zhang, L. Guo, and B. Yu, ”A Causal U-net based Neural Beamforming Network for Real-Time Multi-Channel Speech Enhancement”, in INTERSPEECH 2021, 2021. (CCF:C)
9. X. Zhang, X. Ren, X. Zheng, L. Chen, C. Zhang, L. Guo, and B. Yu, ”Low-Delay Speech Enhancement Using Perceptually Motivated Target and Loss”, in INTERSPEECH 2021, 2021. (CCF:C)
8. X. Zheng, C. Zhang, ”Towards Blind Audio Quality Assessment using a Convolutional-Recurrent Neural Network”, in 2021 Thirteenth International Conference on Quality of Multimedia Experience (QoMEX), June, 2021.
7. X. Ren, L. Chen, X. Zheng, C. Xu, C. Zhang, L. Guo, and B. Yu., “A Neural Beamforming Network for B-Format 3D Speech Enhancement and Recognition”, in 2021 IEEE 31st International Workshop on Machine Learning for Signal Processing (MLSP), Oct. 2021, pp. 1–6.
6. X. Zheng, C. Ritz, ”Packet loss protection for interactive speech object rendering: a multiple description approach”, in 2nd IEEE China Summit and International Conference on Signal and Information Processing, July, 2014.
5. X. Zheng, C. Ritz, and J. Xi, ”A Psychoacoustic-Based Analysis-by-Synthesis Scheme for Jointly Encoding Multiple Audio Objects Into Independent Mixtures”, in IEEE International Conference on Acoustics, Speech and Signal Processing, May, 2013. (CCF:B)
4. X. Zheng, C. Ritz, ”Packet Loss Protection For Interactive Audio Object Rendering: A Multiple Description Approach”, in 4th International Workshop on Quality of Multimedia Experience, July, 2012.
3. X. Zheng, C. Ritz, and J. Xi, “Encoding navigable speech sources: an analysis by synthesis approach”, in IEEE International Conference on Acoustics, Speech and Signal Processing, March, 2012. (CCF:B)
2. X. Zheng and C. Ritz, “Hybrid FEC and MDC models for low-delay packet-loss recovery”, in 5th International Conference on Signal Processing and Communication Systems (ICSPCS), 2011, pp.1–6.
1. X. Zheng and C. Ritz, “Compression of navigable speech soundfield zones”, in Multimedia Signal Processing (MMSP), 2011 IEEE 13th International Workshop on, 2011, pp. 1 –6.

International Patents

7.X.Zheng and C.Zhang, “Method for processing audio and electronic device”,US11636836B2, granted on 2023.
6.L. Fielder, Z. Shuang, G. Davidson, X. Zheng and M. Vinton, “Reverberation generation for headphone virtualization”, US10750306B2, granted on 2020.
5.G. MA, X. Zheng C. Zhang and X. Sun, “User experience oriented audio signal processing”, US10356524B2, granted on 2019.
4.G. MA and X. Zheng, “Combined active noise cancellation and noise compensation in headphone”, US9911404B2, granted on 2018.
3.G. MA, X. Zheng and C. Brown, “Modeling a frequency response characteristic of an electro-acoustic transducer”, US10038961B2, granted on 2018.
2.G. MA, X. Zheng and C. Brown, “Enhancing intelligibility of speech content in an audio signal”, US10096329B2, granted on 2018.
1.G. MA and X. ZHENG, “Audio signal loudness control”, US10594283B2, granted on 2020.

Xiguang Zheng (郑羲光)