Spectrograms of Myanmar consonant and vowel audios that I recorded at University of Computer Studies Banmaw (UC Banmaw), Banmaw, Kachin State, Myanmar, November 2018. For the 22 consonants and 12 vowels, I prepared audio files by recording 45 female and 37 male speakers, including native speakers as well as other national ethnic races such as Kachin, Shan, and Rakhine, using a MacBook Air built-in microphone. The spectrograms of the audio files were extracted using the Sound eXchange (SoX, Swiss Army knife of sound processing programs) command line utility. I used these spectrograms for the Transfer Learning experiments.
Please note recording was done inside a hall and containing some noises such as mouse click sound.
ဒီ repository မှာ တင်ပေးထားတဲ့ ဖိုင်တွေက၊ မြန်မာ ဗျည်းနဲ့သရ အသံတွေကို spectrogram ဂရဖ်အဖြစ်ပြောင်းပြီးတော့ Transfer Learning approach နဲ့ speech classification experiment တွေအတွက် သုံးခဲ့တဲ့ ဖိုင်တွေပါ။ Recording ကို လုပ်ခဲ့တာက ကွန်ပျူတာတက္ကသိုလ် ဗန်းမော်မှာပါ။ အဲဒါကြောင့် ရှမ်း၊ ကချင်၊ ဗမာ၊ ရခိုင်၊ ပလောင်၊ လားဟူ၊ ဂေါ်ရခါး စသည်ဖြင့် လူမျိုးလည်း စုံပါတယ်။ 2018 ခုနှစ် နိုဝင်ဘာလမှာ Deep Learning Summer School ရဲ့ နောက်ဆက်တွဲအဖြစ် တရက်ပိုယူပြီးတော့ Transfer Learning Workshop မှာ အခုတင်ပေးထားတဲ့ အထဲက spectrogram ဖိုင်တချို့ကို အသုံးပြူပြီးတော့ transfer learning experiment ဒီမိုလုပ်ပြခဲ့ပါတယ်။
မဥဥခင် (Faculty of Advanced Science and Technology, Kumamoto University, Japan) ရဲ့ မဟာဘွဲ့သုတေသနရဲ့ တစိတ်တပိုင်းအဖြစ် အခုတင်ပေးထားတဲ့ spectrogram ဖိုင်အားလုံးကို အသုံးပြုခဲ့ပါတယ်။ စာတမ်းကိုလည်း တင်ပေးပါမယ်။ အသံဖိုင်တွေက ခန်းမကျယ်ကြီးထဲမှာ သွင်းထားတာက တကြောင်း၊ MacBook Air ရဲ့ built in mic ကို သုံးထားတာမို့ noise တစ်ချို့လည်း ပါပါတယ်။ သို့သော် ဖိုင်အရေအတွက်ကလည်း experiment တစ်ခုလုပ်ဖို့ အတွက်တော့ မနည်းပါဘူး။ မြန်မာ ဗျည်းနဲ့သရ အသံတွေရဲ့ spectrogram တွေကို စိတ်ပါဝင်စားသူတွေအတွက် လေ့လာနိုင်ဖို့ အတိုင်းအတာတစ်ခုအထိ အထောက်အကူဖြစ်ပါလိမ့်မယ်။
consonant/ (spectrograms of 22 classes of Myanmar consonant sounds, 4,395 jpg files)
vowel/ (spectrograms of 12 classes of Myanmar vowel sounds, 1,345 jpg files)
ot-data/ (spectrograms of Myanmar consonant and vowel sounds for open-test)
ot-data/consonant/ (440 jpg files)
ot-data/vowel/ (120 jpg files)
wave/ (main folder of original 16Khz mono wave files)
wave/consonant/ (4,395 wave files)
wave/vowel/ (1,345 wave files)
wave/ot-data/consonant/ (440 wav files)
wave/ot-data/vowel/ (120 wav files)
Class ID | Consonant |
---|---|
1 | က |
2 | ခ |
3 | ဂ၊ ဃ |
4 | င |
5 | စ |
6 | ဆ |
7 | ဇ၊ ဈ |
8 | ည၊ ဉ |
9 | တ၊ ဋ |
10 | ဌ၊ ဎ |
11 | ဍ၊ ဎ၊ ဒ၊ ဓ |
12 | ဏ၊ န |
13 | ပ |
14 | ဖ |
15 | ဗ၊ ဘ |
16 | မ |
17 | ယ၊ ရ |
18 | လ၊ ဠ |
19 | ဝ |
20 | သ |
21 | ဟ |
22 | အ |
Class ID | Vowel |
---|---|
1 | အာ |
2 | အိ |
3 | အီ |
4 | အု |
5 | အူ |
6 | အေ |
7 | အဲ |
8 | အော့ |
9 | အော် |
10 | အံ |
11 | အား |
12 | အက် |
Class 1 (က)
Class 2 (ခ)
Class 3 (ဂ၊ ဃ)
Class 4 (င)
Class 1 (အာ)
Class 2 (အိ)
Class 3 (အီ)
Class 4 (အု)
Class 5 (အူ)
Class 6 (အေ)
Class 7 (အဲ)
Class 8 (အော့)
Class 9 (အော်)
Class 10 (အံ)
Class 11 (အား)
Class 12 (အက်)
Following students and teachers of University of Computer Studies Banmaw contributed for Myanmar consonant and vowel sound recording !
မသဇင်ကို၊ မဖော်မြန်းသင့်နူး၊ မယဉ်မာမြင့်၊ မထက်ထက်အောင်၊ မချောစု၊
မတင်မိုးရွှေ၊ မလှစန္ဒာအောင်၊ မပန်းအိဖြူ၊ မသရဖီထွန်း၊ မစုမြတ်ငြိမ်း၊
မယဉ်ယဉ်အေး၊ မယမင်းမို့မို့မော်၊ မနွေဦးစံ၊ မခိုင်လင်းဝေ၊ မဂျာဆိုင်းရိန်၊
မသဉ္စာနိုင်၊ မဝင်းဝင်းရွှေ၊ မနန်းဟွမ်လျန်း၊ မခင်ငြိမ်းချမ်း၊ မဖြိုးဝေသင်း၊
မနန်းငြိမ်းသန္တာအောင်၊ မသန်းသန်းစိုး၊ မောင်ဉာဏ်ထွန်း၊ မောင်ကျော်သန့်ဇင်၊ မောင်ဇော်ရွှေရဲထွန်း၊
မောင်နိုင်လင်းသန့်၊ မောင်ညီမင်းထက်၊ မောင်ပြည့်စုံထွန်း၊ မောင်နိုင်လင်း၊ မောင်အောင်ဇော်ထိုက်၊
မောင်တင်ဇော်လင်း၊ မောင်ချစ်ဌေး၊ မောင်သန့်ဇင်ထွန်း၊ မောင်မျိုးဆန်းဦး၊ မောင်ကြားနိမ်၊
မောင်ဇင်ဝင်းနိုင်၊ မောင်ရွှေမင်းလွင်၊ မောင်ဂွမ်ဂူလတ်၊ မောင်မိုင်းညီအောင်လှတင်၊ မောင်ကျော်ထိုက်၊
မောင်ဆွတ်ရိန်အောင်၊ မောင်မျိုးမင်းအောင်၊ မောင်မျိုးဆန်အောင်၊ မောင်ဝေလင်းထွန်း၊ မောင်သက်ဝေဦး၊
မောင်သန့်ဇင်ဦး၊ မောင်သက်ကြည်ထွန်း၊ မောင်ကျော်ရဲအောင်၊ မောင်ထက်ရန်ကျော်၊ မောင်ဇွဲဇော်ထက်၊
မောင်ငြိမ်းချမ်း၊ မမြင့်ဌေး၊ မခင်မြတ်နိုး၊ နန်းဆိုင်ခမ်း၊ ခရေဖြူ၊
နန်းထက်ထက်စိုးဝေ၊ မောင်နေသစ်ထူး၊ မောင်ကောင်းထက်ကျော်၊ မောင်မိုးပြည့်ငြိမ်း၊ မောင်ဏီအောင်လင်း၊
မကျော့ကျော့ခိုင်၊ မမိုမိုကို၊ မသန္တာသန်း၊ မခင်ဝါဝါအောင်၊ မရွှေရည်ဖြိုး၊
မဆုစန္ဒာစိုး၊ မောင်အာကာမင်း၊ မောင်မိုးတင်၊ မောင်တင်ထွန်း၊ မနန်းငြိမ်းပြည့်စုံ၊
မနှင်းယုမော်၊ မသဲယုနန္ဒာစိုး၊ မစနိုးဝှိုက်၊ မစန္ဒာမြင့်၊ မသန်းသန်းစိုး၊
ဒေါ်မေဝါနိုင်၊ ဒေါ်နုဝါ၊ ဦးချစ်မျိုးနိုင်၊ ဒေါ်မိုးသီတာ၊ ဒေါ်သူဇာနွယ်၊
ဒေါ်ခင်နှင်းဖြူ။
(Names are ordered by my recording notebook)
I also would like to say "Thank you" to Sayarma Dr. May Phyo Oo for her kind invitation to visit University of Computer Studies (Banmaw).
If you use spectrograms or wave files of Myanmar consonants and vowels for research, please cite this paper as follows:
Ou Ou Khin, Ye Kyaw Thu, Tadashi Sakata, Yoshinori Sagisaka, Yuichi Ueda, "Myanmar Speech Classification Using Transfer Learning for Image Classification", In Proceedings of the 17th International Conference on Computer Applications (ICCA 2019), February 27 - March 1, 2019, Yangon, Myanmar, pp.132-140 [Paper]