Skip to content

Myanmar consonant and vowel audio files that I recorded at University of Computer Studies Banmaw

License

Notifications You must be signed in to change notification settings

alexsnowschool/Spectrograms-of-Myanmar-Speech

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Spectrograms of Myanmar (Burmese) Speech

Spectrograms of Myanmar consonant and vowel audios that I recorded at University of Computer Studies Banmaw (UC Banmaw), Banmaw, Kachin State, Myanmar, November 2018. For the 22 consonants and 12 vowels, I prepared audio files by recording 45 female and 37 male speakers, including native speakers as well as other national ethnic races such as Kachin, Shan, and Rakhine, using a MacBook Air built-in microphone. The spectrograms of the audio files were extracted using the Sound eXchange (SoX, Swiss Army knife of sound processing programs) command line utility. I used these spectrograms for the Transfer Learning experiments.

Please note recording was done inside a hall and containing some noises such as mouse click sound.

မြန်မာလို အကျဉ်းချုံးရှင်းပြရရင်

ဒီ repository မှာ တင်ပေးထားတဲ့ ဖိုင်တွေက၊ မြန်မာ ဗျည်းနဲ့သရ အသံတွေကို spectrogram ဂရဖ်အဖြစ်ပြောင်းပြီးတော့ Transfer Learning approach နဲ့ speech classification experiment တွေအတွက် သုံးခဲ့တဲ့ ဖိုင်တွေပါ။ Recording ကို လုပ်ခဲ့တာက ကွန်ပျူတာတက္ကသိုလ် ဗန်းမော်မှာပါ။ အဲဒါကြောင့် ရှမ်း၊ ကချင်၊ ဗမာ၊ ရခိုင်၊ ပလောင်၊ လားဟူ၊ ဂေါ်ရခါး စသည်ဖြင့် လူမျိုးလည်း စုံပါတယ်။ 2018 ခုနှစ် နိုဝင်ဘာလမှာ Deep Learning Summer School ရဲ့ နောက်ဆက်တွဲအဖြစ် တရက်ပိုယူပြီးတော့ Transfer Learning Workshop မှာ အခုတင်ပေးထားတဲ့ အထဲက spectrogram ဖိုင်တချို့ကို အသုံးပြူပြီးတော့ transfer learning experiment ဒီမိုလုပ်ပြခဲ့ပါတယ်။

မဥဥခင် (Faculty of Advanced Science and Technology, Kumamoto University, Japan) ရဲ့ မဟာဘွဲ့သုတေသနရဲ့ တစိတ်တပိုင်းအဖြစ် အခုတင်ပေးထားတဲ့ spectrogram ဖိုင်အားလုံးကို အသုံးပြုခဲ့ပါတယ်။ စာတမ်းကိုလည်း တင်ပေးပါမယ်။ အသံဖိုင်တွေက ခန်းမကျယ်ကြီးထဲမှာ သွင်းထားတာက တကြောင်း၊ MacBook Air ရဲ့ built in mic ကို သုံးထားတာမို့ noise တစ်ချို့လည်း ပါပါတယ်။ သို့သော် ဖိုင်အရေအတွက်ကလည်း experiment တစ်ခုလုပ်ဖို့ အတွက်တော့ မနည်းပါဘူး။ မြန်မာ ဗျည်းနဲ့သရ အသံတွေရဲ့ spectrogram တွေကို စိတ်ပါဝင်စားသူတွေအတွက် လေ့လာနိုင်ဖို့ အတိုင်းအတာတစ်ခုအထိ အထောက်အကူဖြစ်ပါလိမ့်မယ်။

Files and Folders

consonant/ (spectrograms of 22 classes of Myanmar consonant sounds, 4,395 jpg files)
vowel/ (spectrograms of 12 classes of Myanmar vowel sounds, 1,345 jpg files)
ot-data/ (spectrograms of Myanmar consonant and vowel sounds for open-test)
ot-data/consonant/ (440 jpg files)
ot-data/vowel/ (120 jpg files)

wave/ (main folder of original 16Khz mono wave files)
wave/consonant/ (4,395 wave files)
wave/vowel/ (1,345 wave files)
wave/ot-data/consonant/ (440 wav files)
wave/ot-data/vowel/ (120 wav files)

Classes of Myanmar Consonant

Class ID Consonant
1 က
2
3 ဂ၊ ဃ
4
5
6
7 ဇ၊ ဈ
8 ည၊ ဉ
9 တ၊ ဋ
10 ဌ၊ ဎ
11 ဍ၊ ဎ၊ ဒ၊ ဓ
12 ဏ၊ န
13
14
15 ဗ၊ ဘ
16
17 ယ၊ ရ
18 လ၊ ဠ
19
20
21
22

Classes of Myanmar Vowel

Class ID Vowel
1 အာ
2 အိ
3 အီ
4 အု
5 အူ
6 အေ
7 အဲ
8 အော့
9 အော်
10 အံ
11 အား
12 အက်

Example Spectrograms of Myanmar Consonants

Class 1 (က)

Class-1

Class 2 (ခ)

Class-2

Class 3 (ဂ၊ ဃ)

Class-3

Class 4 (င)

Class-4

Example Spectrograms of Myanmar Vowels

Class 1 (အာ)

Class-1

Class 2 (အိ)

Class-2

Class 3 (အီ)

Class-3

Class 4 (အု)

Class-4

Class 5 (အူ)

Class-5

Class 6 (အေ)

Class-6

Class 7 (အဲ)

Class-7

Class 8 (အော့)

Class-8

Class 9 (အော်)

Class-9

Class 10 (အံ)

Class-10

Class 11 (အား)

Class-11

Class 12 (အက်)

Class-12

Acknowledgement

Following students and teachers of University of Computer Studies Banmaw contributed for Myanmar consonant and vowel sound recording !

မသဇင်ကို၊ မဖော်မြန်းသင့်နူး၊ မယဉ်မာမြင့်၊ မထက်ထက်အောင်၊ မချောစု၊
မတင်မိုးရွှေ၊ မလှစန္ဒာအောင်၊ မပန်းအိဖြူ၊ မသရဖီထွန်း၊ မစုမြတ်ငြိမ်း၊
မယဉ်ယဉ်အေး၊ မယမင်းမို့မို့မော်၊ မနွေဦးစံ၊ မခိုင်လင်းဝေ၊ မဂျာဆိုင်းရိန်၊
မသဉ္စာနိုင်၊ မဝင်းဝင်းရွှေ၊ မနန်းဟွမ်လျန်း၊ မခင်ငြိမ်းချမ်း၊ မဖြိုးဝေသင်း၊
မနန်းငြိမ်းသန္တာအောင်၊ မသန်းသန်းစိုး၊ မောင်ဉာဏ်ထွန်း၊ မောင်ကျော်သန့်ဇင်၊ မောင်ဇော်ရွှေရဲထွန်း၊
မောင်နိုင်လင်းသန့်၊ မောင်ညီမင်းထက်၊ မောင်ပြည့်စုံထွန်း၊ မောင်နိုင်လင်း၊ မောင်အောင်ဇော်ထိုက်၊
မောင်တင်ဇော်လင်း၊ မောင်ချစ်ဌေး၊ မောင်သန့်ဇင်ထွန်း၊ မောင်မျိုးဆန်းဦး၊ မောင်ကြားနိမ်၊
မောင်ဇင်ဝင်းနိုင်၊ မောင်ရွှေမင်းလွင်၊ မောင်ဂွမ်ဂူလတ်၊ မောင်မိုင်းညီအောင်လှတင်၊ မောင်ကျော်ထိုက်၊
မောင်ဆွတ်ရိန်အောင်၊ မောင်မျိုးမင်းအောင်၊ မောင်မျိုးဆန်အောင်၊ မောင်ဝေလင်းထွန်း၊ မောင်သက်ဝေဦး၊
မောင်သန့်ဇင်ဦး၊ မောင်သက်ကြည်ထွန်း၊ မောင်ကျော်ရဲအောင်၊ မောင်ထက်ရန်ကျော်၊ မောင်ဇွဲဇော်ထက်၊
မောင်ငြိမ်းချမ်း၊ မမြင့်ဌေး၊ မခင်မြတ်နိုး၊ နန်းဆိုင်ခမ်း၊ ခရေဖြူ၊
နန်းထက်ထက်စိုးဝေ၊ မောင်နေသစ်ထူး၊ မောင်ကောင်းထက်ကျော်၊ မောင်မိုးပြည့်ငြိမ်း၊ မောင်ဏီအောင်လင်း၊
မကျော့ကျော့ခိုင်၊ မမိုမိုကို၊ မသန္တာသန်း၊ မခင်ဝါဝါအောင်၊ မရွှေရည်ဖြိုး၊
မဆုစန္ဒာစိုး၊ မောင်အာကာမင်း၊ မောင်မိုးတင်၊ မောင်တင်ထွန်း၊ မနန်းငြိမ်းပြည့်စုံ၊
မနှင်းယုမော်၊ မသဲယုနန္ဒာစိုး၊ မစနိုးဝှိုက်၊ မစန္ဒာမြင့်၊ မသန်းသန်းစိုး၊
ဒေါ်မေဝါနိုင်၊ ဒေါ်နုဝါ၊ ဦးချစ်မျိုးနိုင်၊ ဒေါ်မိုးသီတာ၊ ဒေါ်သူဇာနွယ်၊
ဒေါ်ခင်နှင်းဖြူ။

(Names are ordered by my recording notebook)

I also would like to say "Thank you" to Sayarma Dr. May Phyo Oo for her kind invitation to visit University of Computer Studies (Banmaw).

Citing

If you use spectrograms or wave files of Myanmar consonants and vowels for research, please cite this paper as follows:

Ou Ou Khin, Ye Kyaw Thu, Tadashi Sakata, Yoshinori Sagisaka, Yuichi Ueda, "Myanmar Speech Classification Using Transfer Learning for Image Classification", In Proceedings of the 17th International Conference on Computer Applications (ICCA 2019), February 27 - March 1, 2019, Yangon, Myanmar, pp.132-140 [Paper]

About

Myanmar consonant and vowel audio files that I recorded at University of Computer Studies Banmaw

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published